Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/65716
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | ING REN, Tsang | - |
dc.contributor.author | SANTOS, Marcel Santana | - |
dc.date.accessioned | 2025-09-03T14:55:39Z | - |
dc.date.available | 2025-09-03T14:55:39Z | - |
dc.date.issued | 2020-08-31 | - |
dc.identifier.citation | SANTOS, Marcel Santana. Single image HDR reconstruction using a CNN with masked features and perceptual loss. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/65716 | - |
dc.description.abstract | Digital cameras can only capture a limited range of real-world scenes’ luminance, pro- ducing images with saturated pixels. Existing single image high dynamic range (HDR) reconstruction methods attempt to expand the range of luminance, but are not able to hallucinate plausible textures, producing results with artifacts in the saturated areas. In this thesis, we present a novel learning-based approach to reconstruct an HDR image by recovering the saturated pixels of an input LDR image in a visually pleasing way. Pre- vious deep learning-based methods apply the same convolutional filters on well-exposed and saturated pixels, creating ambiguity during training and leading to checkerboard and halo artifacts. To overcome this problem, we propose a feature masking mechanism that reduces the contribution of the features from the saturated areas. Moreover, we adapt the VGG-based perceptual loss function to our application to be able to synthesize visually pleasing textures. Since the number of HDR images for training is limited, we propose to train our system in two stages. Specifically, we first train our system on a large number of images for image inpainting task and then fine-tune it on HDR reconstruction. Since most of the HDR examples contain smooth regions that are simple to reconstruct, we propose a sampling strategy to select challenging training patches during the HDR fine-tuning stage. We demonstrate through experimental results that our approach can reconstruct visually pleasing HDR results, better than the current state of the art on a wide range of scenes. | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Alto alcance dinâmico | pt_BR |
dc.subject | Redes Neurais Convolucionais | pt_BR |
dc.subject | Função de Perda Perceptual | pt_BR |
dc.title | Single image HDR reconstruction using a CNN with masked features and perceptual loss | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | KHADEMI KALANTARI, Nima | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/2215094319781877 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3084134533707587 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | Câmeras digitais convencionais não são capazes de capturar completamente o alcance de iluminação das cenas (expressa por uma grandeza conhecida por luminância). Conse- quentemente, as imagens produzidas por estes dispositivos geralmente apresentam regiões com saturação e, portanto, informações da cena são perdidas. Métodos tradicionais para reconstrução desse intervalo perdido pela captura não são capazes de reconstruir as tex- turas e detalhes das cenas, produzindo resultados com artefatos nas regiões saturadas. No presente trabalho, foram investigados métodos baseados em redes neurais convolucionais para reconstrução de imagens com alto alcance dinâmico (HDR) a partir de apenas uma imagem capturada com câmeras convencionais (LDR). Essas imagens HDR são capazes de expressar com fidelidade os detalhes das cenas e se aproximam do que o sistema visual hu- mano é capaz de capturar. O método proposto é capaz de reconstruir as regiões saturadas das imagens de entrada com um alto grau realismo. Para alcançarmos este resultado, diversas contribuições foram realizadas. Primeiramente, os métodos baseados em redes convolucionais em geral aplicam o mesmo conjunto de filtros convolucionais nas regiões saturadas e não saturadas das imagens. No entanto, as regiões saturadas não contém infor- mação válida, o que causa ambiguidade durante o treinamento causando diversos artefatos no resultado final. Para resolver este problema, foi proposto um mecanismo (apelidado feature masking) para reduzir a contribuição das regiões saturadas no cálculo das con- voluções. Além disso as funções de erro perceptual (comumente utilizadas em problemas de síntese de imagens) para o treinamento da rede foram revisitadas e adaptadas para o problema de reconstrução de imagens HDR. Como resultado, o método proposto é capaz de produzir texturas realísticas e com um alto grau de fidelidade a cena original. Além disso, como as bases de dados de treinamento para o presente problema ainda são limi- tadas, foi proposto realizar o treinamento do método em duas etapas. Especificamente, o método é inicialmente treinado em um número grande de imagens em uma tarefa auxiliar (image inpainting, neste caso) e então refinado para a tarefa de reconstrução de ima- gens HDR. Por fim, como a maioria das imagens de treinamento contém regiões simples de serem reconstruídas, foi proposto uma estratégia para selecionar regiões difíceis para serem utilizadas durante a etapa de refinamento da rede neural. Essa estratégia simples é capaz de aumentar a robustez e reduzir o tempo de treinamento do método. Diversos experimentos foram conduzidos em uma grande variedade de cenários para demonstrar visualmente e numericamente que o método proposto é capaz de produzir imagens HDR com alto grau de realismo e melhor que os métodos estado-da-arte. Um artigo decorrente do presente trabalho foi aceito na conferência ACM SIGGRAPH 2020. | pt_BR |
Aparece en las colecciones: | Dissertações de Mestrado - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Marcel Santana Santos.pdf | 4,36 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons