Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/65716

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorING REN, Tsang-
dc.contributor.authorSANTOS, Marcel Santana-
dc.date.accessioned2025-09-03T14:55:39Z-
dc.date.available2025-09-03T14:55:39Z-
dc.date.issued2020-08-31-
dc.identifier.citationSANTOS, Marcel Santana. Single image HDR reconstruction using a CNN with masked features and perceptual loss. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/65716-
dc.description.abstractDigital cameras can only capture a limited range of real-world scenes’ luminance, pro- ducing images with saturated pixels. Existing single image high dynamic range (HDR) reconstruction methods attempt to expand the range of luminance, but are not able to hallucinate plausible textures, producing results with artifacts in the saturated areas. In this thesis, we present a novel learning-based approach to reconstruct an HDR image by recovering the saturated pixels of an input LDR image in a visually pleasing way. Pre- vious deep learning-based methods apply the same convolutional filters on well-exposed and saturated pixels, creating ambiguity during training and leading to checkerboard and halo artifacts. To overcome this problem, we propose a feature masking mechanism that reduces the contribution of the features from the saturated areas. Moreover, we adapt the VGG-based perceptual loss function to our application to be able to synthesize visually pleasing textures. Since the number of HDR images for training is limited, we propose to train our system in two stages. Specifically, we first train our system on a large number of images for image inpainting task and then fine-tune it on HDR reconstruction. Since most of the HDR examples contain smooth regions that are simple to reconstruct, we propose a sampling strategy to select challenging training patches during the HDR fine-tuning stage. We demonstrate through experimental results that our approach can reconstruct visually pleasing HDR results, better than the current state of the art on a wide range of scenes.pt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectAlto alcance dinâmicopt_BR
dc.subjectRedes Neurais Convolucionaispt_BR
dc.subjectFunção de Perda Perceptualpt_BR
dc.titleSingle image HDR reconstruction using a CNN with masked features and perceptual losspt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coKHADEMI KALANTARI, Nima-
dc.contributor.authorLatteshttp://lattes.cnpq.br/2215094319781877pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3084134533707587pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxCâmeras digitais convencionais não são capazes de capturar completamente o alcance de iluminação das cenas (expressa por uma grandeza conhecida por luminância). Conse- quentemente, as imagens produzidas por estes dispositivos geralmente apresentam regiões com saturação e, portanto, informações da cena são perdidas. Métodos tradicionais para reconstrução desse intervalo perdido pela captura não são capazes de reconstruir as tex- turas e detalhes das cenas, produzindo resultados com artefatos nas regiões saturadas. No presente trabalho, foram investigados métodos baseados em redes neurais convolucionais para reconstrução de imagens com alto alcance dinâmico (HDR) a partir de apenas uma imagem capturada com câmeras convencionais (LDR). Essas imagens HDR são capazes de expressar com fidelidade os detalhes das cenas e se aproximam do que o sistema visual hu- mano é capaz de capturar. O método proposto é capaz de reconstruir as regiões saturadas das imagens de entrada com um alto grau realismo. Para alcançarmos este resultado, diversas contribuições foram realizadas. Primeiramente, os métodos baseados em redes convolucionais em geral aplicam o mesmo conjunto de filtros convolucionais nas regiões saturadas e não saturadas das imagens. No entanto, as regiões saturadas não contém infor- mação válida, o que causa ambiguidade durante o treinamento causando diversos artefatos no resultado final. Para resolver este problema, foi proposto um mecanismo (apelidado feature masking) para reduzir a contribuição das regiões saturadas no cálculo das con- voluções. Além disso as funções de erro perceptual (comumente utilizadas em problemas de síntese de imagens) para o treinamento da rede foram revisitadas e adaptadas para o problema de reconstrução de imagens HDR. Como resultado, o método proposto é capaz de produzir texturas realísticas e com um alto grau de fidelidade a cena original. Além disso, como as bases de dados de treinamento para o presente problema ainda são limi- tadas, foi proposto realizar o treinamento do método em duas etapas. Especificamente, o método é inicialmente treinado em um número grande de imagens em uma tarefa auxiliar (image inpainting, neste caso) e então refinado para a tarefa de reconstrução de ima- gens HDR. Por fim, como a maioria das imagens de treinamento contém regiões simples de serem reconstruídas, foi proposto uma estratégia para selecionar regiões difíceis para serem utilizadas durante a etapa de refinamento da rede neural. Essa estratégia simples é capaz de aumentar a robustez e reduzir o tempo de treinamento do método. Diversos experimentos foram conduzidos em uma grande variedade de cenários para demonstrar visualmente e numericamente que o método proposto é capaz de produzir imagens HDR com alto grau de realismo e melhor que os métodos estado-da-arte. Um artigo decorrente do presente trabalho foi aceito na conferência ACM SIGGRAPH 2020.pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Marcel Santana Santos.pdf4,36 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons