Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/62494

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorLINS, Rafael Dueire-
dc.contributor.authorBERNARDINO, Rodrigo Barros-
dc.date.accessioned2025-04-23T15:39:22Z-
dc.date.available2025-04-23T15:39:22Z-
dc.date.issued2024-09-09-
dc.identifier.citationBERNARDINO, Rodrigo Barros. Assessing binarization algorithms for document images. 2024. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/62494-
dc.description.abstractBinarization algorithms are essential for document processing, analysis, compression, and recognition, with their performance heavily influenced by document characteristics such as paper texture and noise. This thesis introduces novel algorithms and evaluation methodologies for assessing binarization performance, focusing on image quality, processing time, and file size. Nearly 70 binarization schemes were tested on 39 historical documents and 376 mobile- captured images. To expand the analysis, the Direct Binarization approach was proposed, analysing the RGB channels of input images separately. This generated hundreds of additional images, which were used to train an automatic binarization algorithm selection tool, the Image Matcher, based solely on paper texture and the strength of the back-to-front interference. The tool demonstrated significant improvements in binarization results across various cases. Recog- nizing the growing prevalence of smartphone-captured documents, the thesis also investigated such type of documents by proposing and extensively testing three new evaluation measures: the proportion of black pixels in the binary image, a normalized Levenshtein distance, and a combined metric incorporating both. These measures facilitated a comprehensive assessment of mobile-captured images using six widely used mobile devices under varying conditions, in- cluding strobe flash settings, illumination, and positional changes. Additionally, the compressed image size (using the TIFF Group 4 compression scheme) proved to be a valuable metric for evaluating the algorithms efficiency. It has been shown that if processing time is a priority, the Michalak21a algorithm with the red channel would be preferred for this type of image, but if compression rate is a priority, Yinyang22 is a better choice. Choosing the best algorithm for a given setup using the PL measure provided a better choice when compared to using only the OCR accuracy. The thesis also significantly expanded existing datasets for document image binarization by adding 24 new historical document images with manually generated ground truth and 296 mobile-captured images.pt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectAlgoritmos de binarizaçãopt_BR
dc.subjectDocumentos históricospt_BR
dc.subjectDocumentos escaneadospt_BR
dc.subjectDocumentos fotografadospt_BR
dc.subjectSmartphonespt_BR
dc.subjectAvaliação de desempenhopt_BR
dc.titleAssessing binarization algorithms for document imagespt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/1211615348225605pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7601016626256808pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxOs algoritmos de binarização são essenciais para o processamento, análise, compressão e recon- hecimento de documentos, sendo seu desempenho fortemente influenciado por características do documento, como textura do papel e ruído. Esta tese apresenta algoritmos e metodologias de avaliação inovadoras para analisar o desempenho de binarização, com foco na qualidade da imagem, tempo de processamento e tamanho do arquivo. Cerca de 70 esquemas de binariza- ção foram testados em 39 documentos históricos e 376 imagens capturadas por dispositivos móveis. Para expandir a análise, foi proposta a abordagem Binarização Direta, que analisa sep- aradamente os canais RGB das imagens de entrada. Isso gerou centenas de imagens adicionais, utilizadas para treinar uma ferramenta automática de seleção de algoritmos de binarização, chamada Image Matcher, baseada exclusivamente na textura do papel e na intensidade da interferência frente-verso. A ferramenta demonstrou melhorias significativas nos resultados de binarização em diversos casos. Reconhecendo a crescente prevalência de documentos captura- dos por smartphones, a tese também investigou esse tipo de documento, propondo e testando extensivamente três novas medidas de avaliação: a proporção de pixels pretos na imagem binária, uma distância de Levenshtein normalizada e uma métrica combinada que incorpora ambas. Essas medidas possibilitaram uma avaliação abrangente de imagens capturadas por dispositivos móveis, utilizando seis dispositivos amplamente usados em condições variadas, incluindo configurações de flash, iluminação e mudanças de posição. Além disso, o tamanho da imagem comprimida (usando o esquema de compressão TIFF Group 4) provou ser uma métrica valiosa para avaliar a eficiência dos algoritmos. Demonstrou-se que, se o tempo de processamento for uma prioridade, o algoritmo Michalak21a com o canal vermelho é preferível para esse tipo de imagem, enquanto, se a taxa de compressão for o foco, o algoritmo Yinyang22 apresenta melhores resultados. A escolha do melhor algoritmo para uma configuração especí- fica usando a métrica PL mostrou-se superior em comparação ao uso exclusivo da acurácia do OCR. A tese também expandiu significativamente os conjuntos de dados existentes para binarização de imagens de documentos, adicionando 24 novas imagens de documentos históri- cos com ground truth gerado manualmente e 296 novas imagens capturadas por dispositivos móveis.pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Rodrigo Barros Bernardino.pdf62,73 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons