Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/65844

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorFIDALGO, Robson do Nascimento-
dc.contributor.authorMOTA, Luis Felipe Araujo-
dc.date.accessioned2025-09-09T13:46:19Z-
dc.date.available2025-09-09T13:46:19Z-
dc.date.issued2025-07-31-
dc.date.submitted2025-09-01-
dc.identifier.citationMOTA, Luis Felipe Araujo. Um estudo comparativo de ferramentas para perfilamento de dados em larga escala. 2025. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Universidade Federal de Pernambuco, Centro de Informática, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/65844-
dc.description.abstractO crescimento exponencial na geração de dados, impulsionado por sistemas digitais, sensores e plataformas em rede, tem transformado o cenário da engenharia de dados, especialmente com o advento do paradigma Big Data. Nesse contexto, a compreensão e a qualidade dos dados assumem papel estratégico para organizações que buscam decisões fundamentadas em evidências confiáveis. O data profiling, entendido como o processo sistemático de extração de metadados estatísticos e estruturais, emerge como etapa crítica para a inspeção, limpeza e integração de dados, sobretudo em ambientes caracterizados por grande volume e diversidade de formatos. No entanto, a aplicação prática do data profiling em cenários de Big Data ainda carece de estudos que combinem rigor técnico e análise funcional. Este trabalho apresenta um estudo funcional e comparativo de três ferramentas de data profiling com suporte a ambientes de dados em larga escala. A partir de critérios metodológicos de seleção e de um checklist funcional baseado em literatura especializada, as ferramentas são avaliadas quanto às suas funcionalidades e desempenho frente a conjuntos de dados públicos representativos. Os resultados obtidos permitem identificar as vantagens, limitações e melhores contextos de uso de cada solução, contribuindo para a escolha fundamentada de ferramentas de data profiling em projetos de engenharia de dados.pt_BR
dc.format.extent56p.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectBig datapt_BR
dc.subjectPerfilamento de dadospt_BR
dc.subjectQualidade de dadospt_BR
dc.subjectFerramentas de análisept_BR
dc.subjectEngenharia de dadospt_BR
dc.subjectAvaliação da qualidade de dadospt_BR
dc.titleUm estudo comparativo de ferramentas para perfilamento de dados em larga escalapt_BR
dc.typebachelorThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/0404837515129825pt_BR
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6390018491925933pt_BR
dc.description.abstractxThe exponential growth in data generation, driven by digital systems, sensors and networked platforms, has reshaped the data engineering landscape, especially with the rise of the Big Data paradigm. In this scenario, data understanding and quality play a strategic role for organizations seeking decisions based on reliable evidence. Data profiling, understood as the systematic process of extracting statistical and structural metadata, emerges as a critical step for data inspection, cleansing and integration, especially in environments characterized by high volume and format diversity. However, the practical application of data profiling in Big Data scenarios still lacks studies that combine technical rigor with functional analysis. This work presents a functional and comparative study of three data profiling tools designed for large-scale data environments. Based on methodological selection criteria and a functional checklist grounded in specialized literature, the tools are evaluated regarding their capabilities and performance against representative public datasets. The results allow the identification of strengths, limitations, and best use cases for each solution, contributing to informed decision-making in data profiling tool selection for data engineering projects.pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terra::Ciência da Computaçãopt_BR
dc.degree.departament::(CIN-DIS) - Departamento de Informação e Sistemaspt_BR
dc.degree.graduation::CIn-Curso de Sistemas de Informaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
Aparece nas coleções:(TCC) - Sistemas da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC Luis Felipe Araujo Mota.pdf1,72 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons