Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/65844
Compartilhe esta página
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | FIDALGO, Robson do Nascimento | - |
dc.contributor.author | MOTA, Luis Felipe Araujo | - |
dc.date.accessioned | 2025-09-09T13:46:19Z | - |
dc.date.available | 2025-09-09T13:46:19Z | - |
dc.date.issued | 2025-07-31 | - |
dc.date.submitted | 2025-09-01 | - |
dc.identifier.citation | MOTA, Luis Felipe Araujo. Um estudo comparativo de ferramentas para perfilamento de dados em larga escala. 2025. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Universidade Federal de Pernambuco, Centro de Informática, Recife, 2025. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/65844 | - |
dc.description.abstract | O crescimento exponencial na geração de dados, impulsionado por sistemas digitais, sensores e plataformas em rede, tem transformado o cenário da engenharia de dados, especialmente com o advento do paradigma Big Data. Nesse contexto, a compreensão e a qualidade dos dados assumem papel estratégico para organizações que buscam decisões fundamentadas em evidências confiáveis. O data profiling, entendido como o processo sistemático de extração de metadados estatísticos e estruturais, emerge como etapa crítica para a inspeção, limpeza e integração de dados, sobretudo em ambientes caracterizados por grande volume e diversidade de formatos. No entanto, a aplicação prática do data profiling em cenários de Big Data ainda carece de estudos que combinem rigor técnico e análise funcional. Este trabalho apresenta um estudo funcional e comparativo de três ferramentas de data profiling com suporte a ambientes de dados em larga escala. A partir de critérios metodológicos de seleção e de um checklist funcional baseado em literatura especializada, as ferramentas são avaliadas quanto às suas funcionalidades e desempenho frente a conjuntos de dados públicos representativos. Os resultados obtidos permitem identificar as vantagens, limitações e melhores contextos de uso de cada solução, contribuindo para a escolha fundamentada de ferramentas de data profiling em projetos de engenharia de dados. | pt_BR |
dc.format.extent | 56p. | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | pt_BR |
dc.subject | Big data | pt_BR |
dc.subject | Perfilamento de dados | pt_BR |
dc.subject | Qualidade de dados | pt_BR |
dc.subject | Ferramentas de análise | pt_BR |
dc.subject | Engenharia de dados | pt_BR |
dc.subject | Avaliação da qualidade de dados | pt_BR |
dc.title | Um estudo comparativo de ferramentas para perfilamento de dados em larga escala | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/0404837515129825 | pt_BR |
dc.degree.level | Graduacao | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6390018491925933 | pt_BR |
dc.description.abstractx | The exponential growth in data generation, driven by digital systems, sensors and networked platforms, has reshaped the data engineering landscape, especially with the rise of the Big Data paradigm. In this scenario, data understanding and quality play a strategic role for organizations seeking decisions based on reliable evidence. Data profiling, understood as the systematic process of extracting statistical and structural metadata, emerges as a critical step for data inspection, cleansing and integration, especially in environments characterized by high volume and format diversity. However, the practical application of data profiling in Big Data scenarios still lacks studies that combine technical rigor with functional analysis. This work presents a functional and comparative study of three data profiling tools designed for large-scale data environments. Based on methodological selection criteria and a functional checklist grounded in specialized literature, the tools are evaluated regarding their capabilities and performance against representative public datasets. The results allow the identification of strengths, limitations, and best use cases for each solution, contributing to informed decision-making in data profiling tool selection for data engineering projects. | pt_BR |
dc.subject.cnpq | Áreas::Ciências Exatas e da Terra::Ciência da Computação | pt_BR |
dc.degree.departament | ::(CIN-DIS) - Departamento de Informação e Sistemas | pt_BR |
dc.degree.graduation | ::CIn-Curso de Sistemas de Informação | pt_BR |
dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
dc.degree.local | Recife | pt_BR |
Aparece nas coleções: | (TCC) - Sistemas da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC Luis Felipe Araujo Mota.pdf | 1,72 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons