Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/67304

Share on

Full metadata record
DC FieldValueLanguage
dc.contributor.advisorDANTAS, Jamilson Ramalho-
dc.contributor.authorOLIVEIRA, Cayo Felipe Lopes de-
dc.date.accessioned2025-12-19T13:46:21Z-
dc.date.available2025-12-19T13:46:21Z-
dc.date.issued2025-07-31-
dc.identifier.citationOLIVEIRA, Cayo Felipe Lopes de. Uma metodologia baseada em grafos para detecção de redundância estrutural em Arquiteturas Data Mesh. 2025. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/67304-
dc.description.abstractA adoção do paradigma Data Mesh tem impulsionado a descentralização da posse de dados nas organizações, permitindo que cada domínio de negócio gerencie seus próprios produtos de dados. Embora essa abordagem aumente a autonomia e a flexibilidade, ela também intensifica o risco de criação de tabelas estruturalmente semelhantes entre os domínios, gerando redun dâncias que comprometem a governança, a rastreabilidade e a eficiência dos recursos. Esta dis sertação apresenta uma metodologia para detecção de redundâncias estruturais em arquiteturas de dados distribuídas, fundamentada na modelagem de tabelas como grafos direcionados e na aplicação de algoritmos de isomorfismo de subgrafos. Nesse contexto, três abordagens foram consideradas: o VF2, utilizado como referência consolidada na literatura; o Node Match, um algoritmo híbrido desenvolvido neste trabalho com função de pré-filtragem; e modelos super visionados baseados em redes neurais gráficas (GNN), aplicados à predição de isomorfismos. Comoparte das contribuições, também foi desenvolvida a ferramenta Isomera, em Python, res ponsável por operacionalizar a metodologia e permitir sua experimentação prática. A proposta organiza um ciclo de experimentação em quatro etapas: geração automatizada de cenários, apli cação dos algoritmos, validação humana supervisionada, necessária para mitigar falsos positi vos e assegurar confiabilidade, e avaliação quantitativa dos resultados. A ferramenta Isomera possibilita simular arquiteturas sintéticas ou baseadas em benchmarks consolidados, como o TPC-DS, além de oferecer recursos para a execução controlada de experimentos, a compara ção entre algoritmos e a análise de métricas como tempo de execução (ET), acurácia (ACC) e frequência de sucesso (SF). Dois estudos de caso ilustraram a aplicação da metodologia: o primeiro, utilizando VF2 e Node Match, e o segundo, incorporando redes neurais (GNN), que demonstraram ganhos de acurácia em cenários de maior complexidade, ainda que com maior custo computacional. Adicionalmente, esta dissertação contribui com um artefato científico e experimental que favorece a replicação de testes, a expansão modular com novos algoritmos e a análise sistemática de trade-offs entre performance e precisão. Ao unir flexibilidade, reproduti bilidade e análise crítica, o trabalho oferece uma base sólida para pesquisadores e profissionais que buscam aprimorar a governança de dados em arquiteturas distribuídas.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectData Meshpt_BR
dc.subjectGrafospt_BR
dc.subjectRedundância de dadospt_BR
dc.subjectAlgoritmo de grafospt_BR
dc.subjectIsomerapt_BR
dc.titleUma metodologia baseada em grafos para detecção de redundância estrutural em Arquiteturas Data Meshpt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coARAUJO, Jean-
dc.contributor.authorLatteshttp://lattes.cnpq.br/2621126673391946pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5655706091153128pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxThe adoption of the Data Mesh paradigm has fostered the decentralization of data ownership within organizations, allowing each business domain to manage its own data products. While this approach increases autonomy and flexibility, it also intensifies the risk of structurally simi lar tables being created across domains, leading to redundancies that compromise governance, traceability, and resource efficiency. This dissertation presents a methodology for detecting structural redundancies in distributed data architectures, based on modeling tables as directed graphs and applying subgraph isomorphism algorithms. In this context, three approaches were considered: VF2, widely used as a reference in the literature; Node Match, a hybrid algorithm developed in this work with a pre-filtering function; and supervised models based on Graph Neural Networks (GNN), applied to isomorphism prediction. As an additional contribution, the Isomera tool was developed in Python, designed to operationalize the methodology and ena ble its practical experimentation. The proposed methodology follows a four-step experimen tal cycle: automated scenario generation, algorithm application, human-supervised validation —necessary to mitigate false positives and ensure reliability — and quantitative evaluation of results. The Isomera tool enables the simulation of synthetic architectures or those based on consolidated benchmarks such as TPC-DS, while providing features for controlled expe riment execution, algorithm comparison, and metric analysis, including execution time (ET), accuracy (ACC), and success frequency (SF). Two case studies illustrated the application of the methodology: the first using VF2 and Node Match, and the second incorporating GNNs, which demonstrated accuracy gains in more complex scenarios, albeit with higher computati onal cost. Additionally, this dissertation contributes a scientific and experimental artifact that supports test replication, modular expansion with new algorithms, and systematic analysis of trade-offs between performance and accuracy. By combining flexibility, reproducibility, and critical analysis, the work offers a solid foundation for researchers and practitioners seeking to improve data governance in distributed architectures.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/2498961747789618pt_BR
Appears in Collections:Dissertações de Mestrado - Ciência da Computação

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO Cayo Felipe Lopes de Oliveira.pdf8.38 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons