Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/67304

Comparte esta pagina

Title: Uma metodologia baseada em grafos para detecção de redundância estrutural em Arquiteturas Data Mesh
Authors: OLIVEIRA, Cayo Felipe Lopes de
Keywords: Data Mesh; Grafos; Redundância de dados; Algoritmo de grafos; Isomera
Issue Date: 31-Jul-2025
Publisher: Universidade Federal de Pernambuco
Citation: OLIVEIRA, Cayo Felipe Lopes de. Uma metodologia baseada em grafos para detecção de redundância estrutural em Arquiteturas Data Mesh. 2025. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.
Abstract: A adoção do paradigma Data Mesh tem impulsionado a descentralização da posse de dados nas organizações, permitindo que cada domínio de negócio gerencie seus próprios produtos de dados. Embora essa abordagem aumente a autonomia e a flexibilidade, ela também intensifica o risco de criação de tabelas estruturalmente semelhantes entre os domínios, gerando redun dâncias que comprometem a governança, a rastreabilidade e a eficiência dos recursos. Esta dis sertação apresenta uma metodologia para detecção de redundâncias estruturais em arquiteturas de dados distribuídas, fundamentada na modelagem de tabelas como grafos direcionados e na aplicação de algoritmos de isomorfismo de subgrafos. Nesse contexto, três abordagens foram consideradas: o VF2, utilizado como referência consolidada na literatura; o Node Match, um algoritmo híbrido desenvolvido neste trabalho com função de pré-filtragem; e modelos super visionados baseados em redes neurais gráficas (GNN), aplicados à predição de isomorfismos. Comoparte das contribuições, também foi desenvolvida a ferramenta Isomera, em Python, res ponsável por operacionalizar a metodologia e permitir sua experimentação prática. A proposta organiza um ciclo de experimentação em quatro etapas: geração automatizada de cenários, apli cação dos algoritmos, validação humana supervisionada, necessária para mitigar falsos positi vos e assegurar confiabilidade, e avaliação quantitativa dos resultados. A ferramenta Isomera possibilita simular arquiteturas sintéticas ou baseadas em benchmarks consolidados, como o TPC-DS, além de oferecer recursos para a execução controlada de experimentos, a compara ção entre algoritmos e a análise de métricas como tempo de execução (ET), acurácia (ACC) e frequência de sucesso (SF). Dois estudos de caso ilustraram a aplicação da metodologia: o primeiro, utilizando VF2 e Node Match, e o segundo, incorporando redes neurais (GNN), que demonstraram ganhos de acurácia em cenários de maior complexidade, ainda que com maior custo computacional. Adicionalmente, esta dissertação contribui com um artefato científico e experimental que favorece a replicação de testes, a expansão modular com novos algoritmos e a análise sistemática de trade-offs entre performance e precisão. Ao unir flexibilidade, reproduti bilidade e análise crítica, o trabalho oferece uma base sólida para pesquisadores e profissionais que buscam aprimorar a governança de dados em arquiteturas distribuídas.
URI: https://repositorio.ufpe.br/handle/123456789/67304
Aparece en las colecciones: Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Cayo Felipe Lopes de Oliveira.pdf8.38 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons