Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/66909

Share on

Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSOUZA, Renata Maria Cardoso Rodrigues de-
dc.contributor.authorSOUZA, Pedro José Carneiro de-
dc.date.accessioned2025-11-19T12:07:01Z-
dc.date.available2025-11-19T12:07:01Z-
dc.date.issued2025-10-20-
dc.identifier.citationSOUZA, Pedro José Carneiro de. Métodos de agrupamento difuso aplicados a dados simbólicos poligonais. 2025. Dissertação (Mestrado Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2025.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/66909-
dc.description.abstractDiante do grande volume de dados e da elevada capacidade computacional necessária para analisá-los, a Análise de Dados Simbólicos (ADS) surge como um paradigma poderoso para auxiliar na análise de representações mais complexas, chamadas de dados simbólicos, resultantes da agregação de dados em classes. Dentre as abordagens simbólicas, os dados poligonais se destacam por sua capacidade de encapsular de forma mais rica a informação de dados agregados quando comparados com dados intervalares. Embora a literatura recente tenha introduzido um algoritmo de agrupamento dinâmico rígido (pDCA) para este tipo de dado, a inflexibilidade da alocação exclusiva de objetos a clusters limita a análise de estrutu ras de dados ambíguas ou sobrepostas. Neste contexto, o objetivo principal deste trabalho é desenvolver e formalizar algoritmos de agrupamento difuso para dados simbólicos poligonais, visando oferecer maior flexibilidade e robustez à análise de agrupamento. Partindo do algoritmo pDCAe sua métrica de similaridade, propõe-se inicialmente o Algoritmo de agrupamento di fuso poligonal (FpDCA), o qual estende o método rígido ao incorporar o conceito de graus de pertinência, permitindo que cada polígono pertença a múltiplos clusters simultaneamente, com base em metodologias consolidadas do fuzzy c-means. Adicionalmente, o trabalho avança para o desenvolvimento do Algoritmo de agrupamento difuso poligonal adaptativo (AFpDCA), no qual se introduz um mecanismo de ponderação que atribui um peso de relevância para cada variável em cada cluster, permitindo que o algoritmo aprenda automaticamente quais carac terísticas são mais importantes para a formação de cada grupo específico. A metodologia será validada por meio de experimentos com dados sintéticos gerados em diferentes cenários para avaliar a performance e a robustez dos algoritmos propostos. Para demonstrar a aplicabilidade e usabilidade da metodologia, será conduzido um estudo de caso inédito com dados reais sobre as despesas com saúde pública no Brasil, os quais, originalmente referentes aos municípios, serão agregados por unidades federativas, dando origem às variáveis poligonais. O objetivo da aplicação é utilizar o AFpDCA para identificar e caracterizar perfis distintos de gastos com saúde no país, revelando quais tipos de despesas são mais determinantes para a formação de cada perfil e, assim, gerando insights valiosos para a gestão pública e o planejamento de políticas de saúde.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsembargoedAccesspt_BR
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/pt_BR
dc.subjectAnálise de dados simbólicospt_BR
dc.subjectDados poligonaispt_BR
dc.subjectAgrupamento difusopt_BR
dc.subjectDistância adaptativapt_BR
dc.subjectDespesas com Saúde Públicapt_BR
dc.titleMétodos de agrupamento difuso aplicados a dados simbólicos poligonaispt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coPIMENTEL, Bruno Almeida-
dc.contributor.authorLatteshttp://lattes.cnpq.br/9190507857341560pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9289080285504453pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxFaced with the large volume of data and the high computational capacity required to ana lyze it, Symbolic Data Analysis (SDA) emerges as a powerful paradigm to assist in the analysis of more complex representations, called symbolic data, resulting from the aggregation of data into classes. Among symbolic approaches, polygonal data stand out for their ability to more richly encapsulate information from aggregated data when compared to interval-valued data. Although recent literature has introduced a hard dynamical clustering algorithm (pDCA) for this data type, the inflexibility of exclusively allocating objects to clusters limits the analysis of ambiguous or overlapping data structures. In this context, the main objective of this work is to develop and formalize a new family of fuzzy clustering algorithms for symbolic polygonal data, aiming to offer greater flexibility and robustness to cluster analysis. Building upon the pDCA algorithm and its Hausdorff distance metric, we initially propose the Fuzzy Polygonal Dynamic Clustering Algorithm (FpDCA), which incorporate the concept of membership degrees, al lowing each polygon to belong to multiple clusters simultaneously, based on established fuzzy c-means methodologies. Additionally, the work advances to the development of the Adaptive Fuzzy Polygonal Dynamic Clustering Algorithm (AFpDCA), in which a weighting mechanism is introduced that assigns a relevance weight to each variable in each cluster, allowing the al gorithm to automatically learn which features are most important for the formation of each specific group. Experiments with synthetic data generated in different scenarios to evaluate the performance and robustness of the proposed algorithms. To demonstrate the applicabil ity and interpretive potential of the methodology, a novel case study will be conducted with real data on public health expenditures in Brazil. The expenditure data, originally referring to municipalities, will be aggregated by federative units, giving rise to the polygonal variables. The application’s objective is to use the AFpDCA to identify and characterize distinct health spending profiles in the country, revealing which types of expenditures are most determinant for the formation of each profile, thereby generating valuable insights for public administration and health policy planningpt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/5575405279834457pt_BR
Appears in Collections:Dissertações de Mestrado - Ciência da Computação

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO Pedro Jose Carneiro de Souza.pdf
  Embargoed Item Until 2026-11-19
4.17 MBAdobe PDFView/Open    Item embargoed


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons