Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/58038

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorAMARAL, Getúlio José Amorim do-
dc.contributor.authorFERREIRA, Adenice Vasconcelos-
dc.date.accessioned2024-10-14T15:42:32Z-
dc.date.available2024-10-14T15:42:32Z-
dc.date.issued2024-06-20-
dc.identifier.citationFERREIRA, Adenice Vasconcelos. Distâncias estocásticas para agrupamentos de formas em 2D e dados direcionais. 2024. Tese (Doutorado em Estatística) – Universidade Federal de Pernambuco, Recife, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/58038-
dc.description.abstractMétodos não supervisionados são utilizados na Estatística para distribuir dados em grupos distintos entre si, e com elementos com maior similaridade dentro dos grupos. Novas técni- cas têm sido propostas a fim de melhorar a eficácia do agrupamento em diversos cenários. Neste trabalho, propusemos três distâncias para dados direcionais baseadas na distribuição Von Mises-Fisher matricial e dois algoritmos: um para cenários de baixa concentração de da- dos de pré-formas, considerando vetores complexos, e outro para dados do tipo direcional, dentro do espaço multidimensional de Stiefel múltiplo. O algoritmo proposto para agrupar pré-formas possui nove possíveis variações, por conter duas possibilidades de critério de pa- rada e três possibilidades de distâncias baseadas na ditribuição Bingham (Battacharyya, Rényi e Hellinger), além da distância de procrustes completo que também foi utilizada em algumas variações do algoritmo para calcular a estatística de convergência.As nove adaptações propos- tas apresentaram desempenho semelhante entre si. Quando comparados com um algoritmo pré-existente na literatura, as variações do algoritmos mostraram desempenho melhor nos ce- nários em que haviam baixa concentração dos dados. Foram feitas três aplicações em base de dados reais, nas quais se destacaram os algoritmos com distância de Battacharyya, Rényi e o algoritmo já existente na literatura. No contexto de dados direcionais, a exemplo de latitude e longitude, propusemos três novas distâncias (Battacharyya, Rényi e Hellinger) baseadas na distribuição Von Mises-Fisher matricial. Além disso, propusemos um algoritmo, contendo as novas distâncias, com seis possíveis variações. Nas análises, iniciamos com a avaliação gráfica do desempenho das distâncias propostas, visando identificar mudanças em uma matriz previa- mente fixada. Em adição, verificamos o impacto do número de direções nos desempenhos dos algoritmos, bem como suas performances em três cenários com características distintas. Foram realizadas aplicações em base de dados reais com informações tridimensionais de remanências magnéticas de rochas. As seis adaptações obtiveram desempenhos semelhantes, com índices de Rand e coeficientes Kappa variando de tal modo a alcançar valores máximos, nos cenários com dois grupos.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectAgrupamentopt_BR
dc.subjectAnálise de formaspt_BR
dc.subjectDistribuição Binghampt_BR
dc.subjectDistânciaspt_BR
dc.subjectDados direcionaispt_BR
dc.subjectEspaço multidimensionalpt_BR
dc.titleDistâncias estocásticas para agrupamentos de formas em 2D e dados direcionaispt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coNASCIMENTO, Abraão David Costa do-
dc.contributor.authorLatteshttp://lattes.cnpq.br/0919077943904831pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7674916684282039pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxUnsupervised methods are used in Statistics to distribute data into distinct groups, where elements within each group exhibit greater similarity. New techniques have been proposed to enhance the effectiveness of clustering in various scenarios. In this work, we propose three distance metrics for directional data based on the matrix von Mises-Fisher distribution, and two algorithms: one for scenarios with low concentration of preform data, considering complex vectors, and another for directional data within the multidimensional Stiefel manifold. The proposed algorithm for clustering preforms offers nine possible variations, due to two stop- ping criteria and three distance metrics based on the Bingham distribution (Bhattacharyya, Rényi, and Hellinger), along with the full Procrustes distance, which was also used in some algorithm variations to calculate convergence statistics. The nine proposed adaptations demon- strated similar performance. When compared to a pre-existing algorithm in the literature, the variations of the proposed algorithm performed better in scenarios with low data concentra- tion. Three applications on real-world datasets were conducted, in which the algorithms using Bhattacharyya and Rényi distances, and the algorithm already present in the literature, stood out. In the context of directional data, such as latitude and longitude, we proposed three new distance metrics (Bhattacharyya, Rényi, and Hellinger) based on the matrix von Mises- Fisher distribution. Additionally, we proposed an algorithm, incorporating the new distance metrics, with six possible variations. In the analyses, we began with a graphical evaluation of the proposed distances’ performance, aiming to identify changes in a previously fixed matrix. Moreover, we examined the impact of the number of directions on the algorithms’ performance, as well as their effectiveness across three scenarios with distinct characteristics. Applications on real-world datasets involving three-dimensional magnetic remanence data from rocks were conducted. The six adaptations showed similar performance, with Rand index and Kappa co- efficient values varying in such a way as to reach maximum values in scenarios with two groups.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/9853084384672692pt_BR
Aparece en las colecciones: Teses de Doutorado - Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TESE Adenice Vasconcelos Ferreira.pdf1,57 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons