Multiple factor analysis model with scale mixture of normal distributions in the latent factors

MARQUES, Alexandre Henrique Carvalho

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/32306

Share on

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	GARAY, Aldo William Medina	-
dc.contributor.author	MARQUES, Alexandre Henrique Carvalho	-
dc.date.accessioned	2019-09-05T22:22:13Z	-
dc.date.available	2019-09-05T22:22:13Z	-
dc.date.issued	2018-07-27	-
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/32306	-
dc.description.abstract	Statistical tools for modeling covariance structures have been shown useful in Medicine for studies in genetics. In that context, factor analysis models stand out for its ability in identifying latent factors capable of reducing data dimensionality and explaining observed variability. Usually, latent factors are interpreted as unobserved physiological mechanisms underlying the studied phenomenon. Confirmatory factor analysis models are characterized by allowing the researcher to pre-specify model’s elements, as for example, the number of latent factors, the loading matrix structure and linear restrictions on the parameters. Those models allow the validation of hypothesis in gene co-expression studies. Confirmatory factor analysis models under normality assumption for the data are well consolidated in the literature. Our aim is to develop a more general class capable of integrate several independent populations extending the data’s normality assumption to a more flexible class of distributions, the class of scale mixture of normal (SMN). The class of scale mixture of normal includes, as special cases, the normal distribution and distributions with heavy tails as the t-Student, contaminated normal ans slash. This model allows to specify parameter restrictions, which leads to important particular cases of covariance structures, making it more flexible in its specification and distributional assumptions. Model identifiability is studied, with necessary and/or sufficient conditions for parameter identification being presented. To estimate the model’s parameters we propose an ECM algorithm and the estimators’ performance in finite samples is evaluated through Monte Carlo simulation studies. We conclude the study with an illustration considering a confirmatory model for the pathological dynamic of pancreas cancer based on actual gene expression data.	pt_BR
dc.description.sponsorship	CAPES	pt_BR
dc.language.iso	eng	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	openAccess	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Estatística	pt_BR
dc.subject	Análise fatorial	pt_BR
dc.title	Multiple factor analysis model with scale mixture of normal distributions in the latent factors	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.advisor-co	CYSNEIROS, Francisco José de Azevedo	-
dc.contributor.authorLattes	http://lattes.cnpq.br/3091837880986468	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	mestrado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/6628260142102150	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Estatistica	pt_BR
dc.description.abstractx	Ferramentas estatísticas voltadas para a modelagem de estruturas de covariâncias têm se mostrado úteis em medicina para estudos genéticos. Nesse contexto, modelos de análise fatorial destacam-se por sua habilidade em identificar fatores latentes capazes de reduzir a dimensionalidade dos dados e explicar a variabilidade observada. Comumente, fatores latentes são interpretados como mecanismos fisiológicos não observáveis subjacentes ao fenômeno estudado. Modelos de análise fatorial confirmatória caracterizam-se por possibilitar ao pesquisador a pré-especificação de elementos do modelo, como por exemplo, o número de fatores latentes, a estrutura da matriz de loadings e restrições lineares nos parâmetros. Tais modelos permitem a validação de hipotéses em estudos de coexpressão gênica. Modelos de análise fatorial confirmatório sob suposição de normalidade de dados estão bem consolidados na literatura. Nosso objetivo é desenvolver uma classe mais geral capaz de integrar várias populações independentes estendendo a suposição de normalidade de dados para uma classe mais flexível de distribuições, a classe de misturas de escala da distribuição normal (SMN). A classe SMN contém, como casos especiais, a distribuição normal e distribuições com caudas pesadas tais como t-Student, normal contaminada e slash. Este modelo permite especificar restrições nos parâmetros, as quais levam a importantes casos particulares de estruturas de covariância, tornando-o mais flexível em sua especificação e em suas suposições distribucionais. A identificabilidade do modelo é estudada e condições necessárias e/ou suficientes para identificação dos parâmetros são apresentadas. Para a estimação dos parâmetros do modelo propomos um algoritmo ECM e a performance dos estimadores em amostras finitas é avaliada através de estudos de simulação de Monte Carlo. Finalizamos nosso estudo com uma ilustração considerando o modelo confirmatório para a dinâmica patológica do câncer de pâncreas utilizando dados reais de expressão gênica.	pt_BR
Appears in Collections:	Dissertações de Mestrado - Estatística

Files in This Item:

File	Description	Size	Format
DISSERTAÇÃO Alexandre Henrique Carvalho Marques.pdf		852.83 kB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record Recommend this item

This item is licensed under a Creative Commons License