Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/32306

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorGARAY, Aldo William Medina-
dc.contributor.authorMARQUES, Alexandre Henrique Carvalho-
dc.date.accessioned2019-09-05T22:22:13Z-
dc.date.available2019-09-05T22:22:13Z-
dc.date.issued2018-07-27-
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/32306-
dc.description.abstractStatistical tools for modeling covariance structures have been shown useful in Medicine for studies in genetics. In that context, factor analysis models stand out for its ability in identifying latent factors capable of reducing data dimensionality and explaining observed variability. Usually, latent factors are interpreted as unobserved physiological mechanisms underlying the studied phenomenon. Confirmatory factor analysis models are characterized by allowing the researcher to pre-specify model’s elements, as for example, the number of latent factors, the loading matrix structure and linear restrictions on the parameters. Those models allow the validation of hypothesis in gene co-expression studies. Confirmatory factor analysis models under normality assumption for the data are well consolidated in the literature. Our aim is to develop a more general class capable of integrate several independent populations extending the data’s normality assumption to a more flexible class of distributions, the class of scale mixture of normal (SMN). The class of scale mixture of normal includes, as special cases, the normal distribution and distributions with heavy tails as the t-Student, contaminated normal ans slash. This model allows to specify parameter restrictions, which leads to important particular cases of covariance structures, making it more flexible in its specification and distributional assumptions. Model identifiability is studied, with necessary and/or sufficient conditions for parameter identification being presented. To estimate the model’s parameters we propose an ECM algorithm and the estimators’ performance in finite samples is evaluated through Monte Carlo simulation studies. We conclude the study with an illustration considering a confirmatory model for the pathological dynamic of pancreas cancer based on actual gene expression data.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEstatísticapt_BR
dc.subjectAnálise fatorialpt_BR
dc.titleMultiple factor analysis model with scale mixture of normal distributions in the latent factorspt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-coCYSNEIROS, Francisco José de Azevedo-
dc.contributor.authorLatteshttp://lattes.cnpq.br/3091837880986468pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6628260142102150pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxFerramentas estatísticas voltadas para a modelagem de estruturas de covariâncias têm se mostrado úteis em medicina para estudos genéticos. Nesse contexto, modelos de análise fatorial destacam-se por sua habilidade em identificar fatores latentes capazes de reduzir a dimensionalidade dos dados e explicar a variabilidade observada. Comumente, fatores latentes são interpretados como mecanismos fisiológicos não observáveis subjacentes ao fenômeno estudado. Modelos de análise fatorial confirmatória caracterizam-se por possibilitar ao pesquisador a pré-especificação de elementos do modelo, como por exemplo, o número de fatores latentes, a estrutura da matriz de loadings e restrições lineares nos parâmetros. Tais modelos permitem a validação de hipotéses em estudos de coexpressão gênica. Modelos de análise fatorial confirmatório sob suposição de normalidade de dados estão bem consolidados na literatura. Nosso objetivo é desenvolver uma classe mais geral capaz de integrar várias populações independentes estendendo a suposição de normalidade de dados para uma classe mais flexível de distribuições, a classe de misturas de escala da distribuição normal (SMN). A classe SMN contém, como casos especiais, a distribuição normal e distribuições com caudas pesadas tais como t-Student, normal contaminada e slash. Este modelo permite especificar restrições nos parâmetros, as quais levam a importantes casos particulares de estruturas de covariância, tornando-o mais flexível em sua especificação e em suas suposições distribucionais. A identificabilidade do modelo é estudada e condições necessárias e/ou suficientes para identificação dos parâmetros são apresentadas. Para a estimação dos parâmetros do modelo propomos um algoritmo ECM e a performance dos estimadores em amostras finitas é avaliada através de estudos de simulação de Monte Carlo. Finalizamos nosso estudo com uma ilustração considerando o modelo confirmatório para a dinâmica patológica do câncer de pâncreas utilizando dados reais de expressão gênica.pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Alexandre Henrique Carvalho Marques.pdf852,83 kBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons