Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/32306
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | GARAY, Aldo William Medina | - |
dc.contributor.author | MARQUES, Alexandre Henrique Carvalho | - |
dc.date.accessioned | 2019-09-05T22:22:13Z | - |
dc.date.available | 2019-09-05T22:22:13Z | - |
dc.date.issued | 2018-07-27 | - |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/32306 | - |
dc.description.abstract | Statistical tools for modeling covariance structures have been shown useful in Medicine for studies in genetics. In that context, factor analysis models stand out for its ability in identifying latent factors capable of reducing data dimensionality and explaining observed variability. Usually, latent factors are interpreted as unobserved physiological mechanisms underlying the studied phenomenon. Confirmatory factor analysis models are characterized by allowing the researcher to pre-specify model’s elements, as for example, the number of latent factors, the loading matrix structure and linear restrictions on the parameters. Those models allow the validation of hypothesis in gene co-expression studies. Confirmatory factor analysis models under normality assumption for the data are well consolidated in the literature. Our aim is to develop a more general class capable of integrate several independent populations extending the data’s normality assumption to a more flexible class of distributions, the class of scale mixture of normal (SMN). The class of scale mixture of normal includes, as special cases, the normal distribution and distributions with heavy tails as the t-Student, contaminated normal ans slash. This model allows to specify parameter restrictions, which leads to important particular cases of covariance structures, making it more flexible in its specification and distributional assumptions. Model identifiability is studied, with necessary and/or sufficient conditions for parameter identification being presented. To estimate the model’s parameters we propose an ECM algorithm and the estimators’ performance in finite samples is evaluated through Monte Carlo simulation studies. We conclude the study with an illustration considering a confirmatory model for the pathological dynamic of pancreas cancer based on actual gene expression data. | pt_BR |
dc.description.sponsorship | CAPES | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Estatística | pt_BR |
dc.subject | Análise fatorial | pt_BR |
dc.title | Multiple factor analysis model with scale mixture of normal distributions in the latent factors | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | CYSNEIROS, Francisco José de Azevedo | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/3091837880986468 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6628260142102150 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Estatistica | pt_BR |
dc.description.abstractx | Ferramentas estatísticas voltadas para a modelagem de estruturas de covariâncias têm se mostrado úteis em medicina para estudos genéticos. Nesse contexto, modelos de análise fatorial destacam-se por sua habilidade em identificar fatores latentes capazes de reduzir a dimensionalidade dos dados e explicar a variabilidade observada. Comumente, fatores latentes são interpretados como mecanismos fisiológicos não observáveis subjacentes ao fenômeno estudado. Modelos de análise fatorial confirmatória caracterizam-se por possibilitar ao pesquisador a pré-especificação de elementos do modelo, como por exemplo, o número de fatores latentes, a estrutura da matriz de loadings e restrições lineares nos parâmetros. Tais modelos permitem a validação de hipotéses em estudos de coexpressão gênica. Modelos de análise fatorial confirmatório sob suposição de normalidade de dados estão bem consolidados na literatura. Nosso objetivo é desenvolver uma classe mais geral capaz de integrar várias populações independentes estendendo a suposição de normalidade de dados para uma classe mais flexível de distribuições, a classe de misturas de escala da distribuição normal (SMN). A classe SMN contém, como casos especiais, a distribuição normal e distribuições com caudas pesadas tais como t-Student, normal contaminada e slash. Este modelo permite especificar restrições nos parâmetros, as quais levam a importantes casos particulares de estruturas de covariância, tornando-o mais flexível em sua especificação e em suas suposições distribucionais. A identificabilidade do modelo é estudada e condições necessárias e/ou suficientes para identificação dos parâmetros são apresentadas. Para a estimação dos parâmetros do modelo propomos um algoritmo ECM e a performance dos estimadores em amostras finitas é avaliada através de estudos de simulação de Monte Carlo. Finalizamos nosso estudo com uma ilustração considerando o modelo confirmatório para a dinâmica patológica do câncer de pâncreas utilizando dados reais de expressão gênica. | pt_BR |
Aparece en las colecciones: | Dissertações de Mestrado - Estatística |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Alexandre Henrique Carvalho Marques.pdf | 852,83 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons