Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/40169

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorDE BASTIANI, Fernanda-
dc.contributor.authorSILVA, Lucas Araújo da-
dc.date.accessioned2021-05-25T13:11:48Z-
dc.date.available2021-05-25T13:11:48Z-
dc.date.issued2021-02-18-
dc.identifier.citationSILVA, Lucas Araújo da. Influential diagnostics for location parameter within GAMLSS. 2021. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/40169-
dc.description.abstractModelling the functional relationship between a variable response and a set of explana tory variables is at the core of the regression problems in statistics. Several studies have proposed different models. More recently, generalized additive models for scale and shape lo cation (GAMLSS) have gained attention for generalizing other already popular models such as the linear model, the generalized linear models, semiparametric models and the generalized additive models, and allowing any parametric distribution to model the response variable. In addition, all distribution parameters can be modeled with linear, non-linear or smoothing func tions for explanatory variables. Various tools of influence diagnostics have been proposed in the literature, and this work shows some of these tools and proposes techniques to detect possible influential observations in the GAMLSS model class. This work considers several measures of influence such as: the generalized Cook distance, the likelihood distance, the adjusted Peña measure, differences in the generalized Akaike information criterion and the Kim measure for simulated data and applications. It is also proposed algorithms to obtain the reference values of these measures using bootstrap, adapting for the other measures the procedure suggested by (KIM; PARK; KIM, 2002). The study is still limited to situations where we model the lo cation parameter (in general the mean) of the response variable, whether or not we have smoothing additives, in this case univariate penalized splines were used as a smoother, since the Peña and Kim measures need to calculate the matrix of smoothing that varies according to the smoothed covariate and the smoother in question. For the simulation studies, several scenarios were considered with some relevant distributions and several sample sizes, taking into account continuous and discrete distributions as well. Analysis of real data illustrates the approached methodology.pt_BR
dc.description.sponsorshipCAPESpt_BR
dc.language.isoengpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsembargoedAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectEstatística Aplicadapt_BR
dc.subjectBootstrappt_BR
dc.subjectDistância de Cookpt_BR
dc.titleInfluential diagnostics for location parameter within GAMLSSpt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/7987821215029063pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.levelmestradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5519064508209103pt_BR
dc.publisher.programPrograma de Pos Graduacao em Estatisticapt_BR
dc.description.abstractxModelar a relação funcional entre uma váriável resposta e um conjunto de variáveis ex plicativas é o cerne dos problemas de regressão em estatística. Diversos estudos tem propostos diferentes modelos. Mais recentemente os modelos aditivos generalizados para locação escala e forma (GAMLSS) tem ganhado atenção por generalizar outros modelos já populares como o modelo linear, os modelos lineares generalizados, modelos semiparamétricos e os modelos aditivos generalizados, e permitir qualquer distribuição paramétrica para modelar a variável resposta. Além disso, todos os parâmetros da distribuição podem ser modelados com funções lineares, não lineares ou funções de suavização das variáveis explicativas. Várias ferramentas de diagnósticos de influência tem sido propostas na literatura, e este trabalho mostra algumas dessas ferramentas e propõe técnicas para detectar possíveis observações influentes na classe de modelos GAMLSS. Este trabalho considera diversas medidas de influência como: a distân cia de Cook generalizada, o afastamento de verossimilhanças, a medida de Peña ajustada, diferenças do critério de informação de Akaike generalizada e a medida de Kim para dados simulados e aplicações. É proposto ainda algoritmos para obter os valores de referência destas medidas utilizando bootstrap, adaptando para as outras medidas o procedimento sugerido por Kim et al. (2002). O estudo ainda limita-se a situações que se é modelado o parâmetro de locação (em geral a média) da variável resposta, incluindo ou não termos aditivos de suaviza ção, neste caso utilizou-se splines penalizados univariados como suavizador, já que a medida de Peña e de Kim necessitam do cálculo da matriz de suavização que varia de acordo com a covariável suavizada e o suavizador em questão. Para os estudos de simulação, foram consid erados diversos cenários com algumas distribuições relevantes e diversos tamanhos amostrais, considerando distribuições tanto de natureza contínua quanto discretas. Análise de dados reais ilustram a metodologia abordada.pt_BR
Aparece en las colecciones: Dissertações de Mestrado - Estatística

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
DISSERTAÇÃO Lucas Araújo da Silva.pdf1,04 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons