Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/45586
Comparte esta pagina
Título : | Modelos de regularização com imputação e curvas de decisão aplicados a dados de medicina |
Autor : | SANTOS, Diego da Silva |
Palabras clave : | Estatística aplicada; Imputação múltipla; Regressão regularizada; Validação cruzada aninhada; Curvas de decisão |
Fecha de publicación : | 22-feb-2022 |
Editorial : | Universidade Federal de Pernambuco |
Citación : | SANTOS, Diego da Silva. Modelos de regularização com imputação e curvas de decisão aplicados a dados de medicina. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022. |
Resumen : | Na análise estatística é comum a presença de dados faltantes em muitas aplicações e estudos em inúmeras áreas com especial enfase a área da saúde. Estudos foram sendo de- senvolvidos ao longo da segunda metade do século XX para contornar o problema de dados faltantes dos quais destacam-se os trabalhos de RUBIN (1988) e SCHAFER (1997) para imputa- ção de darubin1988overviewos. Além do tratamento do banco de dados e preenchimento dos dados faltantes para utilização das técnicas estatísticas de modelagem, que em sua grande maioria são restritas a dados completos, outra questão que se levanta após a imputação é a técnica estatística mais adequada a ser utilizada para o determinado objetivo inferencial. Na área de regressão os modelos com regularização vem sendo cada vez mais utilizados em pro- blemas de alta dimensão onde tem-se muitas covariáveis a serem estimadas ou em problemas envolvendo multicolinearidade. Esta dissertação aborda o problema da modelagem de regres- são regularizada aplicada aos dados imputados, em especial ao modelo de regressão LASSO adaptativo para dados multi-imputados conhecido como GALASSO (DU et al., 2020), também utiliza-se a técnica de validação cruzada aninhada (BATES; HASTIE; TIBSHIRANI, 2021) para obtenção da variância empírica de validação cruzada e intervalos de confiança mais largos para o erro de validação dentro da amostra envolvidos nos modelos de regularização. Desta forma, é proposta uma abordagem utilizando a imputação múltipla através do Bootstrap Bayesiano atrelado ao modelo LASSO logístico com validação cruzada aninhada para correção da esti- mativa de variância e intervalo de confiança da validação cruzada usual, buscando-se o melhor poder de classificação. Por fim, utiliza-se da metodologia de curvas de decisão proposta por VICKERS; ELKIN (2006) para a aplicação em dados de COVID-19 com o intuito de propor uma abordagem correta na tomada de decisões de profissionais da saúde em problemas de diagnóstico clínico na presença de dados faltantes. |
URI : | https://repositorio.ufpe.br/handle/123456789/45586 |
Aparece en las colecciones: | Dissertações de Mestrado - Estatística |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Diego da Silva Santos.pdf | 836,21 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons