Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/52147

Share on

Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSANTANA, Maíra Araújo de-
dc.contributor.authorMELO, Elverson Soares de-
dc.date.accessioned2023-09-05T14:25:16Z-
dc.date.available2023-09-05T14:25:16Z-
dc.date.issued2023-08-24-
dc.date.submitted2023-08-31-
dc.identifier.citationMELO, Elverson Soares de. Desvendando biomarcadores: uma análise de algoritmos de aprendizagem de máquina na distinção entre indivíduos saudáveis e pré-diabéticos a partir de dados de dispositivos vestíveis. 2023. 75 f. Trabalho de Conclusão de Curso (Curso de Sistemas de Informação) - Universidade Federal de Pernambuco, Recife, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/52147-
dc.description.abstractO Diabetes é uma doença que atinge 537 milhões de pessoas no mundo. A insuficiência de insulina na doença gera um aumento da glicemia, causando enormes danos ao organismo. Devido à grande disseminação dessa doença e de seu estágio antecessor, o pré-diabetes, muito se tem investido em dispositivos que permitam o monitoramento da doença. Atualmente, estudos estão focando na criação de sistemas inteligentes capazes de utilizar dados de dispositivos vestíveis para predição da glicemia. Um passo importante é prever quando pessoas saudáveis se tornam pré-diabéticas, de forma a alertar sobre a presença dessa condição silenciosa e assim tentar evitar a evolução do indivíduo para a Diabetes Melito tipo II. Para alcançar esse objetivo, torna-se imprescindível a descoberta de sinais digitais que possam desempenhar o papel de biomarcadores para a doença, uma área em constante desenvolvimento na atualidade. Nesse sentido, o propósito deste estudo foi avaliar se os sinais digitais obtidos por meio de dispositivos de pulso inteligentes são capazes de estabelecer uma distinção satisfatória entre os padrões de sinal de um indivíduo saudável e de um indivíduo pré-diabético. Para isso foram utilizados dados públicos de leituras da pulseira Empatica E4, coletados de 16 indivíduos. Os dados foram utilizados de duas formas: I) dados brutos processados para janela temporal de um minuto, II) dados que passaram pelo processo de engenharia de atributos. Para tarefa de predição de presença ou ausência da doença foram utilizados algoritmos de aprendizagem de máquina da classe das árvores de decisão, máquinas de vetores de suporte, redes neurais e algoritmos Ensemble. Os resultados indicaram que é possível utilizar os dados da pulseira para predição da presença da doença, mas que o uso das leituras brutas dos sensores para o treinamento de modelos gera predições com uma menor acurácia em relação a utilização de atributos que foram filtrados e decompostos. O algoritmo de Random Forest apresentou a melhor acurácia entre os algoritmos testados, 77,4% e 77,9% nos grupos de treino e teste respectivamente, considerando a base com dados brutos; e acurácias 99,07% e 99,30% de para treino e teste na base submetida ao processo de engenharia de atributos. A aplicação da técnica de PCA permitiu a redução do número de atributos em 73% mantendo-se 95% da variabilidade presente na base, isso reduziu o custo computacional mantendo uma acurácia de 95,3% e 95,7% para treino e teste respectivamente. O treinamento deste modelo permitirá criar soluções usando dados de dispositivos vestíveis (pulseiras e relógios inteligentes) para gerar durante a transição para a pré-diabetes, facilitando o estabelecimento de medidas preventivas contra o Diabetes.pt_BR
dc.format.extent75 p.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência artificialpt_BR
dc.subjectDiabetes Mellituspt_BR
dc.subjectEstado pré-diabéticopt_BR
dc.subjectDispositivos eletrônicos vestíveispt_BR
dc.titleDesvendando biomarcadores: uma análise de algoritmos de aprendizagem de máquina na distinção entre indivíduos saudáveis e pré-diabéticos a partir de dados de dispositivos vestíveispt_BR
dc.typebachelorThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/3913276831804193pt_BR
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3365230603042700pt_BR
dc.description.abstractxDiabetes is a disease that affects 537 million people worldwide. The deficiency of insulin in this disease leads to an increase in blood glucose levels. causing enormous damage to the body. Due to the great dissemination of this illness and its predecessor stage, pre-diabetes, considerable investment has been dedicated to the development of devices that enable disease monitoring. Currently, studies are focusing on the creation of intelligent systems capable of using data from wearable devices to predict blood glucose. A crucial step is to predict when healthy people become pre-diabetic, to raise awareness of the presence of this silent condition and thus try to prevent the individual from developing into Type II Diabetes Mellitus. To achieve this goal, it is essential to discover digital signals that can play the role of biomarkers for the disease, an area in constant development today. In this sense, the purpose of this study was to evaluate whether the digital signals obtained through smart wrist devices can establish a satisfactory distinction between the signal patterns of a healthy individual and a pre-diabetic individual. For this, public data from sensors of the Empatica E4 bracelet, collected from sixteen individuals, were used. The data were used in two ways: I) raw data processed for a time window of one minute, II) data that went through the feature engineering process. For the task of predicting the presence or absence of the disease, machine learning algorithms from the decision tree class, support vector machines, neural networks and Ensemble algorithms were used. The results showed that it is possible to use wristband data to predict the presence of the disease, but the use of raw sensor readings for model training generates predictions with less accuracy compared to the model training on attributes that were filtered and decomposed. The Random Forest algorithm showed the best accuracy among the tested algorithms, 77.4% and 77.9% in the training and test groups respectively, considering the database with raw data; and accuracies 99.07% and 99.30% for training and testing on the database that went through the feature engineering process. The application of the PCA technique allowed the reduction of the number of attributes by 73%, keeping 95% of the variability present in the base, this reduced the computational cost keeping an accuracy of 95.3% and 95.7% for training and testing, respectively. The training of this model will enable the creation of solutions that use data from wearable devices (bracelets and smart watches) to generate alerts when an individual progresses towards prediabetes, easing the implementation of preventive measures against diabetes.pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terra::Ciência da Computaçãopt_BR
dc.degree.departament::(CIN-DSC) - Departamento de Sistemas da Computação pt_BR
dc.degree.graduation::CIn-Curso de Sistemas de Informaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
dc.identifier.orcidhttps://orcid.org/0000-0003-3012-2503pt_BR
Appears in Collections:(TCC) - Sistemas da Computação

Files in This Item:
File Description SizeFormat 
TCC Elverson Soares de Melo.pdf4.48 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons