Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/49416

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorOLIVEIRA, Adriano Lorena Inácio de-
dc.contributor.authorCABRAL, José Thiago Holanda de Alcântara-
dc.date.accessioned2023-03-21T17:05:05Z-
dc.date.available2023-03-21T17:05:05Z-
dc.date.issued2022-11-17-
dc.identifier.citationCABRAL, José Thiago Holanda de Alcântara. Um framework para seleção dinâmica de múltiplos regressores heterogêneos. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/49416-
dc.description.abstractO uso de Aprendizagem de Máquina (AM) tem sido cada vez mais comum em diversas áreas do conhecimento. A engenharia de software, assim como os estudos de desempenhos educacionais, são exemplos de áreas que têm aderido às técnicas de AM. Os métodos usados vão desde os individuais, que geram saídas a partir de um modelo, até os Sistema de Múltiplos Modelos (SMM). As estratégias usadas nessas combinações têm sido um importante tópico de pesquisa em AM, visto que o uso de múltiplos modelos tem diminuído o erro e a variância das previsões em relação aos modelos solos. Estas estratégias variam entre diferentes formas de selecionar e integrar os modelos selecionados. Partindo deste princípio, este trabalho propõe um framework para seleção dinâmica de múltiplos modelos de regressão heterogêneos. A partir de um conjunto de dados, um subconjunto de exemplos é separado para formar os dados de treinamento, e o restante dos dados constituem a base de teste. Diversos algoritmos de regressão são treinados e validados na base de treinamento. Três diferentes modelos são selecionados a partir do desempenho individual de cada algoritmo e, a este grupo de modelos daremos o nome de Conjunto Básico (CB). Em seguida, é criada uma base de treinamento para problemas de classificação. Base esta que consiste em identificar, para cada exemplo de treinamento, o modelo de regressão pertencente ao CB de melhor desempenho. A partir deste conjunto de dados, diferentes classificadores são gerados e avaliados. Consequentemente, um conjunto de modelos de classificação é definido e nomeado de Conjunto de Seletores (CS), de forma que, ao fim da fase de treinamento e validação, na fase de teste, os melhores classificadores (CS) são usados para selecionar de forma dinâmica e ponderada os modelos de regressão do CB. A previsão final é dada pela combinação das saídas destes regressores selecionados dinamicamente pelos classificadores. Posteriormente, a fim de validar a proposta, análises experimentais em duas áreas do conhecimento são apresentadas. Foram investigados dois repositórios de Estimativa de Esforço de Software (EES) e seis bases de dados educacionais. Além de verificar o desempenho dos métodos gerados a partir do framework proposto, também foi analisado o comportamento destes métodos quanto aos critérios de seleção dinâmica, e a possibilidade da existência de correlações entre as metas-características das bases de dados com o desempenho do framework. Os experimentos utilizaram seis métricas para análise dos resultados, sendo a média do erro absoluto usada para fins de testes estatísticos. Os resultados demonstraram que os métodos gerados por intermédio do framework proposto superaram, na maioria das vezes, os modelos individuais, assim como diferentes estratégias de combinações desses modelos.pt_BR
dc.description.sponsorshipCNPqpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.titleUm framework para seleção dinâmica de múltiplos regressores heterogêneospt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5017331427629327pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5194381227316437pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxThe use of Machine Learning (ML) has been increasingly common in several areas of knowledge. Software engineering, as well as educational performance studies, are examples of areas that have adhered to ML techniques. The methods used range from the individual ones, which generate outputs from a model, to the Multiple Model System. The strategies used in these combinations have been an important research topic in AM, since the use of multiple models has reduced the error and variance of predictions in relation to solo models. These strategies vary between different ways of selecting and integrating the selected models. Based on this principle, this work proposes a framework for dynamic selection of multiple heterogeneous regression models. From a data set, a subset of examples is separated to form the training data, and the rest of the data constitute the test base. Several regression algorithms are trained and validated on the training base. Three different models are selected based on the individual performance of each algorithm, and this group of models will be named Basic Set (CB). Then, a training base for classification problems is created. This basis consists of identifying, for each training example, the regression model belonging to the best performing CB. From this dataset, different classifiers are generated and evaluated. Consequently, a set of classification models is defined and named Set of Selectors (CS), so that, at the end of the training and validation phase, in the testing phase, the best classifiers (CS) are used to select in a way dynamic and weighted CB regression models. The final prediction is given by combining the outputs of these variable dynamically selected by the classifiers. Subsequently, in order to validate the proposal, experimental analyzes in two areas of knowledge are presented. Two Software Effort Estimation (SEE) repositories and six educational databases were investigated. In addition to verifying the performance of the methods generated from the proposed framework, the behavior of these methods was also analyzed regarding the dynamic selection criteria, and the possibility of correlations between the meta-characteristics of the databases and the performance of the framework. The experiments used six metrics to analyze the results, with the mean absolute error being used for statistical test purposes. The results showed that the methods generated through the proposed framework outperformed, in most cases, the individual models, as well as different strategies for combining these models.pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE José Thiago Holanda de Alcântara Cabral.pdf6,36 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons