Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/58487
Share on
Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | CAVALCANTI, George Darmiton da Cunha | - |
| dc.contributor.author | AVELINO, Juscimara Gomes | - |
| dc.date.accessioned | 2024-11-05T15:27:15Z | - |
| dc.date.available | 2024-11-05T15:27:15Z | - |
| dc.date.issued | 2024-08-20 | - |
| dc.identifier.citation | AVELINO, Juscimara Gomes. Imbalanced Regression Pipeline Recommendation. 2024. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024. | pt_BR |
| dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/58487 | - |
| dc.description.abstract | Imbalanced problems are common in various real-world scenarios and present significant chal- lenges, especially for regression tasks due to the rarity of certain continuous target values. While these issues have been extensively explored in classification tasks, they also affect re- gression, complicating model performance. This work presents an extensive experimental study involving various balancing strategies and learning models, introduces a taxonomy for imbal- anced regression approaches based on regression models, learning process modification, and evaluation metrics, and highlights new insights into the advantages of different strategies. From this study, it became evident that the choice of resampling method depends on the problem, learning models, and metrics, making it difficult to select an appropriate resam- pling strategy and learning model. As a result, it is necessary to test the majority of existing combinations. Based on these findings, this work proposes the Meta-learning for Imbalanced Regression (Meta-IR) framework to address these challenges. Meta-IR recommends optimal pipelines consisting of resampling strategies and learning models for imbalanced regression tasks. Two formulations are proposed: Independent, which separately recommends learning algorithms and resampling strategies, and Chained, which models their interdependencies se- quentially. The Chained approach demonstrated superior performance, suggesting a significant relationship between learning algorithms and resampling strategies. Compared with AutoML models and baseline configurations, Meta-IR outperformed all, offering a more effective solu- tion for imbalanced regression and indicating directions for future research. | pt_BR |
| dc.language.iso | eng | pt_BR |
| dc.publisher | Universidade Federal de Pernambuco | pt_BR |
| dc.rights | embargoedAccess | pt_BR |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
| dc.subject | Regressão desbalanceada | pt_BR |
| dc.subject | Estratégias de reamostragem | pt_BR |
| dc.subject | Meta-aprendizado | pt_BR |
| dc.title | Imbalanced Regression Pipeline Recommendation | pt_BR |
| dc.type | doctoralThesis | pt_BR |
| dc.contributor.advisor-co | CRUZ, Rafael Menelau Oliveira e | - |
| dc.contributor.authorLattes | http://lattes.cnpq.br/5854014635627691 | pt_BR |
| dc.publisher.initials | UFPE | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.degree.level | doutorado | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/8577312109146354 | pt_BR |
| dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
| dc.description.abstractx | Problemas de desbalanceamento são comuns em diversos cenários do mundo real e apre- sentam desafios significativos, especialmente para tarefas de regressão, devido à raridade de certos valores-alvo contínuos. Embora essas questões tenham sido amplamente exploradas em tarefas de classificação, elas também afetam a regressão, complicando o desempenho dos mod- elos. Este trabalho apresenta um estudo experimental extenso envolvendo várias estratégias de balanceamento e modelos de aprendizado, introduzimos uma taxonomia para abordagens de regressão desbalanceada baseada em modelos de regressão, modificação no processo de aprendizado e métricas de avaliação, e destaca novos insights sobre as vantagens de diferentes estratégias. A partir deste estudo, ficou evidente que a escolha do método de reamostragem depende do problema, dos modelos de aprendizado e das métricas, tornando difícil selecionar uma estratégia de reamostragem e um modelo de aprendizado apropriados. Como resultado, é necessário testar a maioria das combinações existentes. Com base nessas descobertas, este tra- balho propõe o modelo Meta-learning for Imbalanced Regression (Meta-IR) para enfrentar esses desafios. O Meta-IR recomenda pipelines ideais que consistem em estratégias de reamostragem e modelos de aprendizado para tarefas de regressão desbalanceada. Duas formulações são pro- postas: Independente, que recomenda separadamente algoritmos de aprendizado e estratégias de reamostragem, e Encadeada, que modela suas interdependências sequencialmente. A abor- dagem Encadeada demonstrou desempenho superior, sugerindo uma relação significativa entre algoritmos de aprendizado e estratégias de reamostragem. Em comparação com modelos de AutoML e configurações de linha de base, o Meta-IR superou todos, oferecendo uma solução mais eficaz para a regressão desbalanceada e indicando direções para futuras pesquisas. | pt_BR |
| Appears in Collections: | Teses de Doutorado - Ciência da Computação | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| TESE Juscimara Gomes Avelino.pdf | 34.53 MB | Adobe PDF | View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License
