Imbalanced Regression Pipeline Recommendation

AVELINO, Juscimara Gomes

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/58487

Share on

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	CAVALCANTI, George Darmiton da Cunha	-
dc.contributor.author	AVELINO, Juscimara Gomes	-
dc.date.accessioned	2024-11-05T15:27:15Z	-
dc.date.available	2024-11-05T15:27:15Z	-
dc.date.issued	2024-08-20	-
dc.identifier.citation	AVELINO, Juscimara Gomes. Imbalanced Regression Pipeline Recommendation. 2024. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/58487	-
dc.description.abstract	Imbalanced problems are common in various real-world scenarios and present significant chal- lenges, especially for regression tasks due to the rarity of certain continuous target values. While these issues have been extensively explored in classification tasks, they also affect re- gression, complicating model performance. This work presents an extensive experimental study involving various balancing strategies and learning models, introduces a taxonomy for imbal- anced regression approaches based on regression models, learning process modification, and evaluation metrics, and highlights new insights into the advantages of different strategies. From this study, it became evident that the choice of resampling method depends on the problem, learning models, and metrics, making it difficult to select an appropriate resam- pling strategy and learning model. As a result, it is necessary to test the majority of existing combinations. Based on these findings, this work proposes the Meta-learning for Imbalanced Regression (Meta-IR) framework to address these challenges. Meta-IR recommends optimal pipelines consisting of resampling strategies and learning models for imbalanced regression tasks. Two formulations are proposed: Independent, which separately recommends learning algorithms and resampling strategies, and Chained, which models their interdependencies se- quentially. The Chained approach demonstrated superior performance, suggesting a significant relationship between learning algorithms and resampling strategies. Compared with AutoML models and baseline configurations, Meta-IR outperformed all, offering a more effective solu- tion for imbalanced regression and indicating directions for future research.	pt_BR
dc.language.iso	eng	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	embargoedAccess	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Regressão desbalanceada	pt_BR
dc.subject	Estratégias de reamostragem	pt_BR
dc.subject	Meta-aprendizado	pt_BR
dc.title	Imbalanced Regression Pipeline Recommendation	pt_BR
dc.type	doctoralThesis	pt_BR
dc.contributor.advisor-co	CRUZ, Rafael Menelau Oliveira e	-
dc.contributor.authorLattes	http://lattes.cnpq.br/5854014635627691	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	doutorado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/8577312109146354	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Ciencia da Computacao	pt_BR
dc.description.abstractx	Problemas de desbalanceamento são comuns em diversos cenários do mundo real e apre- sentam desafios significativos, especialmente para tarefas de regressão, devido à raridade de certos valores-alvo contínuos. Embora essas questões tenham sido amplamente exploradas em tarefas de classificação, elas também afetam a regressão, complicando o desempenho dos mod- elos. Este trabalho apresenta um estudo experimental extenso envolvendo várias estratégias de balanceamento e modelos de aprendizado, introduzimos uma taxonomia para abordagens de regressão desbalanceada baseada em modelos de regressão, modificação no processo de aprendizado e métricas de avaliação, e destaca novos insights sobre as vantagens de diferentes estratégias. A partir deste estudo, ficou evidente que a escolha do método de reamostragem depende do problema, dos modelos de aprendizado e das métricas, tornando difícil selecionar uma estratégia de reamostragem e um modelo de aprendizado apropriados. Como resultado, é necessário testar a maioria das combinações existentes. Com base nessas descobertas, este tra- balho propõe o modelo Meta-learning for Imbalanced Regression (Meta-IR) para enfrentar esses desafios. O Meta-IR recomenda pipelines ideais que consistem em estratégias de reamostragem e modelos de aprendizado para tarefas de regressão desbalanceada. Duas formulações são pro- postas: Independente, que recomenda separadamente algoritmos de aprendizado e estratégias de reamostragem, e Encadeada, que modela suas interdependências sequencialmente. A abor- dagem Encadeada demonstrou desempenho superior, sugerindo uma relação significativa entre algoritmos de aprendizado e estratégias de reamostragem. Em comparação com modelos de AutoML e configurações de linha de base, o Meta-IR superou todos, oferecendo uma solução mais eficaz para a regressão desbalanceada e indicando direções para futuras pesquisas.	pt_BR
Appears in Collections:	Teses de Doutorado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
TESE Juscimara Gomes Avelino.pdf		34.53 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record Recommend this item

This item is licensed under a Creative Commons License