Seleção de ensemble heterogêneo para a detecção de fake news

COUTINHO, Sara Bandeira

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/52584

Share on

Title:	Seleção de ensemble heterogêneo para a detecção de fake news
Authors:	COUTINHO, Sara Bandeira
Keywords:	Inteligência computacional; Diversidade
Issue Date:	2-Aug-2023
Publisher:	Universidade Federal de Pernambuco
Citation:	COUTINHO, Sara Bandeira. Seleção de ensemble heterogêneo para a detecção de fake news. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
Abstract:	A disseminação de Fake News tornou-se um dos problemas da sociedade atual. Uma solução para esse problema é detectar a veracidade dos textos das notícias usando sistemas automati- zados, dada a existência da dificuldade do ser humano de detectá-las, concernente ao viés de confirmação, as preferências pessoais que influenciam os sistemas de recomendação, bem como a grande quantidade de dados gerados online, que inviabiliza uma inspeção manual. Diversas abordagens relacionadas ao aprendizado de máquina têm sido propostas na literatura. Dentre elas, o uso de sistemas de múltiplos classificadores mostrou-se promissor por obter resultados melhores do que sistemas que usam apenas um classificador. No entanto, para serem eficientes, esses sistemas precisam de que seus classificadores sejam diversos, e para isso, na literatura, algumas estratégias são encontradas para obtê-la, tal qual o uso de classificadores heterogê- neos e uma análise sobre agrupamentos de classificadores, construídos a partir da informação de dissimilaridade entre eles. Contudo, esse tipo de abordagem demanda uma inspeção visual. Como alternativa, este trabalho propõe um sistema de múltiplos classificadores que seleciona subconjuntos de um pool de classificadores heterogêneos, a partir de uma análise automática sob diferentes níveis de dissimilaridade entre os classificadores. Deseja-se que os classificado- res selecionados sejam diversos e, para esse fim, cada classificador no pool é representado usando a medida de diversidade e um algoritmo de agrupamento hierárquico, que agrupa os classificadores semelhantes, facilitando a seleção dos classificadores mais diversos. Em com- plemento, para esta etapa, considerou-se escolhê-los a partir daqueles que apresentaram um maior desempenho, em uma análise individual, nas métricas de avaliação, a fim de que fosse obtido um subconjunto com maior diversidade e com classificadores que tiveram uma maior capacidade de generalização. Nos experimentos, foram considerados seis conjuntos de dados, de diferentes contextos e quantidades de classe. O método proposto foi comparado com outras três heurísticas de seleção e com abordagens da literatura. As métricas adotadas para avaliar os resultados foram acurácia, precisão, revocação e medida f1. O método proposto apresentou resultados promissores, alcançando o maior desempenho, com relação aos demais, em 3 dos 6 conjuntos adotados, os quais apresentaram apenas duas classes.
URI:	https://repositorio.ufpe.br/handle/123456789/52584
Appears in Collections:	Dissertações de Mestrado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
DISSERTAÇÃO Sara Bandeira Coutinho.pdf		2.61 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show full item record Recommend this item

This item is licensed under a Creative Commons License