Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/52584

Compartilhe esta página

Título: Seleção de ensemble heterogêneo para a detecção de fake news
Autor(es): COUTINHO, Sara Bandeira
Palavras-chave: Inteligência computacional; Diversidade
Data do documento: 2-Ago-2023
Editor: Universidade Federal de Pernambuco
Citação: COUTINHO, Sara Bandeira. Seleção de ensemble heterogêneo para a detecção de fake news. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
Abstract: A disseminação de Fake News tornou-se um dos problemas da sociedade atual. Uma solução para esse problema é detectar a veracidade dos textos das notícias usando sistemas automati- zados, dada a existência da dificuldade do ser humano de detectá-las, concernente ao viés de confirmação, as preferências pessoais que influenciam os sistemas de recomendação, bem como a grande quantidade de dados gerados online, que inviabiliza uma inspeção manual. Diversas abordagens relacionadas ao aprendizado de máquina têm sido propostas na literatura. Dentre elas, o uso de sistemas de múltiplos classificadores mostrou-se promissor por obter resultados melhores do que sistemas que usam apenas um classificador. No entanto, para serem eficientes, esses sistemas precisam de que seus classificadores sejam diversos, e para isso, na literatura, algumas estratégias são encontradas para obtê-la, tal qual o uso de classificadores heterogê- neos e uma análise sobre agrupamentos de classificadores, construídos a partir da informação de dissimilaridade entre eles. Contudo, esse tipo de abordagem demanda uma inspeção visual. Como alternativa, este trabalho propõe um sistema de múltiplos classificadores que seleciona subconjuntos de um pool de classificadores heterogêneos, a partir de uma análise automática sob diferentes níveis de dissimilaridade entre os classificadores. Deseja-se que os classificado- res selecionados sejam diversos e, para esse fim, cada classificador no pool é representado usando a medida de diversidade e um algoritmo de agrupamento hierárquico, que agrupa os classificadores semelhantes, facilitando a seleção dos classificadores mais diversos. Em com- plemento, para esta etapa, considerou-se escolhê-los a partir daqueles que apresentaram um maior desempenho, em uma análise individual, nas métricas de avaliação, a fim de que fosse obtido um subconjunto com maior diversidade e com classificadores que tiveram uma maior capacidade de generalização. Nos experimentos, foram considerados seis conjuntos de dados, de diferentes contextos e quantidades de classe. O método proposto foi comparado com outras três heurísticas de seleção e com abordagens da literatura. As métricas adotadas para avaliar os resultados foram acurácia, precisão, revocação e medida f1. O método proposto apresentou resultados promissores, alcançando o maior desempenho, com relação aos demais, em 3 dos 6 conjuntos adotados, os quais apresentaram apenas duas classes.
URI: https://repositorio.ufpe.br/handle/123456789/52584
Aparece nas coleções:Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO Sara Bandeira Coutinho.pdf2,61 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons