Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/52584
Compartilhe esta página
Título: | Seleção de ensemble heterogêneo para a detecção de fake news |
Autor(es): | COUTINHO, Sara Bandeira |
Palavras-chave: | Inteligência computacional; Diversidade |
Data do documento: | 2-Ago-2023 |
Editor: | Universidade Federal de Pernambuco |
Citação: | COUTINHO, Sara Bandeira. Seleção de ensemble heterogêneo para a detecção de fake news. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023. |
Abstract: | A disseminação de Fake News tornou-se um dos problemas da sociedade atual. Uma solução para esse problema é detectar a veracidade dos textos das notícias usando sistemas automati- zados, dada a existência da dificuldade do ser humano de detectá-las, concernente ao viés de confirmação, as preferências pessoais que influenciam os sistemas de recomendação, bem como a grande quantidade de dados gerados online, que inviabiliza uma inspeção manual. Diversas abordagens relacionadas ao aprendizado de máquina têm sido propostas na literatura. Dentre elas, o uso de sistemas de múltiplos classificadores mostrou-se promissor por obter resultados melhores do que sistemas que usam apenas um classificador. No entanto, para serem eficientes, esses sistemas precisam de que seus classificadores sejam diversos, e para isso, na literatura, algumas estratégias são encontradas para obtê-la, tal qual o uso de classificadores heterogê- neos e uma análise sobre agrupamentos de classificadores, construídos a partir da informação de dissimilaridade entre eles. Contudo, esse tipo de abordagem demanda uma inspeção visual. Como alternativa, este trabalho propõe um sistema de múltiplos classificadores que seleciona subconjuntos de um pool de classificadores heterogêneos, a partir de uma análise automática sob diferentes níveis de dissimilaridade entre os classificadores. Deseja-se que os classificado- res selecionados sejam diversos e, para esse fim, cada classificador no pool é representado usando a medida de diversidade e um algoritmo de agrupamento hierárquico, que agrupa os classificadores semelhantes, facilitando a seleção dos classificadores mais diversos. Em com- plemento, para esta etapa, considerou-se escolhê-los a partir daqueles que apresentaram um maior desempenho, em uma análise individual, nas métricas de avaliação, a fim de que fosse obtido um subconjunto com maior diversidade e com classificadores que tiveram uma maior capacidade de generalização. Nos experimentos, foram considerados seis conjuntos de dados, de diferentes contextos e quantidades de classe. O método proposto foi comparado com outras três heurísticas de seleção e com abordagens da literatura. As métricas adotadas para avaliar os resultados foram acurácia, precisão, revocação e medida f1. O método proposto apresentou resultados promissores, alcançando o maior desempenho, com relação aos demais, em 3 dos 6 conjuntos adotados, os quais apresentaram apenas duas classes. |
URI: | https://repositorio.ufpe.br/handle/123456789/52584 |
Aparece nas coleções: | Dissertações de Mestrado - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Sara Bandeira Coutinho.pdf | 2,61 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este arquivo é protegido por direitos autorais |
Este item está licenciada sob uma Licença Creative Commons