Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/52584
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | CAVALCANTI, George Darmiton da Cunha | - |
dc.contributor.author | COUTINHO, Sara Bandeira | - |
dc.date.accessioned | 2023-10-03T14:41:01Z | - |
dc.date.available | 2023-10-03T14:41:01Z | - |
dc.date.issued | 2023-08-02 | - |
dc.identifier.citation | COUTINHO, Sara Bandeira. Seleção de ensemble heterogêneo para a detecção de fake news. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/52584 | - |
dc.description.abstract | A disseminação de Fake News tornou-se um dos problemas da sociedade atual. Uma solução para esse problema é detectar a veracidade dos textos das notícias usando sistemas automati- zados, dada a existência da dificuldade do ser humano de detectá-las, concernente ao viés de confirmação, as preferências pessoais que influenciam os sistemas de recomendação, bem como a grande quantidade de dados gerados online, que inviabiliza uma inspeção manual. Diversas abordagens relacionadas ao aprendizado de máquina têm sido propostas na literatura. Dentre elas, o uso de sistemas de múltiplos classificadores mostrou-se promissor por obter resultados melhores do que sistemas que usam apenas um classificador. No entanto, para serem eficientes, esses sistemas precisam de que seus classificadores sejam diversos, e para isso, na literatura, algumas estratégias são encontradas para obtê-la, tal qual o uso de classificadores heterogê- neos e uma análise sobre agrupamentos de classificadores, construídos a partir da informação de dissimilaridade entre eles. Contudo, esse tipo de abordagem demanda uma inspeção visual. Como alternativa, este trabalho propõe um sistema de múltiplos classificadores que seleciona subconjuntos de um pool de classificadores heterogêneos, a partir de uma análise automática sob diferentes níveis de dissimilaridade entre os classificadores. Deseja-se que os classificado- res selecionados sejam diversos e, para esse fim, cada classificador no pool é representado usando a medida de diversidade e um algoritmo de agrupamento hierárquico, que agrupa os classificadores semelhantes, facilitando a seleção dos classificadores mais diversos. Em com- plemento, para esta etapa, considerou-se escolhê-los a partir daqueles que apresentaram um maior desempenho, em uma análise individual, nas métricas de avaliação, a fim de que fosse obtido um subconjunto com maior diversidade e com classificadores que tiveram uma maior capacidade de generalização. Nos experimentos, foram considerados seis conjuntos de dados, de diferentes contextos e quantidades de classe. O método proposto foi comparado com outras três heurísticas de seleção e com abordagens da literatura. As métricas adotadas para avaliar os resultados foram acurácia, precisão, revocação e medida f1. O método proposto apresentou resultados promissores, alcançando o maior desempenho, com relação aos demais, em 3 dos 6 conjuntos adotados, os quais apresentaram apenas duas classes. | pt_BR |
dc.description.sponsorship | CAPES | pt_BR |
dc.language.iso | por | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Inteligência computacional | pt_BR |
dc.subject | Diversidade | pt_BR |
dc.title | Seleção de ensemble heterogêneo para a detecção de fake news | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.advisor-co | CRUZ, Rafael Menelau Oliveira e | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/3615526322937307 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | mestrado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/8577312109146354 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | The spread of Fake News has become one of the problems of today’s society. A solution to this problem is to detect the veracity of news texts using automated systems given the difficulty for humans to detect them, concerning confirmation bias, personal preferences that influence recommendation systems, as well as the large amount of data generated online, that makes manual inspection unfeasible. Several approaches related to machine learning have been proposed in the literature. Among them, the use of multiple classifier systems has shown to be promising for obtaining better results than systems that use only one classifier. However, to be efficient, these systems need their classifiers to be diverse, and for this, in the literature, some strategies are found to obtain it, such as the use of heterogeneous classifiers and an analysis of the groupings of classifiers, constructed from the dissimilarity information between them. However, this type of approach demands a visual inspection. As an alternative, this work proposes a multiple classifier systems that selects subsets of a pool of heterogeneous classifiers, from an automatic analysis under different levels of dissimilarity between the classifiers. It is desired to the selected classifiers to be diverse, and to that end, each classifier in the pool is represented using the diversity measure and a hierarchical clustering algorithm that groups similar classifiers, making it easier to select the most diverse classifiers. In addition, for this stage, it was considered to choose them from those that presented a greater performance, in an individual analysis, in the evaluation metrics, in order to obtain the subset with greater diversity and with classifiers that had a greater generalization ability. In the experiments, six datasets were considered, from different contexts and class quantities. The method was compared with three other selection heuristics and with literature approaches. The metrics adopted to evaluate the results were accuracy, precision, recall and f1 score. The proposed method presented promising results, reaching the highest performance, to the others, in 3 of the 6 adopted datasets, which presented only two classes. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/1143656271684404 | pt_BR |
Aparece en las colecciones: | Dissertações de Mestrado - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
DISSERTAÇÃO Sara Bandeira Coutinho.pdf | 2,61 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons