Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/56907
Comparte esta pagina
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | CAVALCANTI, George DC | - |
dc.contributor.author | NASCIMENTO, Francimaria Rayanne dos Santos | - |
dc.date.accessioned | 2024-07-23T13:26:04Z | - |
dc.date.available | 2024-07-23T13:26:04Z | - |
dc.date.issued | 2024-03-12 | - |
dc.identifier.citation | NASCIMENTO, Francimaria Rayanne dos Santos. Hate speech detection and gender bias mitigation on online social media. 2024. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/56907 | - |
dc.description | CAVALCANTI, George DC, também é conhecido em citações bibliográficas por: CAVALCANTI, George Darmiton da Cunha. | pt_BR |
dc.description.abstract | The popularisation of online social media has allowed the quick proliferation of user- generated content. The large amount of content generated every second on social media plat- forms makes the proper moderation of its content arduous and time-consumed, resulting in an easy dissemination of hate speech. Even though significant advances have been made for au- tomatic hate speech detection, concerns have been raised about the robustness of the learning model and its impact due to its potentially biased behaviours, leading to questionable trends based on identity terms (e.g., women, black, or gay). In this thesis, we address unintended bias, specifically unintended gender bias, in the hate speech detection task. Firstly, we pro- posed a comprehensive study of hate speech, including a critical analysis of definitions of hate speech proposed across multiple platforms and in the scientific community. It also overviews the main approaches typically used in automatic hate speech detection. The results presented a critical analysis of theoretical and practical resources, discussing opportunities in this area and several challenges, including bias issues. Considering the unintended bias in the model for automatically detecting hate speech is essential to prevent potential unintended discrimination. Therefore, we proposed a new methodology using a multi-view ensemble for automatic hate speech detection and unintended gender bias mitigation. The proposed methodology consists of two modules: (1) a gender bias mitigation module based on the detection and replacement of bias-sensitive words and (2) a hate speech detection module using a multi-view stacked clas- sifier. The multi-view stacked classifier combines base classifiers trained with distinct feature representations. Experimental results over four benchmark datasets demonstrate the proposed approach’s effectiveness compared to state-of-the-art solutions, reducing the unintended bias without compromising the model performance. Furthermore, there are concerns whether un- intended bias may presents different behaviours depend on the feature extraction technique used. Therefore, we also proposed a framework to help analyse the biased behaviour of feature extraction techniques. In addition, a new comprehensive dataset to help the unintended gender bias evaluation is designed, called the Unbiased dataset. We have conducted an experimental study on various state-of-the-art feature extraction methods, focusing on their potential bias towards identity terms. Our findings indicate that the feature extraction technique can influ- ence the bias found in the final model, and its effectiveness can rely on the dataset analysed. | pt_BR |
dc.description.sponsorship | CAPES | pt_BR |
dc.language.iso | eng | pt_BR |
dc.publisher | Universidade Federal de Pernambuco | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Discurso de ódio | pt_BR |
dc.subject | Ensemble learning | pt_BR |
dc.subject | Viés de gênero | pt_BR |
dc.subject | Multi-view | pt_BR |
dc.subject | Redes sociais | pt_BR |
dc.title | Hate speech detection and gender bias mitigation on online social media | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.advisor-co | ABREU, Márjory Cristiany da Costa | - |
dc.contributor.authorLattes | http://lattes.cnpq.br/3241407043892610 | pt_BR |
dc.publisher.initials | UFPE | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.degree.level | doutorado | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/8577312109146354 | pt_BR |
dc.publisher.program | Programa de Pos Graduacao em Ciencia da Computacao | pt_BR |
dc.description.abstractx | A popularização das redes sociais online permitiu a rápida proliferação de conteúdos ger- ados pelos usuários. A grande quantidade de conteúdo gerado a cada segundo nas plataformas de redes sociais torna a moderação adequada do seu conteúdo árdua e demorada, resultando em uma fácil disseminação do discurso de ódio. Embora tenham sido feitos avanços signi- ficativos na detecção automática de discurso de ódio, preocupações têm surgido a cerca de robustez do modelo de aprendizagem e do seu impacto devido aos seus comportamentos poten- cialmente tendenciosos, levando a tendências questionáveis baseadas em termos de identidade (por exemplo, mulheres, negros ou gay). Nesta tese, abordamos o preconceito não intencional, especificamente o preconceito de gênero não intencional, na tarefa de detecção de discurso de ódio. Em primeiro lugar, propusemos um estudo abrangente do discurso de ódio, incluindo uma análise crítica das definições de discurso de ódio propostas em múltiplas plataformas e na comunidade científica. Também apresenta uma visão geral das principais abordagens nor- malmente utilizadas na detecção automática de discurso de ódio. Os resultados apresentaram uma análise crítica dos recursos teóricos e práticos, discutindo oportunidades nesta área e diversos desafios, incluindo questões como o preconceito. Considerar o preconceito não inten- cional no modelo de detecção automática de discurso de ódio é essencial para prevenir uma potencial discriminação não intencional. Portanto, propusemos uma nova metodologia usando um conjunto com multi-visões (multi-view) para detecção automática de discurso de ódio e mitigação não intencional de preconceitos de gênero. A metodologia proposta consiste em dois módulos: (1) um módulo de mitigação de preconceito de gênero baseado na detecção e substituição de palavras sensíveis ao preconceito e (2) um módulo de detecção de discurso de ódio usando um classificador empilhado de múltiplas visualizações (multi-view stacked). O classificador empilhado multivisualizações combina classificadores básicos treinados com rep- resentações de recursos distintas. Resultados experimentais em quatro conjuntos de dados de benchmark demonstram a eficácia da abordagem proposta em comparação com soluções de última geração, reduzindo o viés não intencional sem comprometer o desempenho do modelo. Além disso, existem preocupações se o viés não intencional pode apresentar comportamentos diferentes dependendo da técnica de extração de características utilizada. Portanto, também propusemos uma estrutura para ajudar a analisar comportamentos tendenciosos das técni- cas de extração de características. Além disso, foi concebido um novo conjunto de dados abrangente para ajudar na avaliação de preconceitos de gênero não intencionais, denominado conjunto de dados imparcial. Conduzimos um estudo experimental sobre vários métodos de extração de recursos de última geração, com foco em seu potencial viés em relação aos termos de identidade. Nossas descobertas indicam que a técnica de extração de características pode influenciar o viés encontrado no modelo final, e sua eficácia pode depender do conjunto de dados analisado. | pt_BR |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/2234040548103596 | pt_BR |
Aparece en las colecciones: | Teses de Doutorado - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TESE Francimaria Rayanne dos Santos Nascimento.pdf | 1,31 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons