Use este identificador para citar ou linkar para este item: https://repositorio.ifgoiano.edu.br/handle/prefix/5883
Tipo: Trabalho de Conclusão de Curso
Título: CRIMES DE ÓDIO NA INTERNET: UM COMPARATIVO DE MODELOS DE APRENDIZADO DE MÁQUINA CLÁSSICOS PARA IDENTIFICAÇÃO DE DISCURSO NOCIVO
Autor(es): Morais, Arthur
Primeiro Orientador: Silva, Leila
Resumo: No mundo contemporâneo, a tecnologia exerce papel fundamental na vida em sociedade, uma de suas principais funções é a de facilitar a comunicação entre indivíduos. As redes sociais, como o próprio nome diz, funcionam como uma grande comunidade virtual, as pessoas em geral nunca estiveram tão expostas ao comentário de terceiros, também nunca houve tanta facilidade em tecer comentários sobre outros, muitos inclusive o fazem de forma anônima, o que intensifica uma sensação de impunidade sobre o que é dito, fato este que colabora quando o intuito do comentário é apenas expressar ódio. Os crimes de ódio podem ser destrutivos na vida das vítimas e devem ser tratados com seriedade pelas organizações governamentais e privadas que gerem as redes sociais. Agressores se beneficiam da variação nas legislações nacionais sobre discurso de ódio, da dificuldade de estabelecer um limite para o ciberespaço em constante evolução e de algoritmos que fornecem maior engajamento a comentários polêmicos. A propagação do discurso de ódio online desafia os formuladores de políticas e a comunidade de pesquisa no mundo todo. Para auxiliar no combate a estes crimes, diversas técnicas de processamento de linguagem natural, análise de dados e detecção de ameaças já foram testadas e apresentadas por meio de textos científicos dos quais serviram de inspiração para criação deste. Nesta monografia, foram implementadas técnicas de mineração de dados e modelos supervisionados de aprendizado de máquina para treinar modelos capazes de identificar estes crimes em textos diversos. Para testá-las, utilizou-se de uma base de dados gerada dinamicamente pelo projeto Dynabench a partir do contexto de crimes de ódio comuns que ocorrem na internet. Cada técnica testada é comparada a fim de documentar as limitações, melhores modelos e estratégias para detecção deste tipo de crime.
Abstract: In the contemporary world, technology plays a fundamental role in life in society, one of its main functions is to facilitate communication between individuals. Social networks, as the name itself says, function as a large virtual community, people in general have never been so exposed to the comments of third parties, nor has there ever been such ease in making comments about others, many even do so anonymously, which intensifies a sense of impunity regarding what is said, a fact that contributes when the intention of the comment is only to express hate. Hate crimes can be destructive in the lives of victims and must be treated with seriousness by governmental and private organizations that manage social networks. Aggressors benefit from the variation in national legislation on hate speech, from the difficulty of establishing a boundary for the constantly evolving cyberspace, and from algorithms that provide greater engagement to controversial comments. The spread of online hate speech challenges policymakers and the research community worldwide. To assist in combating these crimes, several techniques of natural language processing, data analysis, and threat detection have already been tested and presented through scientific texts which served as inspiration for the creation of this work. In this monograph, data mining techniques and supervised machine learning models were implemented to train models capable of identifying these crimes in diverse texts. To test them, a dataset generated dynamically by the Dynabench project from the context of common hate crimes that occur on the internet was used. Each technique tested is compared in order to document the limitations, best models, and strategies for detecting this type of crime.
Palavras-chave: discurso de ódio
ética
redes sociais
aprendizado de máquina supervisionado
processamento de linguagem natural
hate speech
natural language processing
social networks
ethics
supervised machine learning
Área do CNPq: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO::MODELOS ANALITICOS E DE SIMULACAO
Idioma: por
Pais: Brasil
Editor: Instituto Federal Goiano
Sigla da Instituição: IF Goiano
Campus: Campus Morrinhos
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ifgoiano.edu.br/handle/prefix/5883
Data do documento: 1-Set-2025
Aparece nas coleções:Bacharelado em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC_Arthur_Miranda_Oficial.pdf1,82 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.