Aplicação classificadora de discurso de ódio na rede social do Twitter baseada em machine learning

dc.contributor.advisorTeixeira, Márcio
dc.contributor.authorCarleci, André
dc.contributor.authorDias, Yago
dc.contributor.refereeValentini, Edivaldo
dc.contributor.refereeNakamura, Luis Hideo
dc.date.accessioned2024-08-09T16:59:41Z
dc.date.available2024-08-09T16:59:41Z
dc.date.issued2021-12-01
dc.description.abstractNo contexto atual as redes sociais dominam grande parte desse mundo digital em que o número de usuários é cada vez mais alto e cada vez mais influente nas vidas das pessoas em geral. Esse universo das redes sociais proporciona que seus usuários possam agir de maneira livre, dando a capacidade de se expressarem como quiserem, ainda tendo um possível grau de anonimato. O surgimento do discurso de ódio nesse meio é devido a essa liberdade e desse certo grau de anonimato que existe, onde ocorre ataques relacionados a um indivíduo ou a um grupo com relação a su a cor, gênero, etnia, nacionalidade, religião, orientação sexual ou qualquer outro possível aspecto passível de discriminação. Foi assim então proposta uma aplicação classificadora de discurso de ódio, que utiliza em seu desenvolvimento diversas tecnologias como conceitos e técnicas de machine learning e processamento de linguagem natural. A linguagem de programação escolhida para o desenvolvimento da aplicação foi Python, devido a sua simplicidade e a quantidade de bibliotecas disponíveis. Como resultados obtidos, a aplicação conseguiu uma precisão média de acertos de 68% durante os testes. Entretanto, ao ser alimentada com frases coletadas da rede social Twitter, a aplicação teve dificuldade para classificá-las, principalmente aquelas que não eram consideradas discurso de ódio. Concluiu-se que, como trabalho futuro, uma das formas de melhorar a aplicação seria inserindo uma nova categoria, como neutra, para casos em que a frase alimentada não é considerada discurso de ódio.
dc.description.abstract2In the current context, social networks dominate a large part of this digital world in which the number of users is increasingly higher and increasingly influential in the lives of people in general. This universe of social networks allows its users to act freely, giving them the ability to express themselves as they wish, while still having a possible degree of anonymity. The emergence of hate speech in this environment is due to this freedom and this certain degree of anonymity that exists, where attacks related to an individual or a group occur in relation to their color, gender, ethnicity, nationality, religion, sexual orientation or any other possible aspect subject to discrimination. Thus, an application for classifying hate speech was proposed, which uses in its development several technologies such as machine learning concepts and techniques and natural language processing. The programming language chosen for the development of the application was Python, due to its simplicity and the number of available libraries. As obtained results, the application achieved an average accuracy of correct answers of 68% during the tests. However, when it was fed with phrases collected from the social network Twitter, the application had difficulty in classifying them, especially those that were not considered hate speech. It was concluded that, as a future work, one of the ways to improve the application would be to insert a new category, such as neutral, for cases where the phrase fed is not considered hate speech.
dc.format.mimetypeapplication/pdf
dc.identifier.bibliographicCitationCARLECI, André Henrique; DIAS, Yago Oliveira Bomfim. Aplicação classificadora de discurso de ódio na rede social do Twitter baseada em machine learning. 2021. 38 f. TCC (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Catanduva, 2021.
dc.identifier.urihttps://repositorio.ifsp.edu.br/handle/123456789/946
dc.identifier2.lattes0543529360442287
dc.publisherInstituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)
dc.publisher.campiCATANDUVA
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subject.keywordsDiscurso de ódio
dc.subject.keywordsMachine learning
dc.subject.keywordsProcessamento de linguagem natural
dc.subject.keywordsHate speech
dc.subject.keywordsNatural language processing
dc.titleAplicação classificadora de discurso de ódio na rede social do Twitter baseada em machine learning
dc.title.alternativeMachine Learning-Based Hate Speech Classification Application on Twitter
dc.typeTrabalhos de Conclusão de Curso de Graduação
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
carleci_ah_dias_yob_aplicação.pdf
Tamanho:
1.18 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descrição: