Análise de emoções em mídias sociais utilizando aprendizado de máquina e séries temporais considerando informações de eventos extremos sociais e naturais
Arquivos
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Nas últimas décadas, o crescimento do uso da Internet gerou um aumento substancial na circulação de informações nas redes sociais. Devido ao grande interesse de diversas áreas da sociedade na análise de dados de redes sociais, estabeleceu-se a busca por melhores técnicas para a manipulação e compreensão desse conteúdo, permitindo que este enorme volume de informações possa ser interpretado de forma rápida e precisa. Dentro da grande variedade de informações que circulam na internet, a ocorrência de eventos extremos pode ser considerada uma área de grande interesse público devido a sua grande influência direta na sociedade. Assim, compreender a eclosão desses eventos extremos continua sendo um dos grandes desafios científicos contemporâneos, cujo progresso depende fortemente de abordagens multidisciplinares. Assim, nesta dissertação, são analisados dados coletados em mídias sociais, de grande circulação nacional e mundial, relacionados a eventos sociais e naturais extremos, a fim de identificar a emoção de ameaça definida para cada tema do evento abordado. Como estudos de caso, foram considerados dados sobre eventos sociais extremos relacionados a conflitos armados, entre os países Síria e EUA, Irã e EUA e Global (considerando os países China, Índia, Paquistão, Reino Unido, Japão, EUA, Coreia do Norte, Coreia do Sul, Taiwan e Indonésia). Em eventos naturais extremos foram selecionados dados relativos à ocorrência de secas, incêndios e desmatamentos na região da Floresta Amazônica para os anos de 2015, 2016, 2017, 2018, 2019 e 2020. A coleta dessas informações foi realizada considerando a evolução crescente de eventos, buscando entender como as ameaças ao longo do tempo podem gerar uma evolução endógena resultando em um evento extremo. O processamento dessas informações é realizado por meio da técnica de Análise de Sentimentos, para identificar o grau de ameaça de cada notícia coletada. O endereço eletrônico das notícias coletadas é armazenado em arquivo.csv juntamente com as informações sobre a data de publicação e o grau de ameaça, que formam um portfólio de ameaças para cada modelo de dados abordado. Os portfólios foram utilizados para validar o algoritmo “P-Model” como gerador de séries temporais endógenas para eventos extremos. O resultado desta validação é a geração de séries temporais de ameaças endógenas, que são utilizadas para prever a variação de ameaça futura dos eventos sociais e naturais extremos analisados. Para realizar a predição de séries temporais endógenas, utiliza-se a técnica de “Deep Learning” em uma estrutura da rede que aplica a rede neural “Long-Short Term Memory - LSTM”. Os resultados alcançados com base no LSTM, mostraram uma acurácia entre 46% e 71% na previsão do padrão de flutuação interpretado como ameaças, quando considerados os dados coletados para os dois estudos de caso abordados.