Análise de emoções em mídias sociais utilizando aprendizado de máquina e séries temporais considerando informações de eventos extremos sociais e naturais
dc.contributor.advisor | Guimarães, Lamartine Nogueira Frutuoso | |
dc.contributor.author | Ibañez, Marilyn Minicucci | |
dc.contributor.coadvisor | Rosa, Reinaldo Roberto | |
dc.date.accessioned | 2024-12-18T21:22:58Z | |
dc.date.available | 2024-12-18T21:22:58Z | |
dc.date.issued | 2021-04-15 | |
dc.description.abstract | Nas últimas décadas, o crescimento do uso da Internet gerou um aumento substancial na circulação de informações nas redes sociais. Devido ao grande interesse de diversas áreas da sociedade na análise de dados de redes sociais, estabeleceu-se a busca por melhores técnicas para a manipulação e compreensão desse conteúdo, permitindo que este enorme volume de informações possa ser interpretado de forma rápida e precisa. Dentro da grande variedade de informações que circulam na internet, a ocorrência de eventos extremos pode ser considerada uma área de grande interesse público devido a sua grande influência direta na sociedade. Assim, compreender a eclosão desses eventos extremos continua sendo um dos grandes desafios científicos contemporâneos, cujo progresso depende fortemente de abordagens multidisciplinares. Assim, nesta dissertação, são analisados dados coletados em mídias sociais, de grande circulação nacional e mundial, relacionados a eventos sociais e naturais extremos, a fim de identificar a emoção de ameaça definida para cada tema do evento abordado. Como estudos de caso, foram considerados dados sobre eventos sociais extremos relacionados a conflitos armados, entre os países Síria e EUA, Irã e EUA e Global (considerando os países China, Índia, Paquistão, Reino Unido, Japão, EUA, Coreia do Norte, Coreia do Sul, Taiwan e Indonésia). Em eventos naturais extremos foram selecionados dados relativos à ocorrência de secas, incêndios e desmatamentos na região da Floresta Amazônica para os anos de 2015, 2016, 2017, 2018, 2019 e 2020. A coleta dessas informações foi realizada considerando a evolução crescente de eventos, buscando entender como as ameaças ao longo do tempo podem gerar uma evolução endógena resultando em um evento extremo. O processamento dessas informações é realizado por meio da técnica de Análise de Sentimentos, para identificar o grau de ameaça de cada notícia coletada. O endereço eletrônico das notícias coletadas é armazenado em arquivo.csv juntamente com as informações sobre a data de publicação e o grau de ameaça, que formam um portfólio de ameaças para cada modelo de dados abordado. Os portfólios foram utilizados para validar o algoritmo “P-Model” como gerador de séries temporais endógenas para eventos extremos. O resultado desta validação é a geração de séries temporais de ameaças endógenas, que são utilizadas para prever a variação de ameaça futura dos eventos sociais e naturais extremos analisados. Para realizar a predição de séries temporais endógenas, utiliza-se a técnica de “Deep Learning” em uma estrutura da rede que aplica a rede neural “Long-Short Term Memory - LSTM”. Os resultados alcançados com base no LSTM, mostraram uma acurácia entre 46% e 71% na previsão do padrão de flutuação interpretado como ameaças, quando considerados os dados coletados para os dois estudos de caso abordados. | |
dc.description.abstract2 | In the last decades, the growth of Internet access has generated a substantial increase in the circulation of information on social networks. Due to the great interest of several areas of society in the analysis of social network data, the search for better techniques for the manipulation and understanding of this content has been established, allowing this huge volume of information to be interpreted quickly and accurately. Within the wide variety of information circulating on the internet, the occurrence of extreme events can be considered an area of great public interest due to their great direct influence on society. Thus, understanding the outbreak of these extreme events remains one of the great contemporary scientific challenges, whose progress depends heavily on multidisciplinary approaches. Thus, in this thesis, data collected from social media, of great national and worldwide circulation, related to extreme social and natural events are analyzed in order to identify the emotion of de-fined threat for each event theme addressed. As case studies, data on extreme social events related to armed conflicts were considered, between the countries Syria and USA, Iran and USA and Global (considering the countries China, India, Pakistan, United Kingdom, Japan, USA, North Korea , South Korea, Taiwan and Indonesia). On extreme natural events were selected data related to the occurrence of drought, fires and deforestation in the Amazon Forest region for the years 2015, 2016, 2017, 2018, 2019 and 2020. The collection of this information was carried out considering the increasing evolution of events, searching to understand how threats along time can generate an endogenous evolution resulting in an extreme event. The process ing of this information is performed using the technique of Sentiment Analysis, to identify the degree of threat of each news collected. The electronic address of the news collected is stored in a .csv file together with the information on the date of publication and the degree of threat, which form a threat portfolio for each data model addressed. The portfolios were used to validate the algorithm P-Model as a generator of endogenous time series for extreme events. The result of this validation is the generation of endogenous threat time series, which are used to predict the future threat variation of the analyzed extreme social and natural events. To perform the prediction of endogenous time series, the Deep Learning technique is used in one structure of the network that applies the neural network Long-Short Term Memory − LSTM. The results achieved based on the LSTM, showed an accuracy between 46% and 71% in the prediction of the fluctuation pattern interpreted as threats, when considering the data collected for the two case studies addressed. | |
dc.format.mimetype | application/pdf | |
dc.identifier.bibliographicCitation | IBAÑEZ, Marilyn Minicucci. Análise de emoções em mídias sociais utilizando aprendizado de máquina e séries temporais considerando informações de eventos extremos sociais e naturais. 2021. 194 p. Tese (Doutorado) - Instituto Nacional de Pesquisas Espaciais - INPE, São José dos Campos, 2021. | |
dc.identifier.uri | https://repositorio.ifsp.edu.br/handle/123456789/1827 | |
dc.identifier2.lattes | http://lattes.cnpq.br/5303306968929483 | |
dc.identifier2.orcid | https://orcid.org/0000-0001-6857-9918 | |
dc.publisher | Instituto Nacional de Pesquisas Espaciais (INPE) | |
dc.publisher.campi | SÃO JOSE DOS CAMPOS | |
dc.publisher.program | Computação Aplicada | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
dc.source.uri | http://urlib.net/8JMKD3MGP3W34R/44H7S82 | |
dc.subject.keywords | Eventos extremos | |
dc.subject.keywords | Mídias sociais | |
dc.subject.keywords | Análise de sentimento | |
dc.subject.keywords | Séries temporais | |
dc.subject.keywords | Aprendizado de máquina | |
dc.subject.keywords | Aprendizado profundo | |
dc.subject.keywords | LSTM | |
dc.title | Análise de emoções em mídias sociais utilizando aprendizado de máquina e séries temporais considerando informações de eventos extremos sociais e naturais | |
dc.type | Teses e Dissertações |