Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m21c.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador8JMKD3MGP3W34R/44H7S82
Repositóriosid.inpe.br/mtc-m21c/2021/04.19.19.48
Última Atualização2021:07.23.17.07.41 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m21c/2021/04.19.19.48.43
Última Atualização dos Metadados2022:04.03.23.15.43 (UTC) administrator
Chave SecundáriaINPE-18443-TDI/3093
Chave de CitaçãoIbañez:2021:AnEmMí
TítuloAnálise de emoções em mídias sociais utilizando aprendizado de máquina e séries temporais considerando informações de eventos extremos sociais e naturais
Título AlternativoAnalysis of emotions in social media using machine learning and time series considering information from extreme social and natural events
CursoCAP-COMP-DIPGR-INPE-MCTI-GOV-BR
Ano2021
Data2021-04-15
Data de Acesso23 abr. 2024
Tipo da TeseTese (Doutorado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas192
Número de Arquivos1
Tamanho10206 KiB
2. Contextualização
AutorIbañez, Marilyn Minicucci
BancaCampos Velho, Haroldo Fraga de (presidente)
Guimarães, Lamartine Nogueira Frutuoso (orientador)
Rosa, Reinaldo Roberto (orientador)
Shiguemori, Elcio Hideiti
Barchi, Paulo Henrique
Almeida Junior, Jurandy Gomes de
Caetano, Marco Antonio Leonel
Endereço de e-Mailmarilynminicucciibanez@gmail.com
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2021-04-19 19:48:43 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-04-26 14:27:18 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-05-31 19:19:30 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-06-01 16:33:15 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-06-01 23:52:08 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-06-02 10:27:19 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-06-02 13:30:59 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-06-02 15:43:58 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-06-02 17:19:04 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-06-06 15:05:40 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-06-06 19:17:25 :: marilyn.ibanez@inpe.br -> pubtc@inpe.br ::
2021-06-08 23:54:44 :: pubtc@inpe.br -> marilyn.ibanez@inpe.br ::
2021-06-09 12:03:44 :: marilyn.ibanez@inpe.br -> administrator ::
2021-07-23 16:46:06 :: administrator -> pubtc@inpe.br ::
2021-07-23 22:09:42 :: pubtc@inpe.br -> simone ::
2021-07-23 22:15:06 :: simone :: -> 2021
2021-07-23 22:21:19 :: simone -> administrator :: 2021
2022-04-03 23:15:43 :: administrator -> :: 2021
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chaveeventos extremos
mídias sociais
análise de sentimento
séries temporais
aprendizado de máquina
extreme events
social media
sentiment analysis
time series
machine learning
ResumoNas últimas décadas, o crescimento do uso da Internet gerou um aumento substancial na circulação de informações nas redes sociais. Devido ao grande interesse de diversas áreas da sociedade na análise de dados de redes sociais, estabeleceu-se a busca por melhores técnicas para a manipulação e compreensão desse conteúdo, permitindo que este enorme volume de informações possa ser interpretado de forma rápida e precisa. Dentro da grande variedade de informações que circulam na internet, a ocorrência de eventos extremos pode ser considerada uma área de grande interesse público devido a sua grande influência direta na sociedade. Assim, compreender a eclosão desses eventos extremos continua sendo um dos grandes desafios científicos contemporâneos, cujo progresso depende fortemente de abordagens multidisciplinares. Assim, nesta dissertação, são analisados dados coletados em mídias sociais, de grande circulação nacional e mundial, relacionados a eventos sociais e naturais extremos, a fim de identificar a emoção de ameaça definida para cada tema do evento abordado. Como estudos de caso, foram considerados dados sobre eventos sociais extremos relacionados a conflitos armados, entre os países Síria e EUA, Irã e EUA e Global (considerando os países China, Índia, Paquistão, Reino Unido, Japão, EUA, Coreia do Norte, Coreia do Sul, Taiwan e Indonésia). Em eventos naturais extremos foram selecionados dados relativos à ocorrência de secas, incêndios e desmatamentos na região da Floresta Amazônica para os anos de 2015, 2016, 2017, 2018, 2019 e 2020. A coleta dessas informações foi realizada considerando a evolução crescente de eventos, buscando entender como as ameaças ao longo do tempo podem gerar uma evolução endógena resultando em um evento extremo. O processamento dessas informações é realizado por meio da técnica de Análise de Sentimentos, para identificar o grau de ameaça de cada notícia coletada. O endereço eletrônico das notícias coletadas é armazenado em arquivo .csv juntamente com as informações sobre a data de publicação e o grau de ameaça, que formam um portfólio de ameaças para cada modelo de dados abordado. Os portfólios foram utilizados para validar o algoritmo P-Model como gerador de séries temporais endógenas para eventos extremos. O resultado desta validação é a geração de séries temporais de ameaças endógenas, que são utilizadas para prever a variação de ameaça futura dos eventos sociais e naturais extremos analisados. Para realizar a predição de séries temporais endógenas, utiliza-se a técnica de Deep Learning em uma estrutura da rede que aplica a rede neural Long-Short Term Memory - LSTM. Os resultados alcançados com base no LSTM, mostraram uma acurácia entre 46% e 71% na previsão do padrão de flutuação interpretado como ameaças, quando considerados os dados coletados para os dois estudos de caso abordados. ABSTRACT: In the last decades, the growth of Internet access has generated a substantial increase in the circulation of information on social networks. Due to the great interest of several areas of society in the analysis of social network data, the search for better techniques for the manipulation and understanding of this content has been established, allowing this huge volume of information to be interpreted quickly and accurately. Within the wide variety of information circulating on the internet, the occurrence of extreme events can be considered an area of great public interest due to their great direct influence on society. Thus, understanding the outbreak of these extreme events remains one of the great contemporary scientific challenges, whose progress depends heavily on multidisciplinary approaches. Thus, in this thesis, data collected from social media, of great national and worldwide circulation, related to extreme social and natural events are analyzed in order to identify the emotion of defined threat for each event theme addressed. As case studies, data on extreme social events related to armed conflicts were considered, between the countries Syria and USA, Iran and USA and Global (considering the countries China, India, Pakistan, United Kingdom, Japan, USA, North Korea , South Korea, Taiwan and Indonesia). On extreme natural events were selected data related to the occurrence of drought, fires and deforestation in the Amazon Forest region for the years 2015, 2016, 2017, 2018, 2019 and 2020. The collection of this information was carried out considering the increasing evolution of events, searching to understand how threats along time can generate an endogenous evolution resulting in an extreme event. The processing of this information is performed using the technique of Sentiment Analysis, to identify the degree of threat of each news collected. The electronic address of the news collected is stored in a .csv file together with the information on the date of publication and the degree of threat, which form a threat portfolio for each data model addressed. The portfolios were used to validate the algorithm P-Model as a generator of endogenous time series for extreme events. The result of this validation is the generation of endogenous threat time series, which are used to predict the future threat variation of the analyzed extreme social and natural events. To perform the prediction of endogenous time series, the Deep Learning technique is used in one structure of the network that applies the neural network Long-Short Term Memory − LSTM. The results achieved based on the LSTM, showed an accuracy between 46% and 71% in the prediction of the fluctuation pattern interpreted as threats, when considering the data collected for the two case studies addressed.
ÁreaCOMP
Arranjo 1urlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Análise de emoções...
Arranjo 2urlib.net > BDMCI > Fonds > Produção a partir de 2021 > CGIP > Análise de emoções...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
originais/@4primeirasPaginas.pdf 23/07/2021 13:38 415.0 KiB 
originais/DEFESA FINAL DE TESE DE MARILYN MINICUCCI IBANEZ - CAP.pdf 20/04/2021 11:53 62.2 KiB 
originais/TeseMarilyn-2.pdf 09/06/2021 09:26 9.6 MiB
Conteúdo da Pasta agreement
agreement.html 19/04/2021 16:48 1.7 KiB 
autorizacao.pdf 23/07/2021 14:07 813.9 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/8JMKD3MGP3W34R/44H7S82
URL dos dados zipadoshttp://urlib.net/zip/8JMKD3MGP3W34R/44H7S82
Idiomapt
Arquivo Alvopublicacao.pdf
Grupo de Usuáriosmarilyn.ibanez@inpe.br
pubtc@inpe.br
simone
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Detentor dos Direitosoriginalauthor yes
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhourlib.net/www/2017/11.22.19.04.03
Unidades Imediatamente Superiores8JMKD3MGPCW/3F2PHGS
8JMKD3MGPCW/46KUES5
Acervo Hospedeirourlib.net/www/2017/11.22.19.04
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar