defesa de dissertaÇÃo de mestrado...textos e em imagens foram testadas no corpus cross-media...

1
DEFESA DE DISSERTAÇÃO DE MESTRADO Programa de Pós-Graduação em Ciência da Computação ANÁLISE MULTIMODAL EM BLOGS BRASILEIROS ALUNA: Greice Pinho Dal Molin ORIENTADORA: Dra. Soraia Raupp Musse BANCA EXAMINADORA: Dra. Carla Maria Dal Sasso Freitas (INF/UFRGS), Dra. Renata Vieira (PPGCC/PUCRS) DATA: 30 de agosto de 2019 LOCAL: Prédio 32, sala 404 HORÁRIO: 10:00 RESUMO: O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social. Palavras Chave: cross-media blogset, análise de sentimentos em texto, análise de sentimentos em imagens, corpus, léxicos, contradição entre domínios, CNN.

Upload: others

Post on 13-Jul-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DEFESA DE DISSERTAÇÃO DE MESTRADO...textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste

DEFESA DE DISSERTAÇÃO DEMESTRADO

Programa de Pós-Graduação em Ciência da Computação

ANÁLISE MULTIMODAL EM BLOGSBRASILEIROS

ALUNA: Greice Pinho Dal Molin

ORIENTADORA: Dra. Soraia Raupp Musse

BANCA EXAMINADORA: Dra. Carla Maria Dal Sasso Freitas (INF/UFRGS), Dra. Renata

Vieira (PPGCC/PUCRS)

DATA: 30 de agosto de 2019

LOCAL: Prédio 32, sala 404

HORÁRIO: 10:00

RESUMO:O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os

seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos.

Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da

mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como:

análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a

descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs.

Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda

existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e

subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross media Brazilian Blog, um

conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses

dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs,

que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em

textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são

apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa

especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa,

quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs

podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos

nas postagens de mídia social.

Palavras Chave: cross-media blogset, análise de sentimentos em texto, análise de sentimentos em imagens, corpus,

léxicos, contradição entre domínios, CNN.