2016: a tríade da persona virtual - o que as mídias sociais podem revelar sobre o comportamento...

Post on 13-Feb-2017

92 Views

Category:

Data & Analytics

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Persona Virtual:O que as Mídias Sociais podem revelar

sobre o comportamento humano

Leandro Nunes de CastroLnunes@mackenzie.br, @lndecastro

Faculdade de Computação e Informática &

Programa de Pós-Graduação em Engenharia Elétrica e Computação

Laboratório de Computação Natural e Aprendizagem de Máquina (LCoN)

www.mackenzie.br/lcon.html

1

• Introdução: Mídias Sociais e a Análise de Dados Não Estruturados

• PARTE 1: ESTUDOS DE CASO– Estudo de Caso 01: A Importância das Reclamações Sociais

– Estudo de Caso 02: Análise de Sentimento em Tweets

– Estudo de Caso 03: Recomendação em Comércio Eletrônico

– Estudo de Caso 04: A TV Social

• PARTE 2: ASPECTOS PSICOLÓGICOS– A Tríade da Persona Virtual

– Análise de Sentimento: Polaridade e Estados Emocionais

– Predição de Personalidade

– Predição de Perfil Psicológico e Temperamento

2

Agenda

Artificial ImmuneSystems: A New ComputationalIntelligenceApproach

A NATCOMP + Fundamentals of Natural Computing: Basic Concepts, Algorithms andApplications

LCoN (laboratório de Computação Natural), Mackenzie

TUILUX (Recomendação para E-commerce)

TTV (TV Social)

Uma Breve História no Tempo

1998-2002

2006-2009

2009-hoje

2010-2012

2012-2014

2016

NATSOFT

4

1980-2000Web 1.0

Infraestrutura:- Comunicação- Compartilhamentode dados- Informações estáticas

2000-2008Web 2.0

- SaaS- Colaboratividade- Escalabilidade- Fontes convergentes e mutáveis- Múltiplos dispositivos

2009-20…Web 3.0

- Personalização- Analytics- IoT- Automação- Inteligência- Big Data

Big Data

Dados(4 V’s)

Infraestrutura de Software

Infraestrutura de Hardware

5

Armazenagem e Processamento

Modelagem e Analytics

VelocidadeVariedadeVolumeVeracidade

HumanaNegócios Ciência

6

7

Dados Estruturados Dados Não Estruturados

8

O Processo de Análise de Dados Não Estruturados

• Extração de características• Preparação de dados• Processamento de sinais

• Associação• Classificação • Agrupamento• Detecção de anomalias

• APIs• Crawlers• Câmeras • Gravadores• Sensores

• Especialistas de domínio• Medidas de avaliação• Benchmarking

Estudo de Caso 01A Importância das Reclamações Sociais

Dados do Reclame Aqui

Panorama Geral do Setor de Construção Civil

7%

30%

19%

24%

20%

Status das Reclamações

Nao Respondido

Respondido

Replicas

Finalizada - Resolvido

Média Geral Média ">0"

3,9

5,3

0,5

2,6

Média das Notas

Finalizada - Resolvido Finalizada - Nao Resolvido

Panorama Geral do Setor

2% 2% 2% 2% 2% 2% 2% 3% 3%4% 4% 5% 5% 5% 5% 5% 6%

10%

13%

17%

Construção Civil - Reclamações

Panorama Geral do Setor

17%

13%

9%

6% 6% 6% 6%4% 4% 4% 4% 3% 3% 2% 2% 2% 2% 2% 2% 2%

Construção Civil - Soluções

Estudo de Caso 02Análise de Sentimento em Tweets

Dados da Rede Globo

• Para realizar as análises a serem apresentadas foram utilizados 206.259 tweets de 127.945 usuários entre os dias 1 e 31 de dezembro de 2010.

• Os atributos disponíveis para essa análise foram: Cliente, Avaliação, Termo, Usuário, Texto e Data.

Base de Análise

InfluenciadoresId Usuários

Qtde de Tweets

Percentual de Tweets (%)

Qtde de Seguidores

Qtde de Seguidos

1 adnoticia 253 0,12% 175 219

2 annoticia 256 0,12% 271 350

3 comuniquebrinde 170 0,08% 1.211 1.967

4 feedrssreader 192 0,09% 350 245

5 g1 389 0,19% 467.484 21

6 mariana_viips 155 0,08% 694 67

7 news_mundo_ 224 0,11% 281 895

8 novinhabru 320 0,16% 2.992 1.963

9 romariontv 177 0,09% - -

10 segundoplanobr 151 0,07% 347 7

11 siteg1 207 0,10% 60 -

12 sjodiel_indica 262 0,13% 855 615

13 standupbot 384 0,19% 386 -

14 tudodoesporte 522 0,25% 894 366

15 tweets24hs 158 0,08% 2.940 3.258

16 vidasemglobo 147 0,07% 600 177

17 waldeterossi 313 0,15% 70 13

18 zocialtv_br 242 0,12% 338 115

19 _invo 720 0,35% 342 22

TOTAL: 5.242 2,54%

Segmentando os Influenciadores

Segmentando os Influenciadores

Grupo 1

adnoticia

annoticia

g1

news_mundo_

siteg1

waldeterossi

_invo

Grupo 2

comuniquebrinde

feedrssreader

segundoplanobr

sjodiel_indica

tweets24hs

Grupo 3

mariana_viips

novinhabru

romariontv

standupbot

tudonoesporte

vidasemglobo

zocialtv_br

Análise dos Grupos

Grupo Palavras

1Rio, Brasil, Paulo, chuva, lula, mundial, policia, governo, sul, natal, pais, wikileaks, brasileiros, Dilma, feira, alemão, sudeste, estados, justiça, preso.

2Rio, Paulo, Brasil, chuva, insensato, pais, governo, natal, wikileaks, Dilma, mundial, justiça, policia, brasileiros, segurança, temporais, projeto, risco, Cielo, prisão.

3Programa, gosta, assista, Faustão, cine, peça, hoje, ajuda, vídeo, twitteado, amore, marcos, noticias, castro, Araguaia, Ana, comedy, zilza, vote, malhação.

Estudo de Caso 03:Sistema de Recomendação para

Comércio Eletrônico

Desenvolvido para a empresa NATLUX Informática e Consultoria LTDA

20

“Os sistemas de recomendação personalizada formam um guia no processo

de escolha de produtos em um comércio eletrônico e objetivam recomendar o

produto mais atrativo a cada cliente, em cada contexto, antes de perder sua

atenção. Essa sugestão pode ser feita por meio de janelas específicas na loja virtual ou enviando e-mails personalizados para

cada cliente.”*

* Artigo publicado na revista E-Commerce Brasil, Ano 2, Edição 1, 2012.

21

Visão Geral de um Sistema de Recomendação

1. Captura de informações dos

produtos

2. Captura de informações sobre

o comportamento dos usuários

3. Aplicação dos algoritmos de

recomendação

4. Apresentação dos produtos

selecionados

5. Monitoramento e análise das

recomendações22

Nossa Solução

Representação das regras:

Ab (1)

(2)

(3)

(4)

Ab{d}(8)

Maturate

Select

Clone

Ab{n}

C

C*

Re-select

f

f*

(7)

(6)

(5)

Ab{n}

Fluxo do algoritmo:

Recomendações personalizadas.

Estudo de Caso 04:TV Social

O que é TV SocialCriança Esperança

Análise de Valor de MarcasBig Brother Brasil

• Mídias Sociais: Aplicações de Internet baseadas na criação e troca de conteúdogerado pelos próprios usuários.

• TV Social: Terminologia empregada para se referir à convergência entre a TV e as MídiasSociais.

Fonte: Adaptado de http://bit.ly/12yQjfN25

26...E muito mais...

Cobertura do TTV

TTV Analytics

• Conhecer o engajamento, envolvimento e sentimento das pessoas sobre os programas da TV brasileira nas mídias sociais.

Objetivos

• Fornecer estudos quantitativos e qualitativossobre a TV Social.

Foco

• Uso da plataforma analítica do TTV.

• Elaboração de relatórios customizados.Metodo-

logia

27

Emissoras• Saiba o que estão falando

sobre todos os programas da TV brasileira

• Analise o engajamento

• Busque episódios, fatos e dados que interagem e/ou motivam a audiência

• Compare com outras emissoras/programas

• Tenha atualização diária para toda a grade

Agências e Anunciantes• Crie novos formatos de

análise de audiência de TV

• Desenvolva planos de mídia com maior potencial de engajamento

• Amplie as análises possíveis na seleção de programas de TV

28

Para quem?

Tela Principal

29

Menu Principal Dashboard Geral Gráficos Gerais

30

Tipos de Tag Cloud

Exportação XLS da Tag Cloud

Exemplo de Context Cloud

Sem Considerar Sentimento Sentimento Negativo

Criança Esperança 2013: 30/08 – 01/09

Sentimento Positivo

Nota-se uma influência maior dos

termos vinculados a sentimento

negativo na Context Cloud dos assuntos

sem considerar Sentimento

Big Brother Brasil 13- Análise Quantitativa e Qualitativa -

Janeiro de 2013

Base de Análise

08 a 12/01/2013: Primeira semana de exibição

82.541 posts qualificados e sem repetiçãoFontes: Twitter e Facebook

Participantes

O Kleber Bambam tem umarepercussão substancialmente maiorque os demais participantes da casa, dificultando uma visualização dadistribuição na Tag Cloud.

Frequência na base:Aline: 1601 Anamara: 548André: 618 Andressa: 100Aslan: 117 Dhomini: 741Eliezer: 47 Fani: 765Fernanda: 374 Ivan: 76Kamilla: 123 Bambam: 2898Marcello: 321 Marien: 57Nasser: 335 Natalia: 251Yuri: 940

Adjetivos, Qualificadores e Afins

De forma geral os adjetivos associados ao programa têmconotação negativa.

Análise de ContextoO contexto do BBB gira em torno de conflitosentre quem gosta e quem não gosta, sexo, intelectualidade, redes sociais, audiência, premiações, personagens, etc.

Distribuição e Perfil dos GruposCluster 0

16%

Cluster 1

14%

Cluster 210%

Cluster 36%

Cluster 415%

Cluster 53%

Cluster 67%

Cluster 717%

Cluster 85%

Cluster 97%

Grupo 0: Defensores do BBB

Grupo 1: Repercussão da baixa audiência da estreia

Grupo 2: Comparações com novelas

Grupo 3: Twitter como mídia para o BBB

Grupo 4: Críticos à inteligência dos telespectadores do BBB e seus defensoresGrupo 5: Foco no BBB e seus participantesGrupo 6: Usuários do FacebookGrupo 7: Novos fãs e interessados no BBBGrupo 8: Críticos da sexualidade do BBBGrupo 9: Críticos aos homens do programa

PARTE 2A Tríade da Persona Virtual

As Mídias Sociais e o Comportamento Humano

38

• “Eles são mais felizes e têm vidas melhores que eu: O impacto do uso do Facebook sobre a percepção dos outros” (Chou & Edge, 2012).

• “Mais informação do que eu sempre quis: O Facebook desperta o monstro da inveja?”, Muise et al. (2009)

• “Socialnomics: Como as mídias sociaistransformam a maneira com que vivemos e fazemos negócios”, E. Qualman (2010)

• “O poder político das mídias sociais: Tecnologia, a esfera pública, e a mudançapolítica”, C. Shirky (2011)

39

Imagem formada a partir de como as pessoas se apresentam e se comportam nas mídias sociais, o que envolve desde seu perfil, sua identidade social, até seus comportamentos.

40

A Persona Virtual

41

O Que Já Fizemos?

Análise de Sentimento

Sentiment (Polarity) Analysis

42

ANÁLISE DE SENTIMENTO

Área que visa criar processos automáticos de

identificação das emoções e/ou sentimentos presentes

na forma como as pessoas se expressam textualmente.

Pode envolver a identificação da polaridade, estado

emocional (categorias e dimensão) e força.

Universidade Presbiteriana Mackenzie aceslima@gmail.com43

• Uma Plataforma para Análise de Polaridade (Sentiment Analysis Framework)

44

SAFRA

A SAFRA é uma plataforma automática de classificação de sentimento que não requer a intervenção humana para operar!

Universidade Presbiteriana Mackenzie aceslima@gmail.com 45

SAFRA

Mensagem (tweet) Polaridade'odeio voc temer pblico feliz improvisa no show de caetano e gil url' -1'michelmiguel eliastemerlulia temer vai se dar mal no tenho provas mas tenho convico'

-1

'kiko matarazzo publicitrio escritor marceneiro nas horas vagas cerveja artesanal wanderlust fora temer odeio coxinha'

-1

'veja o momento em que manifestantes ato contra o governo temer atacam usernameannoyedyoutubezufgdpwq'

-1

'fica de cara com lula tretando com os concurseiro mas pagapau para temer que nem concurso mais quer fazer foratemer'

1

'zorra zuando dilma e temer morrendo de rir' 1

46

Análise de Polaridade

#temer

Classificados + Classificados -

Tema: #temerPeriodo Coleta 2016-09-18 a 2016-09-24Total de tweets 105Classificados + 41Classificados - 64

Emoção é uma resposta discreta, por tempo limitado, a um evento interno ou

externo que acarreta características sincronizadas, incluindo experiência

subjetiva, expressão, resposta corporal e tendência a ações (PHELPS, 2009).

47

Estados Emocionais

48

O Modelo das 6

Emoções de P.

Ekman.

① ② ③

④ ⑤ ⑥

Tema: #olimpiadas2016Período Coleta 03-28/08/2016Total de tweets 849Classificados Anger 26Classificados Disgust 0Classificados Fear 50Classificados Happiness 495Classificados Sadness 263Classificados Surprise 15

49

Estados Emocionais

3% 0%

6%

58%

31%

2%

#Olimpiadas2016

Classificados

Anger

Classificados

Disgust

Classificados Fear

Classificados

Happiness

Classificados

Sadness

Mensagem (tweet) Estado Emocional

'olha selecaoolimpica vexame vai ser mais uma derrota nessas olimpiadas2016'

Tristeza

'orgulho dessas meninas muito respeito pelo futebol feminino bra rio2016 olimpiadas2016 futebol'

Alegria

'parabens selecao feminina time assim que da orgulho rio2016 martarainha olimpiadas2016 guerreiras'

Alegria

'nao e mais surpresa veja parte ensaio geral da abertura da rio USER_NUMBER olimpiadas2016 URL'

Surpresa

'meu sincero foda se essa palhacada vergonha rio2016 olimpiadas2016 pic twitter com nzucqcf1gs'

Tristeza

'o triste vai ser que se o futebol masculino ganhar o ouro todas conquistas dos outros atletas serao ignoradas olimpiadas2016'

Tristeza

'nenhum governo golpista ira calar nossa voz foratemer olimpiadas2016 itaipava arena URL'

Raiva

'olimpiadas2016 eles estao nos subestimando mas na verdade estao e com medo URL'

Medo50

Estados Emocionais

Predição de Personalidade

Personality Prediction

51

PREDIÇÃO DE PERSONALIDADE

Consiste em determinar os traços de personalidade de

um indivíduo baseado em seu comportamento, seguindo

um modelo de personalidade.

Atualmente, o modelo CGF (Cinco Grandes Fatores) é o

mais usado devido as pesquisas que relacionam

características léxicas com os traços presentes no

modelo. Universidade Presbiteriana Mackenzie aceslima@gmail.com52

PREDIÇÃO DE PERSONALIDADE

Universidade Presbiteriana Mackenzie aceslima@gmail.com53

ExtroversãoEmoções positivas. Tendência a procurar estimulação e a

companhia dos outros

NeuroticismoTendência a experimentar emoções negativas, como

raiva, ansiedade ou depressão

Amabilidade(Socialização)

Tendência a ser compassivo e cooperativo em vez de suspeitoso. Indivíduos “amáveis” valorizam a boa relação

com os outros.

Conscienciosidade Tendência em mostrar autodisciplina

Abertura à Experiência

Interesse pela arte, emoção, aventura, ideias fora do comum, imaginação, curiosidade e variedade de

experiências

• Uma plataforma para Predição de Personalidade

Universidade Presbiteriana Mackenzie aceslima@gmail.com 54

PERSOMA

Universidade Presbiteriana Mackenzie aceslima@gmail.com 55

PERSOMA

56

Personalidades

Extrovertido Neuroticismo Socialização Conscienciosidade Abertura

Election2016 0 1 1 0 0

iPhone7 0 1 1 0 0

Galaxys7 0 1 0 0 0

Hillary 1 1 0 0 0

Trump 1 1 1 1 0

Economy 1 0 1 0 0

NFL 0 1 1 0 0

NBA 0 1 1 0 0

Science 1 0 1 0 0

Predição de Perfil Psicológico e Temperamento

Usando Dados de Mídias Sociais

Solução Stand-Alone

57

PREDIÇÃO DE TEMPERAMENTO

Consiste em determinar o temperamento (conjunto de

características inatas que influenciam fortemente o

comportamento) de um indivíduo no ambiente familiar e

profissional.

Atualmente, o modelo de temperamento de Keirsey é

uma teoria focada nas funções cerebrais que tem sido

amplamente usado em processos de recrutamento.58

59

Artesão

Voltadas a trabalhos relacionados a inteligência corporal e cinestésica, espacial, musical e interpessoal. São preocupadas com técnicas e aperfeiçoamentos constantes, pois

visam o virtuosismo.

Guardião

Têm um relacionamento julgador com o mundo externo e, por isso, são cuidadosos, obedecem

às leis, seguem as regras e respeitam os direitos dos outros.

IdealistaConfiam mais na intuição do que nos sentidos e preferem tomar decisões com base em valores

humanos.

RacionalEmbora intuitivos como os idealistas, submetem

tudo à razão

Predição de Temperamento

• Um framework para Predição de Temperamento

• O TECLA recebe como entrada um conjunto de tweets (mensagens) de um dado usuário e retorna como saída um dos quatro tipos de temperamento de Keirsey.

60

TECLA

Classificação de Expressão de Gênero

Genre Expression Classification

61

• Problema de Classificação de Gênero no Twitter: o Problema de classificação binária:

Dadas duas classes, masculino e feminino, atribuir um tweet anônimo, ou conjunto de tweets, a uma dessas classes, sem a existência de autores candidatos;

Estudos examinaram desde o uso de palavras ou termos específicos (características psicolinguísticas), nome do usuário, nome completo, localização, linksURL, dentre outros;

Já foi mostrado que mulheres e homens adotam padrões diferentes, quase únicos, de comportamento quando da comunicação, se baseada em gênero (LAKOFF, 1975; EAGLY e STEFFEN, 1984; SCHWARTZ et al., 2013).

Classificação de Gênero

Figura 1 - Processo de identificação e classificação de gênero.

GENEC - Uma Metodologia para Classificação de Expressão de Gênero

• Os meta-atributos a serem extraídos são baseados em:

o Caracteres e Sintaxe: características estilométricas, utilizadas anteriormente para a resolução de problemas de atribuição de autoria;

o Palavras: incluem medidas estatísticas, conhecidas como medidas de riqueza de vocabulário (do inglês, vocabulary richness measures);

o Estrutura: incluem pontuação regular (como vírgula e dois pontos), além dos pontos de interrogação e exclamação utilizados de maneira excessiva (???, !!!);

o Morfologia: representam a maneira com a qual autor organiza a estrutura (do inglês, layout) de uma mensagem;

o Psicolinguística

Metodologia Baseada em Meta-Atributos

Como Dados Viram Negócios

65

66

Ações Internas ao Ambiente

67

Levando as Ações ao Cliente

68

Oportunidades e Qualificações

LCoN: Leandro Nunes de Castro

Venha fazer pesquisa conosco!

Oportunidades de

Iniciação Científica,

Mestrado, Doutorado e

Pós-Doutorado.

Contato: Lnunes@mackenzie.br

/lcon.mack

@lcon_mackenzie

Leandro Nunes de Castro

top related