análise qualitativa por meio do software iramuteq · especificidades e análise fatorial de...

Post on 25-Jan-2019

240 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

PPGA FEA-USPGabriel Navarro Bedante

Introdução

4

Definições preliminares

LACUNA

O QUE É

O IRAMUTEQ é um software LIVRE desenvolvido com base no software R (www.r-project.org) e na linguagem Python (www.python.org)

Permite fazer análises estatísticas sobre corpus textuais e sobre tabelas indivíduos/palavras. Ou seja, ele da um viés quantitativo para dados qualitativos.

PPGA FEA-USPGabriel Navarro Bedante

Análise de corpus textual

6

Antes de entrar nas possíveis análises é importante entender o que são Corpus, Textos e Segmentos de Texto...

Corpus

Texto

Segmentode Texto

O conjunto de textos que se pretende analisar formam um Corpus. O Corpus pode conter apenas um texto. Ex.: Transcrição de todas as entrevistas em profundidade realizadas para uma pesquisa; 200 respostas a uma questão aberta.

Um conjunto de segmentos de textos constitui um texto. A definiçãodestas unidades é feita pelo pesquisador e depende da natureza da pesquisa.Ex.: Em respostas de "n" participantes a uma questão aberta, cada resposta será um texto e teremos "n" textos.

São fragmentos de texto, na maior parte das vezes, de três linhas (ou configurado pelo pesquisador), dimensionadas pelo próprio software em função do tamanho do corpus.

PPGA FEA-USPGabriel Navarro Bedante

Tipos de análise

9

Existem dois grandes grupos de análises que podem ser feitas com o Iramuteq

ANÁLISES COM O IRAMUTEQ

Análise de corpus textual

Análise de matrizes

É um tipo específico de análise de dados, na qual tratamos de material verbal transcrito. Essa análise tem várias finalidades, sendo possível analisar textos, entrevistas, documentos, redações etc.

É um tipo de análise que permite que se trabalhe com matrizes que envolvam variáveis categoriais e listas de palavras, como aquelas utilizadas para analisar tarefas de evocações livres

PPGA FEA-USPGabriel Navarro Bedante

Tipos de análise

10

Esses grupos se subdividem em tipos específicos de análise

ANÁLISES COM O IRAMUTEQ

Análise de corpus textual

Análise de matrizes

Classificação hierárquica descendente (CHD)

Similitude

Prototípica

Lexográfica (Estatísticas Básicas)

Especificidades e AFC

Classificação hierárquica descendente (CHD)

Similitude

Nuvem de palavras

Frequências e Frequências Múltiplas

PPGA FEA-USPGabriel Navarro Bedante

Tipos de análise

11

A apresentação de hoje focará apenas na Análise de Corpus Textual

ANÁLISES COM O IRAMUTEQ

Análise de corpus textual

Análise de matrizes

Classificação hierárquica descendente (CHD)

Similitude

Prototípica

Lexográfica (Estatísticas Básicas)

Especificidades e AFC

Classificação hierárquica descendente (CHD)

Similitude

Nuvem de palavras

Frequências e Frequências Múltiplas

PPGA FEA-USPGabriel Navarro Bedante

Tipos de análise | Análise de corpus textual

12

Análise Lexográfica (Estatísticas Básicas)

• Identifica e reformata as unidades de texto

• Identifica a quantidade de palavras, frequência média e hapax (palavras comfrequência um)

• Pesquisa o vocabulário e reduz das palavras com base em suasraízes (formas reduzidas)

• Cria do dicionário de formas reduzidas

• Identifica formasativas e suplementares

PPGA FEA-USPGabriel Navarro Bedante

* CARVALHO, M. S. & STRUCHINER, C. J. Correspondence Analysis: An Application of the Method to the Evaluation of Vaccination Services. Cad. Saúde Públ, Rio de Janeiro, 8 (3): 287-301, jul/set, 1992

Tipos de análise | Análise de corpus textual

14

Especificidades e Análise Fatorial de Correspondência (AFC)

• A analise de correspondência é especialmente indicada para descrever matrizes com grande volume de dados discretos e sem uma estrutura claramente definida a priori*

• É realizada uma análise fatorial retomando as frequências e os valores de correlação Qui2 de cada palavra do Corpus.

• No exemplo são apresentadas as palavras que se destacam tendo em vista a variável selecionada (no caso, Indústria)

Ind_Tecn

Ind_VareInd_Cons

Ind_Mpmt

Ind_Agen

PPGA FEA-USPGabriel Navarro Bedante

Tipos de análise | Análise de corpus textual

15

Classificação Hierárquica Descendente (CHD) 1/2

• Umas das análises mais importantes do Iramuteq

• Segmentos de texto e vocabulário são correlacionados formando um esquema hierárquico de classes

• Esta análise visa obter classes de segmentos de texto que, ao mesmo tempo, apresentam vocabulário semelhante entre si, e vocabulário diferente dos segmentos de texto das outras classes (Camargo, 2005)

Number of texts: 9Number of text segments: 958Number of forms: 4160Number of occurrences: 33406Número de lemas: 2681Number of active forms: 2394Número de formas suplementares: 27Número de formas ativas com a frequência >= 3: 917Média das formas por segmento: 34.870564Number of clusters: 4901 segments classified on 958 (94.05%)

Mínimo de 70%

Ramificação 1 Ramificação 2

PPGA FEA-USPGabriel Navarro Bedante

* A teoria dos grafos é um ramo da matemática que estuda as relações entre os objetos de um determinado conjunto.

Tipos de análise | Análise de corpus textual

17

Análise de Similitude

• Baseia-se na teoria dos grafos* (Marchand & Ratinaud, 2012) e é utilizada frequentemente por pesquisadores das representações sociais (cognição social)

• Possibilita identificar as coocorrências entre as palavras e seu resultado traz indicações da conexidade entre as palavras

Grafo com 6 vértices e 7 arestas

PPGA FEA-USPGabriel Navarro Bedante

Fonte: Google; Análise do autor

Exemplo de análise | Análise Qualitativa Google

Informações Gerais

• Número de textos: 1• Número de segmentos de texto: 39• Número de formas: 497• Número de ocorrências: 1450• Número de formas ativas: 254• Número de clusters: 3• 34 segmentos classificados em 39

(87.18%) - Retenção mínima de 75% dos segmentos de texto

2,92x

FONTE DE DADOS BASE DE DADOS CLASSIFICADA (IRAMUTEQ)

ACME

PPGA FEA-USPGabriel Navarro Bedante

Exemplo de análise | Análise Qualitativa Google

Classificação Hierárquica Descendente (CHD)

2ª UTILIZAÇÃO E

CANCELAMENTO

1ª CANAIS DE

COMUNICAÇÃO

3ª CENTRAL DE

ATENDIMENTO

ATENDIMENTO

3 classes se mostraram estáveis, ou seja, compostas de unidades de segmentos de texto com vocabulário semelhante

PPGA FEA-USPGabriel Navarro Bedante

Exemplo de análise | Análise Qualitativa Google

À 1ª Classe foi arbitrariamente dado o nome de “Canais de Comunicação”

“atendimento por telefone que não resolve nada”

“chat piorou mudam suas formas de pagamento sem sua

autorização péssimos”

“não é ruim não o cartão em si mas

precisam arruma este site urgente”

“não tem como falar por telefone ligando

de um celular”

“não mandam fatura por email...absurdo”

2ª UTILIZAÇÃO E

CANCELAMENTO

1ª CANAIS DE

COMUNICAÇÃO

3ª CENTRAL DE ATENDIMENTO

ATENDIMENTO

PPGA FEA-USPGabriel Navarro Bedante

Exemplo de análise | Análise Qualitativa Google

Na 2ª Classe as palavras aceitação e cancelamento aparecem em destaque... Uma análise seria que, pela dificuldade de utilização e aceitação, busca-se o usuário busca o cancelamento

“o limite de crediário e um e do cartão outro, muito inferior ao de crediário”

“muita dificuldade para aumentar o limite mesmo você pagando em dia”

“quero bloquear já faz 1 mês e nada”

“a gente passa maior vergonha nos lugares

quando vai passar”

“cartão que não é aceito em mais de 2

milhões de estabelecimento”

2ª UTILIZAÇÃO E

CANCELAMENTO

1ª CANAIS DE

COMUNICAÇÃO

3ª CENTRAL DE ATENDIMENTO

ATENDIMENTO

PPGA FEA-USPGabriel Navarro Bedante

Exemplo de análise | Análise Qualitativa Google

Pontos relacionados à Central de Atendimento ficaram em destaque na 3ª Classe

“me disse que chegaria um boleto para o pagamento e não chegou fui no site e não

consegui tirar a 2 via do boleto”

“5 vezes sendo que 4 vezes eu fiquei escutando uma música que dava sono que deve ser proposital

para gente desistir mesmo e na 5 finalmente consegui falar com uma atendente”“fiz cartão em uma loja dia 2 de setembro e não me

enviaram o cartão ou qualquer boleto de cobrança até que hoje me ligaram cobrando o valor com juros

por atraso da cobrança”

“uma informação simples como extrato ou consulta de saldo eles não conseguem dar”

2ª UTILIZAÇÃO E

CANCELAMENTO

1ª CANAIS DE

COMUNICAÇÃO

3ª CENTRAL DE ATENDIMENTO

ATENDIMENTO

PPGA FEA-USPGabriel Navarro Bedante 31

Fontes utilizadas

Vídeos no Youtube

• LEPP-Saúde LEPP-Saúde

- 1. Instalação - https://www.youtube.com/watch?v=SoOzkpSedgQ&t=246s

- 2 Preparando banco de dados textuais - https://www.youtube.com/watch?v=ygKct1ps_2Y&t=9s

- 3 Funcionamento - https://www.youtube.com/watch?v=B-k6AatfIyM&t=339s

- 4. Estatísticas textuais - https://www.youtube.com/watch?v=T6LMIYxNJlA

- 5. Classificação Hierárquica Descendente - https://www.youtube.com/watch?v=H9xliY7Zy40&t=476s

- 6. Análise Fatorial Confirmatória (AFC) - https://www.youtube.com/watch?v=bEihghhSK-8

- 7. Análise de similitude - https://www.youtube.com/watch?v=F47NgaAbipI

- 8. Nuvem de palavras - https://www.youtube.com/watch?v=04GMBuyi-G8

- 9. Análise de matriz - https://www.youtube.com/watch?v=tYCTiH2PEJI

• Laboratório de Políticas Públicas Participativas

- Como instalar - https://www.youtube.com/watch?v=e8SxNOjYFPc

- Como usar - https://www.youtube.com/watch?v=e8SxNOjYFPc

A melhor!

top related