pesquisa aplicada a comunicação cap-6

153
PESQUISA PESQUISA DE DE MARKETING MARKETING Edição Compacta Edição Compacta Prof. Dr. Fauze Najib Mattar Prof. Dr. Fauze Najib Mattar

Upload: prof-sergio-duarte

Post on 25-Jul-2015

249 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pesquisa Aplicada a Comunicação cap-6

PESQUISA PESQUISA DE DE

MARKETINGMARKETING

Edição CompactaEdição Compacta

Prof. Dr. Fauze Najib MattarProf. Dr. Fauze Najib Mattar

Page 2: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

2

Capítulo 6 – Análise de Dados

Page 3: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

3

Escolha do método

Análise de Dados

Muitas pesquisas de marketing têm apresentado

conclusões baseadas em resultados obtidos com a

utilização incorreta de técnicas de análises,

comprometendo, dessa forma, sua qualidade,

precisão e confiabilidade.

Page 4: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

4Análise de Dados

Fatores a considerar na escolha do método de análise

Tipo de escala da variável.

Nível de conhecimento dos parâmetros da população.

Tipo de análise desejada.

Número de variáveis a serem analisadas conjuntamente.

Número de amostras e seu grau de relacionamento.

Relação de dependência entre as variáveis.

Page 5: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

5Análise de Dados

Tipo de escala

Em função das diferentes características das

escalas, as técnicas possíveis de serem utilizadas na

análise variam conforme a escala seja nominal,

ordinal, intervalar ou razão (Cap. 3).

Page 6: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

6Análise de Dados

Nível de conhecimento dos parâmetros da população

Uma técnica estatística é paramétrica quando o

modelo do teste especifica certas condições sobre os

parâmetros da população da qual a amostra foi

obtida, para que possa ser utilizada.

Uma técnica estatística não paramétrica é aquela que

compreende um teste cujo modelo não especifica

condições sobre os parâmetros da população da qual

a amostra foi obtida.

Page 7: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

7Análise de Dados

Nível de conhecimento dos parâmetros da população(continuação)

Exemplo:

Exigências a serem atendidas na aplicação do teste paramétrico t:

as observações precisam ser independentes; as amostras precisam ter sido retiradas de populações

com distribuições normais; as populações precisam ter as mesmas variâncias (ou a

relação entre as variâncias conhecida); as variáveis em estudo precisam ter sido medidas ao

menos numa escala de intervalo que possibilite as

quatro operações aritméticas.

Page 8: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

8Análise de Dados

Tipo de análise

Métodos descritivos – têm o objetivo de proporcionar

informações sumarizadas dos dados contidos no total de

elementos da amostra estudada.

Métodos descritivos compreendem:Medidas de posição – servem para caracterizar o que é

“típico” no grupo.Medidas de dispersão – servem para medir como os

indivíduos estão distribuídos no grupo.Medidas de associação – servem para medir o nível de

relacionamento existente entre duas ou mais variáveis.

Page 9: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

9Análise de Dados

Tipo de análise(continuação)

Métodos inferenciais – compreendem um conjunto grande

de testes que servem para julgar a validade das hipóteses

estatísticas sobre uma população ou para estimar seus

parâmetros, a partir da análise dos dados de uma amostra

dessa população. Os métodos inferenciais são baseados na teoria das

probabilidades, de forma que a incerteza da inferência

pode ser medida, isto é, o risco de efetuar inferências

incorretas pode ser estabelecido. As técnicas inferenciais compreendem a estimação de

parâmetros e os testes de hipóteses.

Page 10: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

10Análise de Dados

Número de variáveis a serem analisadas simultaneamente

Se o número de variáveis for respectivamente uma,

duas ou mais de duas, o pesquisador encontrará

métodos específicos aplicáveis a cada situação,

denominados de:univariados;

bivariados; multivariados.

Page 11: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

11 Análise de Dados

Número de amostras a analisar e grau de relacionamento entre elas

Possibilidades: amostra simples; duas amostras relacionadas; duas amostras não relacionadas; amostras múltiplas relacionadas;amostras múltiplas não relacionadas.

Page 12: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

12Análise de Dados

Número de amostras a analisar e grau de relacionamento entre elas

(continuação)

Amostras relacionadas e não relacionadas - diz

respeito a se a escolha de um elemento para fazer

parte da amostra interfere na probabilidade de

escolha de outro ou se o resultado da avaliação de

qualquer elemento da amostra possa ter interferido

na avaliação de outro.

Page 13: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

13Análise de Dados

Relação de dependência entre as variáveis

Nos casos em que houver mais de uma variável a ser analisada simultaneamente, um fator também determinante para a escolha da técnica adequada de análise é a relação de dependência existente entre as variáveis.

As variáveis podem ter entre si uma relação de

dependência ou de interdependência.

Page 14: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

14 Análise de Dados

Relação de dependência entre as variáveis(continuação)

Numa relação de dependência, uma (ou mais de uma) das variáveis é escolhida, segundo as condições estabelecidas pelo problema de pesquisa, para ser examinada, no sentido de se verificar sua dependência de outras variáveis.

Numa relação de interdependência, o interesse está em verificar o relacionamento existente entre as próprias variáveis do conjunto, não sendo nenhuma escolhida, em especial, como sendo a variável dependente.

Dos métodos descritivos de análise dos dados, as medidas

de posição e as medidas de dispersão dependem apenas

do tipo de escala de medição da variável sob análise.

Page 15: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

15Análise de Dados

Métodos descritivos de análise de dados

Medidas de posição e de dispersão para variáveis em escalas nominais, ordinais e intervalares mais utilizadas em pesquisas de marketing

Escala davariável

Medidas de

Posição Dispersão

Nominal Moda Distribuição de freqüências (absoluta e relativa)

Ordinal MedianaQuartis, decis e percentis

Ordenamento

Intervalar ou Razão

Média aritmética Distribuição de freqüência acumulada (absoluta e relativa)Amplitude Desvio-médioDesvio-padrãoCoeficiente de variação

Obs.: As medidas apresentadas são cumulativas, em cada coluna, no sentido de cima para baixo, isto é, todas as medidas aplicáveis às variáveis com escalas nominais são também aplicáveis àquelas com escalas ordinais, e todas as aplicáveis às variáveis com escalas ordinais o são também àquelas com escalas intervalares.

Page 16: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

16Análise de Dados

Medidas de posição

Tendência central

Média

Moda

Mediana

Separatrizes

Quartil

Decil

Percentil

Divisão das medidas de posição

Observação: o segundo quartil = mediana

Page 17: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

17Análise de Dados

Dados nominais

Moda é o valor ou categoria da variável que ocorre com a maior frequência.

É uma medida típica de tendência central para variáveis nominais.

Pode ser aplicada a variáveis ordinais ou intervalares, desde quem tenham sido agrupadas em classes.

A classe que obtiver maior frequência é denominada classe modal.

Page 18: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

18Análise de Dados

Exemplo de determinação da moda

Empresa de transporteaéreo preferida

Freqüênciaabsoluta

A 20

B 40

C 10

D 30

E 50

F 10

G 60 (moda)

Total 220

Page 19: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

19Análise de Dados

Dados ordinais

Mediana é o valor da variável que divide o grupo em dois subgrupos de igual tamanho (é o valor da variável correspondente ao elemento central da distribuição; corresponde ao 2° quartil)).

É uma medida típica de tendência central para variáveis ordinais.

Pode ser aplicada a variáveis intervalares.

Page 20: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

20Análise de Dados

Dados ordinais (continuação)

Determinação do valor da mediana:

ordenar numericamente os dados;

procurar o valor da variável correspondente ao elemento que divide o grupo em dois subgrupos quando a amostra tiver número ímpar de elementos;

procurar a média dos valores dos dois elementos centrais, quando a amostra possuir um número par de elementos.

Page 21: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

21Análise de Dados

Dados ordinais(continuação)

Quartis são os valores da variável correspondentes aos três elementos

que dividem o conjunto de dados ordenados em quatro subgrupos de

tamanhos iguais.

São chamados, respectivamente, de: 1º quartil – o valor da variável que divide os elementos do grupo em 25% e 75%; 2º quartil – o valor da variável que divide os elementos do grupo em 50% e 50%; 3º quartil – o valor da variável que divide os elementos do grupo em 75% e 25%.

Decis e percentis são os valores da variável correspondentes aos

elementos que dividem o conjunto de dados ordenados em 10 e 100

partes iguais, respectivamente.

Page 22: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

22

Onde:

Qn = valor do quartil que se deseja calcular;

Q1 = 1º quartil;

Q2 = 2º quartil = Mediana;

Q3 = 3º quartil;

ν = valor médio do intervalo de classe em que o quartil está situado;

Q = frequência relativa acumulada do quartil a ser calculado. Assim, Q = 0,25 para o 1º quartil, Q = 0,50 para a mediana e Q = 0,75

para o 3º quartil;

Frac= frequência relativa acumulada até a classe anterior à do quartil considerado;

Frel= frequência relativa da classe em que o quartil está situado.

Análise de Dados

Fórmula para cálculo dos quartis:

Qn = ν + (Q – Frac) / Frel

Dados ordinais(continuação)

Page 23: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

23Análise de Dados

Média aritmética (ou simplesmente média) corresponde

ao valor médio de um conjunto de dados.

É uma medida de tendência central de aplicação exclusiva

a variáveis intervalares.

Existem duas fórmulas para o cálculo da média,

dependendo da forma de apresentação dos dados.

Dados intervalares

Page 24: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

24

População

∑ Xi

Ni=1

N

µ =

Amostra

∑ xi

ni=1

n

x =

Fórmula para o cálculo da média para dados que não

estejam na forma de distribuição de freqüências:

Análise de Dados

Fórmula para o cálculo da média para dados que estejam

na forma de distribuição de freqüências:

População

Ni=1

N

µ =

Amostra

ni=1

n

x =

fi Xixifi

Fórmulas para o cálculo da média

Page 25: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

25Análise de Dados

As medidas de tendência central informam a respeito do

ponto de concentração da maioria das respostas, porém

não informam nada a respeito do grau de concentração

dessas respostas, nem da maneira como as observações

estão dispersas por toda a distribuição.

O conhecimento da dispersão dos dados de uma variável

permite avaliar a confiabilidade de uma medida de

tendência central numa amostra como parâmetro da

população.

Medidas de dispersão

Page 26: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

26 Análise de Dados

A distribuição de freqüência absoluta é resultante da

contagem das ocorrências de respostas por opção possível

da variável.

A distribuição de freqüência relativa é resultante da

divisão da freqüência absoluta de cada opção pelo total de

elementos da amostra.

Constituem as únicas medidas de dispersão que podem ser

aplicadas a variáveis nominais.

Variáveis nominais

Page 27: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

27Análise de Dados

Ordenamento é a disposição de todos os elementos

do grupo de forma crescente ou decrescente,

segundo as avaliações efetuadas para a variável

ordinal pesquisada.

Variáveis ordinais

Page 28: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

28Análise de Dados

Uma rede de supermercados deseja avaliar o quanto três

de suas lojas estão agradando a seus clientes, para, em

função dos resultados, decidir em qual(ais) loja(s) devem

ser tomadas providências administrativas e

mercadológicas.

Para tanto, realizou uma pesquisa junto a 9

consumidores de cada uma das lojas, quanto a seu grau

de satisfação, avaliado através da atribuição de pontos

para um grande número de tópicos de um mesmo

instrumento.

Variáveis ordinais(continuação)

Exemplo:

Page 29: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

29Análise de Dados

Variáveis ordinais(continuação)

Dados brutos resultantes da avaliação do grau de satisfação em três lojas de uma rede de supermercados

Loja A Loja B Loja C

78 113 72

120 90 93

106 99 80

77 100 69

87 123 97

86 92 76

111 121 62

128 104 67

110 132 116

Page 30: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

30Análise de Dados

Variáveis ordinais(continuação)

Uma forma comumente encontrada em pesquisas de marketing é efetuar a soma das pontuações na vertical e comparar os resultados, e a partir desses resultados decidir qual (ais) loja (s) merece (m) mudanças.

Por tratar-se de uma variável ordinal, esta prática está conceitualmente errada.

A prática correta é proceder a um ordenamento conjunto, somar na vertical as várias posições ocupadas no ordenamento conjunto e, somente a seguir, comparar os resultados e tomar as decisões.

Page 31: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

31Análise de Dados

Variáveis ordinais(continuação)

Resultados do ordenamento conjunto da avaliação do grau de satisfação em três lojas de uma rede de supermercados

Loja A Loja B Loja C

21 7 24

5 17 15

10 13 20

22 12 25

18 3 14

19 16 23

8 4 27

2 11 26

9 1 6

Total 114 84 180

Page 32: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

32Análise de Dados

A distribuição de freqüência absoluta acumulada é resultante

da contagem acumulativa da ocorrência de respostas até

determinado valor da variável.

A distribuição de freqüência relativa acumulada é resultante

da divisão da freqüência absoluta acumulada pelo total de

elementos da amostra.

Constituem medidas de dispersão exclusivas de serem

aplicadas a variáveis intervalares.

Variáveis intervalares

Page 33: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

33Análise de Dados

Amplitude de uma distribuição é uma medida de dispersão típica de variáveis intervalares.

A amplitude é a diferença entre o maior e o menor valor da variável observados numa amostra.

A amplitude fornece a dimensão do campo de variação da variável.

Variáveis intervalares(continuação)

Fórmula para o cálculo da amplitude:

A = xmaior – xmenor

Page 34: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

34

População

i=1

N

DM = ∑ Xi - µ

N

Amostra

i=1

n

DM = ∑ xi - x

n

Desvio-médioO desvio-médio é uma medida de dispersão típica de variáveis

intervalares e indica o grau de dispersão do total dos indivíduos num grupo, em relação a determinada variável.

O desvio-médio é a média aritmética das diferenças (em módulo, ou seja, despreza-se o sinal) entre cada observação e a média das observações.

Serve para comparar duas distribuições com igual média e saber qual das duas está mais ou menos dispersa.

Fórmula para o cálculo do desvio-médio:

Análise de Dados

Variáveis intervalares(continuação)

Page 35: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

35Análise de Dados

Variância é a soma dos quadrados das diferenças

entre cada observação e a média, dividida pelo

número de observações.

Desvio-padrão é a raiz quadrada da variância.

Variáveis intervalares(continuação)

Page 36: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

36Análise de Dados

Fórmula para o cálculo do desvio-padrão

Variáveis intervalares(continuação)

N

∑(X - µ)2

Dados em distribuição de freqüência

ComputacionalOriginalComputacionalOriginal

Dados brutos

AmostraPopulação

σ = Nσ =

N

∑x2∑X2 ∑Xn

∑(x - x)2

S = S = ∑x

nn

22

Nσ =

N∑f(X)2 ∑fX 2

nS =

n∑f(x)2 ∑fx 2

Page 37: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

37

AmostraCVa = S / x

PopulaçãoCVp = σ / µ

Coeficiente de variaçãoO desvio-padrão é uma medida absoluta da dispersão e é

apresentado nas mesmas unidades de medida originais em que os

dados foram coletados. Pode existir a necessidade da comparação da dispersão de

diversas distribuições que não possuam as mesmas médias ou

que não estejam nas mesmas escalas ou unidades de medida e

que, por isso, não podem ser feitas com os desvios-padrão. O coeficiente de variação permite efetuar essas comparações.O coeficiente de variação é uma medida abstrata da dispersão e é

obtido através da divisão do desvio-padrão pela média:

Análise de Dados

Variáveis intervalares(continuação)

Page 38: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

38

Métodos de inferência

A inferência diz respeito a como se podem assumir

conclusões para toda uma população a partir das

medições e da análise de apenas uma parte dela, de

forma que o risco de se realizarem conclusões

incorretas possa ser medido.

A inferência compreende dois tipos de problemas:

estimar os parâmetros de uma população;

realizar testes de hipóteses.

Análise de Dados

Page 39: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

39

Os métodos de inferência estatística possibilitam:

assumir, com determinada probabilidade conhecida de erro, a média (ou a porcentagem) calculada numa amostra como estimativa do parâmetro da população;

realizar os testes de hipóteses a respeito, por exemplo, da diferença da média entre duas distribuições.

Métodos de inferência(continuação)

Análise de Dados

Page 40: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

40

Testes de hipóteses

Procedimentos para realização do teste de hipóteses:

1. estabelecer a hipótese nula (H0) e a hipótese alternativa (H1), tendo em vista a hipótese da pesquisa;

2. selecionar o teste estatístico adequado à situação;

3. estabelecer um nível de significância;

4. determinar ou assumir a distribuição amostral da prova estatística sob a hipótese nula (H0);

Análise de Dados

Page 41: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

41

Testes de hipóteses(continuação)

Procedimentos para realização do teste de hipóteses:

5. com base em 2, 3 e 4 definir a região de rejeição da hipótese nula (H0);

6. calcular o valor da prova estatística a partir dos dados da (s) amostra (s) ;

7. tomar a decisão quanto à não-rejeição ou à rejeição da hipótese nula (H0) e, conseqüentemente, a adoção ou não da hipótese alternativa (H1).

Análise de Dados

Page 42: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

42

Métodos da inferência – testes estatísticos apropriados segundo os métodos estatísticos, as escalas de mensuração e o número de

amostras e seu relacionamento

Método

Escala de mensuração da variável

TESTES DE INFERÊNCIA

Uma amostra

Duas amostras Várias amostras

RelacionadasNão relacionadas

RelacionadasNão relacionadas

Não paramétricos

NominalBinomialχ2 Uma amostra

McNemar χ2 Duas amostras Cochran Q χ2 Várias amostras independentes

Ordinal

Kolmogorov-Smirnov

Wilcoxon MedianaMann-Whitney U Kolmogorov-Smirnov

Análise da variância por postos de Friedman

Mediana – várias amostras independentesAnálise da variância numa direção de Kruskal – Wallis

ParamétricosIntervalar ou Razão

zt

tr Diferença demédiasztRegressãot

Análise da variância

Análise de Dados

Page 43: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

43

Testes de hipóteses(continuação)

Regiões de rejeição para testes unicaudais e bicaudais

Região de aceitação

de H0

Região de aceitação

de H0

Região de rejeição

de H0

Região de rejeição

de H0

Região de rejeição

de H0

p = 0,05

p = 0,025p = 0,025

a. Região de rejeição de um teste unicaudal quando α = 0,05

b. Região de rejeição de um teste bicaudal quando α = 0,05

Análise de Dados

Page 44: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

44

A seguir, serão apresentados, como exemplo, três modelos de testes de hipóteses: teste para uma amostra; teste para duas amostras e teste para várias amostras, pois todos os outros testes seguem o mesmo padrão de raciocínio.

Testes de hipóteses(continuação)

Análise de Dados

Page 45: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

45

Teste para uma amostra – variável nominal

Teste qui-quadrado de uma amostra:

É utilizado em pesquisas de marketing para verificar se a distribuição de freqüência absoluta observada de uma variável em uma amostra é significativamente diferente da distribuição de freqüência absoluta esperada (teórica ou conhecida).

Exemplo de aplicação:Sabendo-se qual tem sido a distribuição da preferência dos consumidores em relação aos quatro tamanhos de embalagens de determinado produto, verificar se a distribuição da preferência observada numa amostra, nos tamanhos de embalagem, para uma nova marca do produto a ser lançada difere significativamente da distribuição conhecida.

Análise de Dados

Page 46: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

46

Teste para uma amostra – variável nominal(continuação)

Condições para utilização: Exclusivamente para variáveis nominais ou ordinais. Observações independentes. Não pode ser utilizado se mais de 20% das freqüências absolutas

forem inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos, a solução para possibilitar a utilização do teste é agrupar células até terem as condições atendidas.

Teoria/ Conceito: É uma prova do tipo aderência, isto é, o quanto a distribuição

observada (Oi) se ajusta à distribuição esperada (Ei). Através da comparação entre as Ois e as Eis, aceita-se ou

rejeita-se H0, a determinado nível de significância α.

Análise de Dados

Page 47: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

47

Teste para uma amostra – variável nominal(continuação)

Procedimento sumarizado do teste:1. Determinar H0 como sendo a negativa da existência de

diferenças entre a distribuição de freqüência observada e a esperada.

2. Estabelecer um nível de significância α.3. Distribuir as freqüências observadas Ois pelas k categorias e,

sob a hipótese H0, determinar a distribuição de freqüência esperada Eis pelas k categorias.

4. Determinar a região de rejeição de H0. Calcular os graus de liberdade (gl),

e procurar, a seguir, na Tabela C (SIEGEL, 1981, p. 280) o valor do qui-quadrado tabelado correspondente para α e gl.

Graus de liberdade: gl = k – 1, sendo k = número de categorias

Análise de Dados

Page 48: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

48

5. Decisão. Calcular o valor de qui-quadrado a partir dos Ois, segundo a fórmula:

Onde:

Oi = número de observações classificadas na categoria i; Ei = número de casos na categoria i, sob H0 (distribuição teórica);

Comparando o qui-quadrado calculado com o qui-quadrado tabelado, decidir-se pela aceitação ou rejeição de H0.

χ2 = ∑k

i=1

(Oi – Ei)2

Ei

∑k

i=1

(Oi – Ei)2 Ei

= somatório dos cálculos efetuados para todas as células, segundo a fórmula acima.

Teste para uma amostra – variável nominal(continuação)

Análise de Dados

Page 49: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

49

Teste para uma amostra – variável nominal(continuação)

Exemplo:

Um gerente de produto pretende verificar se a posição que o produto ocupa na prateleira dos supermercados tem influência sobre a quantidade vendida, através de um experimento.

Um supermercado possui, geralmente, prateleiras com sete divisões verticais, sendo a posição 1 correspondente à mais próxima do piso.

Para a realização do experimento, o gerente conseguiu que, durante um dia, todas as posições verticais da prateleira fossem ocupadas pelo seu produto.

Análise de Dados

Page 50: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

50

Posição

Total1 2 3 4 5 6 7

Vendas (unidades) Oi 10 11 15 25 29 19 17 126

Vendas (unidades) Ei 18 18 18 18 18 18 18 126

Com base nesses dados, o gerente quer saber se as diferenças verificadas nas posições são significativas, a ponto de poder montar, com sucesso, um plano para induzir os supermercadistas a colocar seu produto em determinadas posições.

Ao final do dia, as tabulações das vendas por posição foram as seguintes:

Teste para uma amostra – variável nominal(continuação)

Análise de Dados

Page 51: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

51

Procedimentos para o teste:

1. Determinação de: H0 = não há diferenças significativas entre as posições 4 e 5 na prateleira.

H1 = as diferenças observadas para as posições 4 e 5 são significativamente diferentes para melhor em relação às demais posições (Teste unicaudal).

2. Nível de significância α = 0,02.

3. Distribuição de freqüências esperadas sob H0. Se não houver diferenças entre as posições, a distribuição de freqüências será de 18 unidades por posição, conforme a tabela anterior.

Teste para uma amostra – variável nominal(continuação)

Análise de Dados

Page 52: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

52

4. Região de rejeição. Para α = 0,02 e gl = 7 – 1 = 6, o valor (Tabela C, SIEGEL, 1981, p. 280) de qui-quadrado tabelado é 15,03. Portanto, a região de rejeição é a correspondente a todas as ordenadas maiores ou iguais a 15,03 para o qui-quadrado calculado.

5. Decisão.Cálculo de qui-quadrado =

{(10 – 18)2 + (11 – 18)2 + (15 – 18)2 + (25 – 18)2 + (29 – 18)2 + + (19 – 18)2 + (17 – 18)2} / 18 = 16,3

Tendo em vista que o qui-quadrado calculado (16,3) é maior que o tabelado (15,03), rejeitamos H0 em prol de H1. Portanto, há diferença significativa, no nível de 0,02, para as posições 4 e 5 nas prateleiras dos supermercados e, por isso, o gerente deve realizar o plano promocional.

Teste para uma amostra – variável nominal(continuação)

Análise de Dados

Page 53: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

53

Teste para duas amostras não relacionadas – variável nominal(continuação)

Teste qui-quadrado para duas ou mais amostras (o caso de mais de duas amostras foi juntado, pois a metodologia é a mesma):

É utilizado em pesquisas de marketing para verificar se as distribuições absolutas de duas ou mais amostras não relacionadas diferem significativamente em relação a determinada variável.

Exemplo: verificar se as classes socioeconômicas diferem significativamente no consumo de determinado produto; verificar se a escolha do tamanho do automóvel difere significativamente em função do tamanho da família etc.

Análise de Dados

Page 54: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

54

Teste para duas amostras não relacionadas – variável nominal(continuação)

Condições para utilização:

Dados nominais. Distribuição dos dados em freqüências absolutas. Amostras não relacionadas ou independentes. Não pode ser utilizado se mais de 20% das freqüências absolutas forem

inferiores a 5 ou se qualquer freqüência for inferior a 1. Nestes casos, a solução para tornar a utilização do teste possível é agrupar células até ter as condições atendidas.

Análise de Dados

Teoria/ Conceito:

A prova qui-quadrado para duas ou mais amostras não relacionadas é, semelhantemente à prova qui-quadrado de uma amostra, uma prova não paramétrica do tipo aderência, isto é, o quanto a distribuição observada (Oi) se ajusta à distribuição esperada (Ei). Através da comparação entre as Ois e Eis, aceita-se ou rejeita-se H0, em determinado nível de significância α.

Page 55: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

55

Procedimento sumarizado do teste:

1. Determinar H0 como sendo a negativa da existência de diferenças entre a distribuição de freqüência absoluta observada e a esperada.

2. Estabelecer um nível de significância α.

3. Distribuir as freqüências absolutas das r variáveis pelas j categorias. Sob a hipótese H0, determinar a distribuição de freqüência absoluta esperada das r variáveis pelas k categorias. Verificar se as restrições ao uso do qui-quadrado quanto ao número de freqüências por células não estão ocorrendo.

4. Determinar a região de rejeição de H0. Determinar os graus de liberdade (gl), sendo r o número de linhas e k o número de colunas.

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

Graus de liberdade: = gl = (r – 1) (k – 1)

Procurar a seguir, na Tabela C (SIEGEL, 1981, p. 280) o valor do qui-quadrado tabelado ( χ2) correspondente para α (teste unicaudal) ou α/2 (teste bicaudal) e gl. Todos os valores maiores ou iguais ao valor tabelado correspondem a ordenadas da região de rejeição de H0.

t

Page 56: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

56Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

5. Decisão. Calcular o valor de qui-quadrado utilizando a seguinte fórmula:

Onde:

Oij = número de observações classificadas, simultaneamente, na linha i e na coluna j;

Eij = número de casos esperados simultaneamente na linha i e na coluna j , sob H0 (distribuição teórica);o cálculo de cada Eij é obtido pela multiplicação do total de observações da linha pelo total de observações da coluna, dividido pelo total de observações.

χ2 = ∑r

i=1

(Oij – Eij )2

Eij

c∑k

j=1

∑r

i=1= somatório dos cálculos efetuados para todas as r linhas e k colunas,

segundo a fórmula apresentada.∑k

j=1

Comparando o qui-quadrado calculado com o qui-quadrado tabelado decidir- se pela aceitação ou rejeição de H0. Se χ2 ≥ χ2 , rejeita-se H0.c t

Page 57: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

57

Exemplo:

Um gerente de concessionárias de uma montadora de automóveis, analisando o desempenho de suas 417 concessionárias, em relação, simultaneamente, a inúmeros itens, classificou-os em baixo, médio e alto desempenho.

A empresa mantém um intenso programa de treinamento dirigido aos proprietários e aos funcionários das concessionárias.

Esse mesmo gerente, analisando os quadros de atendimento aos programas de treinamento, notou que um grande número de concessionárias não tem atendido regularmente aos programas.

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

Page 58: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

58

Exemplo:

Interessado em saber se há relação entre o atendimento aos programas de treinamento e o desempenho das concessionárias, solicitou que as duas informações fossem cruzadas, o que resultou na seguinte tabela:

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

Atendimento do treinamento

Desempenho da

concessionária

Não Sim Totais

Oij Eij Oij Eij

Baixo 14 7,3 7 13,7 21

Médio 21 19,1 34 35,9 55

Alto 110 118,6 231 222,4 341

Totais 145 272 417

Page 59: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

59

Procedimentos para o teste:1. H0 = não existe diferença significativa entre o desempenho das

concessionárias que atenderam aos programas de treinamento e o das que não.

H1 = há diferenças significativas entre as concessionárias que atenderam aos programas de treinamento e as outras (Teste unicaudal).

2. Nível de significância α = 0,01.

3. A distribuição das freqüências absolutas observadas (Oij) das r variáveis pelas k categorias corresponde à tabela anterior solicitada ao gerente. Sob a hipótese H0, a determinação da distribuição de freqüência absoluta esperada (Eij) das r variáveis pelas k categorias segue o seguinte raciocínio: supondo que o nível de desempenho seja designado pela variável A e o atendimento ao treinamento pela variável B, teremos as seguintes possibilidades:

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

Page 60: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

60

Procedimentos para o teste:

A1 = Baixo desempenho. A2 = Médio desempenho. A3 = Alto desempenho. B1 = Não-atendimento ao treinamento. B2 = Atendimento ao treinamento. Como as variáveis A e B são independentes, então a probabilidade de ocorrer o evento A1B1 (concessionárias com baixo desempenho e que não atenderam ao treinamento) é dada pelo produto das probabilidades independentes para A1 e B1: P(A1 B1) = P(A1) P(B1) P(A1) = 21/ 417 e P(B1) = 125/ 41 e P(A1B1) = 21/ 417 125/ 417 = 7,3, que corresponde à freqüência absoluta esperada da respectiva célula. E assim, sucessivamente, calculamos todas as demais.

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

×

Page 61: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

61

Assim, para a mesma célula já calculada, teríamos:Eij = 21 x 145/ 417 = 7,3Efetuando todos os cálculos, teremos os dados constantes da tabelaanterior, com as freqüências absolutas observadas e esperadas.

A seguinte fórmula facilita esses cálculos:

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

Eij = A multiplicação do total de observações da linha pelo total de observações da coluna dividido pelo total de observações.

4. Determinação da região de rejeição de H0. Procurar na tabela de qui-quadrado o valor correspondente a α = 0.01

e gl = (3 – 1) (2 – 1) = 2. Esse valor é χ2 = 9,21. Desta forma, todas as ordenadas com valores maiores ou iguais estarão na região de rejeição

de H0.

t

Page 62: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

62

5. Decisão. Calcular o valor do qui-quadrado a partir das Oijs e das Eijs, segundo a fórmula apresentada:

= (14 – 7,3)2/ 7,3 + (21 – 19,1)2/ 19,1 + (110 – 118,6)2/ 118,6 +

+ (7 – 13,7)2/ 13,7 + (34 – 35,9)2/35,9 + (231 – 222,4)2/222,4

Como o qui-quadrado calculado (10,67) é maior que o tabulado (7,3) para α = 0,02, H0 é rejeitada em favor de H1. Portanto, no nível de confiança de α = 1,01, as concessionárias que atenderam aos programas de treinamento tiveram um desempenho significativamente melhor do que as outras.

Análise de Dados

Teste para duas amostras não relacionadas – variável nominal(continuação)

t(χ2)

cχ2

= 10,67

cχ2

Page 63: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

63

Teste para várias amostras não relacionadas – variável ordinal

Análise da variância por classificação numa só direção de Kruskal-Wallis:

A utilização em pesquisas de marketing da análise da variância de Kruskal-Wallis é a mesma do teste Mann-Whitney U para situações em que amostras de mais de duas variáveis independentes estejam sendo comparadas.

É a contrapartida não paramétrica da análise da variância num só sentido, cuja utilização exige que as distribuições das populações sejam normais e com variâncias homogêneas.

Análise de Dados

Page 64: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

64

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Condições para utilização:

Serve para a comparação de três ou mais variáveis independentes.

Medições ao menos ordinais.

Escalas de medição idênticas nos diversos grupos.

Os dados precisam ser ordenados.

Análise de Dados

Page 65: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

65

Teoria/ Conceito:

O procedimento para o teste compreende a combinação dos escores das n amostras num único rol ordenado do maior para o menor escore, numerados, respectivamente, de 1 a n.

A seguir, todas as classificações obtidas para os escores de cada amostra são somadas.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Quanto mais parecidas forem essas somas, mais parecidas serão as amostras e, conseqüentemente, as populações de onde foram extraídas; analogamente, quanto mais diferentes forem, mais diferentes serão as amostras e a população de onde foram extraídas.

O teste Kruskal-Wallis determina se as somas dos escores são tão diferentes que as amostras e as populações de onde foram extraídas não são idênticas, a determinado nível de confiabilidade.

Análise de Dados

Page 66: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

66

Procedimento sumarizado do teste:1. Definir H0 como não havendo diferenças entre os escores das

n variáveis consideradas.2. Definir um nível de confiabilidade α para a realização do

teste.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

3. Para amostras com tamanho n > 5, sob H0, a estatística de H, usada para o cálculo do teste, é dada pela seguinte fórmula, cuja distribuição é a mesma de qui-quadrado com gl = k – 1:

H = 12n(n+1)

∑ R2

nj

- 3(n+1)j=1

kj

Onde: k = número de amostras;

nj = número de casos na j-ésima coluna; n = número de casos na combinação de todas as amostras; Rj = soma das classificações na j-ésima amostra;

k

∑j=1

R2

nj

j = soma de todos os quadrados de Rj divididos por nj

Análise de Dados

Page 67: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

67

Procedimento sumarizado do teste:

4. Região de rejeição. Corresponde a todos os valores de H calculados que forem maiores ou iguais ao qui-quadrado tabelado (Tabela C, SIEGEL, 1981, p. 280) para a e gl = k – 1.

5. Decisão. Calcular o valor de H utilizando a fórmula anteriormente apresentada.

Se H for maior ou igual ao qui-quadrado tabelado para α e gl = k – 1, rejeite H0 em prol de H1.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Análise de Dados

Page 68: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

68

Exemplo:

Para verificar a necessidade de reformulações em três de suas lojas, uma cadeia de supermercados encomendou uma pesquisa para avaliar o grau de satisfação dos consumidores de cada uma das lojas.

A escala utilizada pela agência de pesquisa foi a do tipo Likert, composta por uma série de afirmações às quais os consumidores apontam o seu grau de concordância.

De cada uma das três lojas foram selecionados aleatoriamente nove consumidores.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Análise de Dados

Page 69: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

69

Avaliações Ordenação conjunta

A B C A B C

78 113 72 21 7 24

120 90 93 5 17 15

106 99 80 10 13 20

77 100 69 22 12 25

87 123 97 18 3 14

86 92 76 19 16 23

111 121 62 8 4 27

128 104 67 2 11 26

110 132 116 9 1 6

Totais 114 84 180

Resultado tabulado das avaliações efetuadas

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Análise de Dados

Page 70: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

70

Procedimentos para o teste:

1. H0 = não há diferenças na satisfação dos consumidores em relação às três lojas consideradas.

2. H1 = há diferenças significativas na satisfação dos consumidores das três lojas (Teste bicaudal).

3. α = 0,10.

1. A distribuição de H, para H0 , é a mesma de qui-quadrado com gl =3 – 1 = 2.

1. Região de rejeição. Corresponde a todos os valores de H calculados que forem maiores ou iguais ao qui-quadrado tabelado para α/ 2 = 0,05 e gl = 2. Portanto, a região de rejeição é compreendida por todos os valores maiores ou iguais a 5,99.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Análise de Dados

Page 71: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

71

Procedimentos para o teste:

5. Decisão. Calculando o valor de H, utilizando a fórmula:

teremos:

Hc

Hc

Hc

=

=

=

1227(27+1)

842

9 - 3(27+1)

12 756

12.946 +7.056 + 32.400 9

- 84

1142

91802

9 +

8,51

+

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Hc = 12n(n+1)

∑j=1

kR2

nj

j - 3(n+1)

Análise de Dados

Page 72: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

72

Procedimentos para o teste:

Conclusão: Como Hc = 8,51 é maior que o qui-quadrado tabelado = 5,99, rejeitamos H0 em prol de H1.

Portanto, há diferenças significativas, no nível de 0,10, no grau de satisfação dos consumidores para as três lojas, sendo a loja C a que apresenta maiores problemas, seguida pela loja A. A loja C deveria receber reformulações no seu funcionamento.

Teste para várias amostras não relacionadas – variável ordinal(continuação)

Análise de Dados

Page 73: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

73

Inferência estatística

Dois diferentes testes de inferência estatística são apropriados para variáveis intervalares: o teste z e o teste t.

A escolha entre um e outro dependerá do conhecimento do desvio‑padrão da população e do tamanho da amostra.

Esses testes são utilizados em hipóteses a respeito da média da população, das diferenças entre médias, das proporções na população, das diferenças entre proporções e do coeficiente de regressão.

Análise de Dados

Page 74: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

74

Teste da média para uma amostra – variável intervalar

Teste z:

O teste z é utilizado em pesquisas de marketing para comparar a média de uma amostra com a média hipotética da população e decidir com base na média da amostra se a média hipotética da população pode ser aceita como verdadeira.

Análise de Dados

Page 75: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

75

Teste da média para uma amostra – variável intervalar(continuação)

Condições para utilização:

Exclusivamente para variáveis intervalares.

Qualquer tamanho da amostra se o desvio‑padrão da população for conhecido.

Somente para amostras de tamanho igual ou maior do que 30 elementos, se o desvio‑padrão da população não for conhecido. Para amostras de tamanho menor do que 30, o teste t será o mais recomendado.

Análise de Dados

Page 76: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

76

Teoria/ Conceito:

O teste consiste em verificar se a média obtida na amostra (х) pode ser aceita como a média hipotética da população (µ).

_

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 77: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

77

Procedimento sumarizado do teste:1. Determinar H0 como sendo a média da amostra igual à média hipotética

da população (ou a negativa da existência de diferença entre essas duas médias). Conseqüentemente, H1, a hipótese alternativa, será a existência de diferença entre essas duas médias (Teste bicaudal). Ou que a média da amostra é maior (ou menor) que a média hipotética da população (Teste unicaudal).

2. Estabelecer um nível de significância.3. Calcular os valores de z, segundo as fórmulas:

Caso 1: a variância da população é conhecida:

Zc = х - µ σx

-

_Zc = х - µ

σ/ n

_ou

Onde: x_

µ

σx-

=

=

=

média da amostra;

média hipotética da população;

desvio-padrão da média que é igual a σ/ n, onde n é o tamanho da amostra e σ, o desvio-padrão da população.

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 78: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

78

Procedimento sumarizado do teste:

Zc = х - µ Sx

-

_Zc = х - µ

S/ n

_ou

x_

µ

Sx-

Onde: =

=

=

média da amostra;

média hipotética da população;

estimativa do desvio-padrão da média que é igual a S/ n, onde n é o tamanho da amostra e S, a estimativa do desvio-padrão da população.

Teste da média para uma amostra – variável intervalar(continuação)

Caso 2: a variância da população é desconhecida:

Análise de Dados

Page 79: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

79

Procedimento sumarizado do teste:

4. Determinar a região de rejeição de z ao nível de significância α estabelecido. Procurar na tabela da distribuição padronizada de z o valor crítico Zt para o nível de significância estabelecido.

5. Decidir comparando os valores de Zc e Zt. Se o valor de Z calculado (Zc) for maior que de Z tabelado (Zt), a hipótese nula (H0) é rejeitada e a hipótese alternativa (H1) é aceita.

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 80: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

80

Procedimento sumarizado do teste:

Esses mesmos passos devem ser utilizados quando os dados forem apresentados em proporção, e a fórmula para z a ser utilizada quando o desvio-padrão da variância for conhecida e n > 30 é:

Onde:

p = proporção de ocorrência na amostra;

P = proporção hipotética de ocorrência na população;

S = desvio padrão da proporção;

n = número de elementos da amostra.

Z = p – P = p – P S pq/ n

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 81: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

81

Exemplo:

O comprador de uma rede de 500 farmácias está interessado em verificar a viabilidade de adotar a comercialização de uma nova marca de sabonete de um fornecedor tradicional.

Sua experiência anterior, em função da categoria do produto e da margem de comercialização oferecida, indica que para essa comercialização ser viável e lucrativa é necessário vender no mínimo uma média de 100 unidades/ loja/ dia.

O fornecedor concordou em fornecer uma partida do produto que permitiu a realização de um teste de vendas numa amostra probabilística de 32 lojas da rede.

Com base nos dados da tabela a seguir, o comprador deve decidir se adota ou não a comercialização dessa nova marca de sabonete.

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 82: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

82

Os resultados obtidos de vendas por lojaVendas Vendas

Loja x x2 Loja x x2

1 116 13.456 17 110 12.100

2 105 11.025 18 70 4.900

3 120 14.400 19 95 9.025

4 93 8.649 20 90 8.100

5 132 17.424 21 120 14.400

6 114 12.996 22 115 13.225

7 97 9.409 23 125 15.625

8 108 11.664 24 98 9.604

9 86 7.396 25 103 10.609

10 123 15.129 26 112 12.544

11 105 11.025 27 92 8.464

12 102 10.404 28 101 10.201

13 123 15.129 29 109 11.881

14 88 7.744 30 132 17.424

15 114 12.996 31 119 14.161

16 94 8.836 32 101 10.201

Teste da média para uma amostra – variável intervalar(continuação)

Análise de Dados

Page 83: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

83

Teste da média para uma amostra – variável intervalar(continuação)

Procedimento para o teste:1. Determinar H0: H0 = média é menor ou igual a 100. H1 = média é maior que 100. Portanto, um teste do tipo unicaudal.2. Estabelecer um nível de significância. Seja o nível de significância de

α = 0,05.3. Calcular os valores de z. Nesse caso, utilizamos a fórmula:

Zc = (x - µ) / Sx sendo Sx = S / n--_

x = ∑ xi / n = 3.412 / 32 = 106,625 _ n

i=1

Sx = 16,428-

Sx = ∑ (x)2 / n = 372.441 / 32 – 106,625 = 11.638,78 – 11.368,89 = 269,89-

Zc = (106,625 – 100) / (6,625 / (16,428 / 32)) = 6,625 / 2,904 = 2,281

Zc = 2,281

Análise de Dados

Page 84: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

84

Procedimento para o teste:

4. Determinar a região de rejeição de z. Procurar na tabela da distribuição padronizada de z o valor correspondente ao nível de significância de 0,05, que é, para o teste unicaudal, 1,65.

5. Decidir comparando os valores de Zc e Zt. Como o valor de Z calculado (2,281) é maior que o de Z tabelado (1,65), a hipótese nula (H0) é rejeitada e a hipótese alternativa (H1) é aceita para α = 0,05. Portanto, a nova marca de sabonete deverá ser aceita para ser comercializada pela rede de farmácias.

Teste da média para uma amostra – variável intervalar(continuação)

Observação:Teste t da média para uma amostra: a utilização em pesquisas de marketing do teste t é análoga à do teste z.

Análise de Dados

Page 85: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

85

Teste para duas amostras não relacionadas – variável intervalar

Teste z da diferença entre duas médias:

O teste z da diferença entre duas médias é utilizado em pesquisas de marketing para verificar se a diferença observada entre duas médias obtidas de amostras não relacionadas é suficientemente grande para ser considerada significativa.

Condições para utilização:

Exclusivamente para variáveis intervalares.

Medições devem ser efetuadas na mesma unidade ou escala.

Qualquer tamanho de amostras, se o desvio‑padrão da população for conhecido.

Para amostras de tamanho maior do que 30, se o desvio‑padrão da população não for conhecido. Se o tamanho da amostra for menor ou igual a 30, o teste recomendado é o t.

Análise de Dados

Page 86: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

86

Neste caso, o cálculo do teste será efetuado pela fórmula:

Z = (x1 – x2) – (µ1 - µ2)

σ x - x1 2-

_ _

-

Onde: x1 e x2 =médias das amostras 1 e 2, respectivamente;

µ1 e µ2 = as médias desconhecidas das populações 1 e 2, respectivamente, que sob H0 são idênticas;

σx – x =1 2

- - é o desvio-padrão da diferença das médias e é igual a:

σx - x = σ2 + σ2x1 x2

- -21

_ _

_ _

Teoria/ Conceito:O princípio que norteia este teste é o de que, se as médias

amostrais de duas populações são normalmente distribuídas, a distribuição de sua soma ou diferença também será normalmente distribuída, desde que as populações que lhes deram origem sejam normalmente distribuídas ou as amostras sejam maiores do que 30.

Teste para duas amostras não relacionadas – variável intervalar(continuação)

Análise de Dados

Page 87: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

87

Teoria/ Conceito:

Teste para duas amostras não relacionadas – variável intervalar(continuação)

Sendo: σ2x1

=σ2

1

n1

e σ2x2- =

σ2

2

n2

-

σx - x = σ2 + σ2- -21

Teremos:1 2

n1n2

Análise de Dados

Page 88: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

88

Exemplo:

Um fabricante de cigarros realizou uma pesquisa entre 100 fumantes em duas classes socioeconômicas e constatou que os fumantes da classe socioeconômica A/B fumam em média 20 cigarros/ dia e os da classe C/D uma média de 25 cigarros/ dia.

Sabe‑se de estudos anteriores que o desvio‑padrão da população de fumantes na classe A/B é 10 e na classe C/D é 14.

Esse fabricante deseja saber se a diferença verificada no consumo de cigarros entre as duas amostras deverá ser aceita como verdadeira na população ou atribuída apenas a variações eventuais.

Teste para duas amostras não relacionadas – variável intervalar(continuação)

Análise de Dados

Page 89: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

89

3. Calcular os valores de z utilizando as fórmulas apresentadas no item teoria/ conceito:

_ _Z = (x1 – x2) – (µ1 - µ2)

σx - x1 2- -

Teste para duas amostras não relacionadas – variável intervalar(continuação)

Procedimento para o teste:

1. Determinar H0 = não há diferença significativa entre fumantes das classes A/B e C/D, ou seja, µ1 = µ2.

H1 = há diferença significativa, ou seja, µ1 ≠ µ2. É um teste bicaudal.

2. Estabelecer um nível de significância. Seja o nível de significância de α = 0,05.

Análise de Dados

Page 90: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

90

Procedimento para o teste:

4. Determinar a região de rejeição de z. Procurar na tabela da distribuição padronizada de z o valor correspondente a 0,025 (0,05/ 2 por ser teste bicaudal), que é –1,96.

5. Decidir comparando os valores de Zc e Zt. Como o valor de Z calculado (–2,90) excede o de Z tabelado (–1,96) para 0,05 de significância, a hipótese nula (H0) é rejeitada e aceita‑se a hipótese alternativa H1. Portanto, há uma diferença estatisticamente significativa no nível de 0,05 no consumo médio diário de cigarros entre as duas classes consideradas.

Teste para duas amostras não relacionadas – variável intervalar(continuação)

Observação:Teste t da diferença entre duas médias: a utilização em pesquisa de marketing do teste t da diferença de duas médias é análoga à do teste z.

Análise de Dados

Page 91: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

91

Resumo dos testes z e t sobre inferências da média para uma amostra e duas amostras não relacionadas

Uma

amostra

σ desconhecidoσ conhecido

Z = x-

µσ

x

- ---

Z = x µ

σ

--

~ N(0,1)

n/

ou

n < 30

T

Z Z

e S =

utilizar a tabela t para gl = n - 1

(xi - x)

=

==

-x µSx

onde Sx =- S

n

--2

n

n ≥ 30

x - µ-

Sx- nS /

x - µ-

n qualquer:

ou

Análise de Dados

Page 92: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

92

Resumo dos testes z e t sobre inferências da média para uma amostra e duas amostras não relacionadas

(continuação)

Duas

amostras

não

relacionadas

σ desconhecidoσ conhecido

---

(x1 - x2) (µ1 - µ2)σx - σx

1 2

n qualquer:

Z =

n < 30

T

Z

=

=

= =

(x1 - x2) - (µ1 - µ2)

(µ1 - µ2)

Sx - x1 2

--

n ≥ 30

(x1 - x2) -Sx - x

21

--

- -

--

onde

Sx - x21

-- Sx Sx+2 2

1 2- -

S2 S2

+1 2n1 n2

utilizar a tabela t para gl = n1 + n2 - 2

- -~N(0,1)

Análise de Dados

Page 93: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

93

Teste para duas amostras relacionadas – variável intervalar

Exemplo:

Um fabricante de vinhos pretende lançar uma nova marca.

Desenvolveu duas versões para a embalagem e a adoção de uma ou outra deveria ser decidida através de pesquisa.

Para realizar a pesquisa, solicitou que o novo vinho fosse engarrafado em cada uma das versões de embalagem.

Essas duas versões foram colocadas à venda numa amostra aleatória de cinco lojas de uma rede de supermercados.

Teste tr:

O teste tr é o indicado para o caso de duas amostras relacionadas.

Análise de Dados

Page 94: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

94

Vendas em unidades

Loja Embalagem 1 Embalagem 2 Diferença (d)

1 72 67 5

2 60 52 8

3 65 60 5

4 43 41 2

5 54 50 4

Resultados das vendas do vinho nas duas embalagens

Com base nesses dados, qual embalagem deve ser adotada para o novo vinho?

Teste para duas amostras relacionadas – variável intervalar(continuação)

Análise de Dados

Page 95: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

95

Procedimentos para o teste:

1. Determinar H0. H0 = não há diferença entre as médias de venda das duas

embalagens. H1 = há diferença significativa entre as médias de venda das

duas embalagens. Portanto, um teste do tipo bicaudal.

2. Estabelecer um nível de significância. Seja o nível de significância de α = 0,05.

Teste para duas amostras relacionadas – variável intervalar(continuação)

Análise de Dados

Page 96: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

96

3. Calcular os valores de t. O cálculo de t, neste caso, é obtido através da seguinte fórmula:

Onde: xd

_=

=

=

=

média das diferenças observadas entre as duas amostrasem cada loja;

D diferença esperada para H0, ou seja, D = 0;

n número de diferenças, que no caso é 5;

Sd desvio-padrão das diferenças observadas em relação à diferença média, que é calculado pela seguinte fórmula:

=di diferenças observadas entre as embalagens 1 e 2;

d = média das diferenças observadas entre as embalagens 1 e 2._

Teste para duas amostras relacionadas – variável intervalar(continuação)

Sd = ∑ (d1 – d)2

n

i=1

n - 1

_

Análise de Dados

Tc = (xd – D) / {(Sd / (n – 1))}_

Page 97: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

97

n qualquer:n qualquer:onden qualquer:onde Aplicando estas formulações aos dados da tabela, teremos os seguintes resultados:

_xd = (5 + 8 + 5 + 2 + 4) / 5 = 4,8

=Sd {(5 – 4,8)2 + (8 – 4,8)2 + (5 – 4,8)2 + (2 – 4,8)2 + (4 – 4,8)2} / (5 – 1) = 6,5

=Tc (4,8 – 0) / (6,5 / 4) = 1,6

Teste para duas amostras relacionadas – variável intervalar(continuação)

Procedimentos para o teste:

Análise de Dados

Page 98: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

98

4. Determinar a região de rejeição de t . Procurar na tabela da distribuição padronizada de t o valor correspondente a α/ 2 = 0,025 (pois o teste é bicaudal) para gl = n – 1 = 5 – 1 = 4, que é 2,776.

5. Decidir comparando os valores de Tc e Tt. Como o valor de T calculado (1,6) é menor que o de T tabelado (2,776), a hipótese nula (H0) é aceita no nível de significância de 0,05. Portanto, a diferença observada na maior compra da embalagem 2 não é significativa, e a adoção de qualquer uma das embalagens é indiferente.

Teste para duas amostras relacionadas – variável intervalar(continuação)

Procedimentos para o teste:

Análise de Dados

Page 99: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

99

Métodos para medir a associação

As medidas de associação servem para verificar se dois ou mais conjuntos de dados estão relacionados e para medir o nível de relacionamento ou associação existente.

Em marketing e pesquisas de marketing, existem inúmeras situações em que a medida da associação ou do relacionamento entre duas ou mais variáveis é extremamente útil.

Análise de Dados

Page 100: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

100

Métodos para medir a associação(continuação)

Exemplo:

Relacionar quanto a preferência para um produto, associada à classe social dos consumidores, ajuda nos processos de segmentação de mercado e de planejamento de marketing.

Relacionar quanto a intensidade dos gastos promocionais está relacionada aos resultados de vendas ou de participação no mercado também ajuda no planejamento futuro desses gastos, tendo em vista os objetivos de vendas ou de participação de mercado visados.

Análise de Dados

Page 101: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

101

A escolha do método não paramétrico para a medida da associação irá depender de:

considerar uma ou mais de uma variável independente;

se as escalas de medição são nominais ou ordinais;

da existência ou não de variável dependente;

se a escala de medição é ordinal ou intervalar.

Métodos para medir a associação(continuação)

Análise de Dados

Page 102: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

102

Métodos paramétricos e não paramétricos de medidas de associação

Coeficiente de Concordância de Kendall

Mais de uma

Coeficiente de Correlação de Postos de Spearman Coeficiente de Correlação de Postos de Kendall

Uma

Ordinal

Índice de Associação Preditiva

Mais de uma

Coeficiente de Contingência

Uma

Nominal

Não Paramétrico

UmaNenhumaUmaNenhumaUmaNenhuma

Nº de variáveis dependentes

Nº de variáveis dependentes

Nº de variáveis dependentes

Intervalar ou RazãoOrdinalNominal

Número de variáveis

independentes

Escala de mensuração da

variávelMétodo

- --

Análise de Dados

Page 103: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

103

Métodos paramétricos e não paramétricos de medidas de associação

(continuação)

Análise da Regressão Múltipla

Análise Fatorial

Análise de Conglomerados

Análise de Regressão Múltipla com Variável Dummy

Análise Fatorial com Variável Dummy

Análise de Conglomerados

Mais de uma

Análise da Regressão

Uma

Intervalar ou Razão

Paramétrico

UmaNenhumaUmaNenhumaUmaNenhuma

Nº de variáveis dependentesNº de variáveis dependentes

Nº de variáveis dependentes

Intervalar ou RazãoOrdinalNominal

Número de variáveis

independentes

Escala de mensuração da variável

Método

- --

Análise de Dados

Page 104: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

104

Coeficiente de CONTINGÊNCIA C

O coeficiente de correlação de postos de Spearman é o mais

conhecido e utilizado coeficiente para estabelecer a correlação

de dois conjuntos de dados ordenados.

Em pesquisas de marketing, sua utilização ocorre quando, de

um mesmo grupo de pessoas, são obtidas medições ordinais de

duas diferentes variáveis cujo relacionamento se deseja

conhecer, tais como classe social e preferência para o produto.

Pode também ser utilizado para comparar a associação existente

entre dois quaisquer conjuntos de dados ordenados.

Métodos para medir a associação(continuação)

Análise de Dados

Page 105: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

105

Coeficiente de correlação de postos de Spearman Rs

O coeficiente de correlação de postos de Spearman é o mais

conhecido e utilizado coeficiente para estabelecer a correlação

de dois conjuntos de dados ordenados.

Em pesquisas de marketing, sua utilização ocorre quando, de

um mesmo grupo de pessoas, são obtidas medições ordinais de

duas diferentes variáveis cujo relacionamento se deseja

conhecer, tais como classe social e preferência para o produto.

Pode também ser utilizado para comparar a associação existente

entre dois quaisquer conjuntos de dados ordenados.

Métodos para medir a associação(continuação)

Análise de Dados

Page 106: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

106

Condições para utilização:

Dois conjuntos de variáveis da mesma amostra ou de

amostras diferentes.

Variáveis medidas ao menos em escalas ordinais.

Métodos para medir a associação(continuação)

Análise de Dados

Page 107: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

107

Teoria/Conceito: O coeficiente mede a disparidade de classificação entre dois

conjuntos de dados ordenados. Os dois conjuntos de dados a comparar são ordenados,

independentemente, do maior para o menor valor das medições, atribuindo-se, seqüencialmente, aos maiores valores a posição 1, e aos menores, a posição n.

Comparando-se essas duas ordenações, pode ser deduzido que, quanto mais homogêneas e coincidentes forem, menores serão as diferenças algébricas observadas entre uma e outra, e vice-versa.

Se o relacionamento entre os dois conjuntos de classificações ordenadas for perfeito, todas as diferenças nos pares de classificação serão iguais a zero; analogamente, caso o relacionamento seja exatamente o inverso, todas as diferenças serão máximas (por exemplo, um mesmo respondente que tenha avaliado a primeira variável num valor que resultou numa classificação 1 e, a segunda, numa classificação n).

Métodos para medir a associação(continuação)

Análise de Dados

Page 108: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

108

Teoria/Conceito: A princípio, o somatório das diferenças poderia dar uma noção

da magnitude da similaridade ou discrepância entre as

classificações; porém, como as diferenças são algébricas, as

negativas tendem a cancelar as positivas, e o valor resultante

ficaria deturpado. Para contornar esse problema é utilizada, para medir a

magnitude das discrepâncias observadas, a raiz quadrada da

soma dos quadrados das diferenças observadas. O cálculo do coeficiente de correlação é obtido pela subtração

da divisão desse valor pelo seu máximo valor possível (quando a

discrepância for máxima). Esse coeficiente varia de 0 (não há correlação) até 1 (correlação

máxima).

Métodos para medir a associação(continuação)

Análise de Dados

Page 109: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

109

1.Ordenar as observações de cada uma das variáveis

separadamente e atribuir posições para as classificações de 1 a n.

2. Calcular a diferença d e o seu quadrado para as observações

pareadas de cada elemento da amostra.

3.Somar todos os quadrados das diferenças.

4.Com os dados assim obtidos, calcular o valor do coeficiente de

correlação de postos (Rs), utilizando a seguinte fórmula:

Métodos para medir a associação(continuação)

Rs = 1 -6∑ di

i=1

n 2

n3 - n

Onde:Rs = coeficiente de correlação de postos de Spearman;n = número de observações;di = diferença algébrica entre as classificações.

Procedimento sumarizado para o cálculo de Rs:

Análise de Dados

Page 110: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

110

1. Definir H0 como não havendo correlação entre os dois conjuntos de dados.

2. Definir um nível de significância α para testar H0.

3. Para n = 10, a significância de se obter um Rs sob H0 pode ser testada, utilizando-se a seguinte fórmula para o cálculo de t cuja distribuição é idêntica à distribuição t de Student para gl = n – 2:

Métodos para medir a associação(continuação)

T = Rsn - 21 - Rs

2

Para n < 10, procurar o valor na Tabela P (SIEGEL, 1981, P. 315).

Procedimento sumarizado para o teste de Rs:

Análise de Dados

Page 111: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

111

4. Região de rejeição. Procurar na tabela da distribuição t de Student {Tabela B de Siegel (1981, p. 279)} o valor correspondente a α e gl = n – 2. A região de rejeição estará compreendida por todos os valores maiores ou iguais ao t tabelado.

5. Decisão. A decisão será tomada comparando-se o T calculado com o T tabelado para o nível de significância α e gl = n – 2.

Se o T calculado for maior ou igual ao T tabelado, H0 é rejeitada em prol de H1.

Métodos para medir a associação(continuação)

Procedimento sumarizado para o teste de Rs:

Análise de Dados

Page 112: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

112

Uma empresa, desejando saber quanto o nível de satisfação com

um seu produto está relacionado ao nível socioeconômico do

consumidor, realizou uma pesquisa junto a uma amostra aleatória

de 15 consumidores.

O nível de satisfação foi medido segundo o grau de concordância

para uma série de afirmações, e o nível socioeconômico, por uma

escala desenvolvida na empresa.

Os resultados dessas duas medições estão na tabela a seguir:

Métodos para medir a associação(continuação)

Exemplo:

Análise de Dados

Page 113: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

113

Exemplo:

Métodos para medir a associação(continuação)

PesquisadoNível de satisfação Nível socioeconômico di

di2

Pontuação Ordem (1) Pontuação Ordem (2) (1) – (2)

1 82 2 42 4 – 2 4

2 98 8 46 6 2 4

3 87 5 39 2 3 9

4 40 1 37 1 0 0

5 116 13 65 10 3 9

6 113 12 88 14 – 2 4

7 111 11 86 12 – 1 1

8 83 3 56 8 – 5 25

9 85 4 62 9 – 5 25

10 126 15 92 15 0 0

11 106 10 54 7 3 9

12 117 14 81 11 3 9

13 103 9 87 13 – 4 16

14 89 6 40 3 3 9

15 95 7 45 5 2 4

Total 128

Análise de Dados

Page 114: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

114

1. Ordenar as observações de cada uma das variáveis separadamente e, atribuindo posições para as classificações de 1 a 15, obtêm-se os dados da tabela anterior.

2. Calcular as diferenças (d) e os quadrados das diferenças (d2) para as observações pareadas de cada elemento da amostra e, em seguida

somando todos os quadrados das diferenças (∑d2), obteremos os dados necessários para o cálculo do índice de correlação (veja tabela anterior).

3. Aplicar a tabela vista a esses dados ter-se-á para Rs :

Métodos para medir a associação(continuação)

Procedimento para o cálculo de Rs:

= 1 – Rs = 1 – = 0,77 6 × 128153 – 15

7683.360

Análise de Dados

Page 115: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

115

1. H0 = não há correlação entre classe social e o nível de satisfação dos consumidores.

H1 = há correção entre a classe social e o nível de satisfação dos consumidores (Teste bicaudal).

2. α = 0,02.

3. Como n é maior que 10, a significância de se obter um Rs sob H0 pode ser testada, utilizando-se a fórmula vista para o cálculo de t, cuja distribuição é idêntica à distribuição t de Student para gl = 15 – 2 = 13.

Métodos para medir a associação(continuação)

Procedimentos para o teste de Rs:

Análise de Dados

Page 116: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

116

5. Decisão. Como n = 15, Ho pode ser testada, utilizando-se, para o cálculo de T, a fórmula T = Rs + [(n – 2) / (1 – Rs )]

4. Região de rejeição. O valor tabelado de t para α / 2 = 0,01 e gl = 13 é 2,65. A região de rejeição estará compreendida por todos os valores maiores ou iguais a 2,65.

Métodos para medir a associação(continuação)

Sendo o T calculado (4,35) maior que o T tabelado (2,65), H0 é rejeitada em prol de H1, no nível de significância α = 0,02. Portanto, existe uma correlação positiva de 0,77 entre a classe social e o nível de satisfação dos consumidores.

Procedimentos para o teste de Rs:

2

Tc = Rsn - 21 - Rs

2

15 - 2

Tc = 4,35

Tc = 0,771 – 0,77 2

0,77 130,407

= 0,77 5,65×

Análise de Dados

Page 117: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

117

Coeficiente de concordância de Kendall W:

O coeficiente de concordância de Kendall W determina qual é o grau de associação entre mais de dois conjuntos ordenados.

Esse tipo de medida da associação é, particularmente, interessante em pesquisas de marketing para os casos em que há, por exemplo, vários consumidores avaliando, através de classificações, simultaneamente vários produtos (ou várias embalagens, ou várias propagandas etc.).

Métodos para medir a associação(continuação)

Condições para utilização:

Conjunto de n objetos avaliados por k avaliadores.

Avaliações em escalas ordinais originadas de comparação dos n objetos.

Análise de Dados

Page 118: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

118

Teoria/ Conceito:

Uma das formas de solução do problema consiste em calcular todos os índices de correlações de Spearman (Rs) de todos os possíveis pares de classificações e em seguida calcular a média para determinar o coeficiente de correlação de todo o conjunto.

É um caminho muito trabalhoso e, por isso, não recomendável. A outra forma, mais fácil, é imaginar o que ocorre quando não há nenhuma concordância entre todos os conjuntos, e quando há total concordância.

O coeficiente de concordância será um índice de divergência entre a concordância verdadeira verificada nos dados e o máximo de concordância possível.

Métodos para medir a associação(continuação)

Análise de Dados

Page 119: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

119

Procedimento sumarizado para o cálculo de W:1. Sendo k = número de avaliadores e n = número de objetos

avaliados, construir uma tabela n × k com as classificações observadas.

2. Calcular Rn, a soma das classificações de cada objeto.3. Determinar a média dos Rn, ou seja, ∑ Rn/ k. Calcular as

diferenças algébricas entre cada Rn e essa média e elevar ao quadrado. Obter S, somando todos os resultados.

Métodos para medir a associação(continuação)

4. Calcular o índice de concordância de Kendall W, aplicando a seguinte fórmula aos dados obtidos nos itens 1, 2 e 3:

W =S

1/ 12 k2(n3 – n)

Onde: S = somatório do quadrado das diferenças observadas; k = número de avaliadores: n = número de objetos avaliados.

Análise de Dados

Page 120: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

120

Exemplo:

Uma empresa realizou uma pesquisa procurando avaliar a ordem de preferência dos consumidores para as 8 marcas concorrentes de um mesmo produto. Foram obtidas as opiniões de uma amostra aleatória de 20 consumidores.

Com base nos resultados apresentados na tabela seguinte, a empresa deseja saber qual foi o grau de concordância na avaliação desses 20 consumidores.

Métodos para medir a associação(continuação)

Análise de Dados

Page 121: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

121

Consumidor(k)

Produto (n)

A B C D E F G H

1 3 1 2 4 5 7 6 8

2 4 3 1 2 5 8 7 6

3 3 5 8 7 4 6 1 2

4 5 3 2 1 6 4 8 7

5 1 2 5 4 8 3 7 6

6 3 1 4 5 2 6 7 8

7 2 1 3 4 6 7 8 5

8 3 2 1 4 6 5 7 8

9 1 3 5 4 2 7 8 6

10 2 3 4 1 5 6 8 7

11 2 4 3 1 6 8 7 5

12 3 2 1 5 4 6 8 7

13 5 4 3 1 2 8 6 7

14 3 1 2 4 5 8 6 7

15 5 3 2 1 6 4 8 7

16 2 1 3 4 6 7 8 5

17 1 3 5 4 2 7 8 6

18 3 2 1 5 4 6 8 7

19 2 1 3 4 6 7 8 5

20 5 3 2 1 6 4 8 7

Totais (Rn) 58 48 60 66 96 124 142 126

∑ Rn = 720

Rmédio (720/ 8) 90 90 90 90 90 90 90 90

d –32 –42 –30 –24 6 34 52 36

d2 1.024 1.764 900 576 36 1.156 2.704 1.296

S = ∑ d2 = 1.024 + 1.764 + 900 + 576 + 36 + 1.156 + 2.704 + 1.296 = 9.456

Tabela de resultados da avaliação dos consumidoresAnálise de Dados

Page 122: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

122

Exemplo:

Efetuando os procedimentos indicados para o cálculo de W, obtêm-se os dados que constam das linhas Rn, R médio, d, d2 e S na tabela anterior.

Aplicando a fórmula para o cálculo de W, tem-se:

W = 9.456

202(83 – 8) / 12

W = 9.456

400 × 12

× 504

W = 0,562

Portanto, a concordância na avaliação dos 20 consumidoresna ordenação das oito marcas foi de 0,562.

Métodos para medir a associação(continuação)

Análise de Dados

Page 123: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

123

Métodos de correlação e regressão

A regressão refere‑se à natureza da associação estatística, isto é, à correspondência de uma variável-critério em relação a uma ou mais variáveis-prognóstico.

A correlação diz respeito ao grau de associação ou correspondência existente entre uma variável‑critério e uma ou mais variáveis‑prognóstico.

Análise de Dados

Page 124: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

124

Diagramas de dispersão

Y

X X

Y

Correlação e regressão(continuação)

Análise de Dados

Page 125: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

125

Curva de mínimos quadrados

Y

X

(Xn,Yn)

dn

(X1,Y1)

d1 d2

(X2,Y2)

Correlação e regressão(continuação)

Análise de Dados

Page 126: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

126

n qualquer:n qualquer:onden qualquer:n qualquer:onde

Para o caso particular de uma reta, a curva de regressão que se ajusta aos dados tem a seguinte equação:

Y = a1 + a2 X

Onde: Y = a variável-critério, e representa o valor esperado de Ydado determinado valor de X;

X = a variável-prognóstico;

a1 = valor de Y para X = 0;

a2 = valor médio de Y por unidade de X.

Regressão linear simples

Análise de Dados

Page 127: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

127

As constantes a1 e a2 são determinadas mediante a resolução do sistema de equações:

Regressão linear simples(continuação)

∑Y = a1n + a2 ∑X

∑XY = a1∑X + a2 ∑X2

(∑Y) (∑X2) – (∑X) (∑YX)

n(∑X2) – (∑X)2a1 =

n(∑XY) – (∑X) (∑Y)

n(∑X2) – (∑X)2a2 =

Resultando em:

Análise de Dados

Page 128: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

128

Exemplo de regressão simples e correlação simples:

Uma empresa produtora de bens de consumo de

massa levantou um histórico de dez anos das vendas,

em milhares de unidades, de um seu produto, os

investimentos, em milhões de reais, em comunicação

(propaganda, promoção de vendas etc.) e o número

de vendedores para este mesmo produto.

Regressão linear simples(continuação)

Análise de Dados

Page 129: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

129

AnoX

Comunicação(milhões de R$)

ZNo de

vendedores

YVendas

(milhares de unidades)

1994 9,5 10 95

1995 6,5 8 60

1996 7,0 9 60

1997 8,0 12 80

1998 7,5 15 80

1999 8,5 11 80

2000 7,5 13 85

2001 5,5 7 60

2002 8,0 15 85

2003 6,0 10 65

Resultados do levantamento

Regressão linear simples(continuação)

Análise de Dados

Page 130: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

130

Relação entre investimentos em comunicação e vendas

Vendas(milhares de

unidades)

Comunicação(milhões de R$)

1994

19951996

19971998 1999

2000

2001

2002

2003

50 6 7 8 9 10

60

70

80

90

100

Y

X

Regressão linear simples(continuação)

Análise de Dados

Page 131: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

131

Cálculos efetuados a partir dos dados originais do problema

Ano X2 XY Z2 ZY Y2 XZ (X-X) (Z-Z) (Y-Y)

1994 90,25 902,5 100 950 9.025 95 2,1 -1 2,0

1995 42,25 390,0 64 480 3.600 52 -0,9 -3 -15

1996 49,00 420,0 81 540 3.600 63 -0,4 -2 -15

1997 64,00 640,0 144 960 6.400 96 0,6 1 5

1998 56,25 600,0 225 1.200 6.400 112,5 0,1 4 5

1999 72,25 680,0 121 880 6.400 93,5 1,1 - 5

2000 56,25 637,5 169 1.105 7.225 97,5 0,1 2 10

2001 30,25 330,0 49 420 3.600 38,5 -1,9 -4 -15

2002 64,00 680,0 225 1.275 7.225 120 0,6 4 10

2003 36,00 390,0 100 650 4.225 60 -1,4 -1 -10

Total 560,50 5.670,0 1.278 8.460 57.700 828 -0- -0- -0-

Regressão linear simples(continuação)

_ _ _

Análise de Dados

Page 132: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

132

Cálculos efetuados a partir dos dados originais do problema (cont.)

Ano [(X-X) (Y-Y)] [(Z-Z) (Y-Y)] [(X-X) (Z-Z)] (X-X)2 (Z-Z)2 (Y-Y)2 [(X-X) (Z-Z) (Y-Y)]

1994 4,2 -2 -2,1 4,41 1 400 -4,2

1995 13,5 45 -2,7 0,81 9 225 -40,5

1996 6,0 30 0,8 0,16 4 225 -12,0

1997 3,0 5 0,6 0,36 1 25 3,0

1998 0,5 2 0,4 0,01 16 25 2,0

1999 5,5 0 - 1,21 - 25 5,5

2000 1,0 20 0,2 0,01 4 100 2,0

2001 28,5 60 7,6 3,61 16 225 -114,0

2002 6,0 40 2,4 0,36 16 100 24,0

2003 14,0 10 1,4 1,96 1 100 -14,0

Total 120,0 228 8,6 12,90 68 1.450 148,2

Regressão linear simples(continuação)

____________

Análise de Dados

Page 133: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

133

Aplicando-se as equações para determinar a1 e a2 aos dados de X e Y dessa tabela, tem-se:

(∑Y) (∑X2) – (∑X) (∑YX)

n(∑X2) – (∑X)2a1 =

750 × 560,5 – 74 × 5.670

10 560,5 – 742× =

n(∑XY) – (∑X) (∑Y)n(∑X2) – (∑X)2

a2 =10 × 5.670 – 74 × 750

10 560,5 – 742× =

Regressão linear simples(continuação)

Análise de Dados

a1= 795

129 a1= 6,162

a1= 1.200

129a2

= 9,302

Page 134: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

134

A equação de regressão resultante para o exemplo será:

Regressão linear simples(continuação)

O coeficiente a1 é o valor onde a reta corta o eixo de Y e corresponde ao valor de Y para X = 0.

O coeficiente a2 é denominado coeficiente de regressão bruto, e seu significado para o exemplo é o de que, em média, as vendas crescem 9.302 unidades para cada R$ 1.000,00 de investimentos em comunicação, o que possibilita predizer qual deverá ser o incremento no volume de vendas para dado incremento no investimento em comunicações.

Y = 6,162 + 9,302 X

Assim, se X = 5 Y = 6,162 + 9,302 5 = 52,672×

X = 9 Y = 6,162 + 9,302 9 = 89,880E se ×

Análise de Dados

Page 135: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

135

A regressão linear múltipla compreende a regressão linear de uma variável‑critério em relação a duas ou mais variáveis‑prognóstico.

Regressão linear múltipla

Análise de Dados

Page 136: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

136

n qualquer:n qualquer:onden qualquer:onde

Coeficiente de correlação

A variação total ocorrida com uma variável Y (critério) será resultante em parte pela variação ocorrida nas variáveis X, Z etc. (prognóstico), e o restante da variação de Y será resultante de outros fatores desconhecidos.

A variação total de Y pode ser expressa da seguinte forma:

Yest = o valor de Y estimado;

∑(Y – Yest) = a variação não explicada;

∑(Yest – Y)2 = a variação explicada.

∑(Y – Y)2 = ∑(Y – Yest)2 + ∑(Yest – Y)2_ _

_

Análise de Dados

Onde:

Page 137: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

137

Este coeficiente nos dá uma medida da quantidade da variação explicada na variável‑critério pelas variáveis‑prognóstico consideradas.

Se a variação explicada for nula, esse quociente será igual a zero; se a variação total for toda explicada, este quociente será igual a um.

Coeficiente de correlação(continuação)

Define-se como coeficiente de determinação e nota-se por r2 o quociente da variação explicada pela variação total.

r2 = variação explicada/ variação total = ∑(Yest – Y)2

∑(Y – Y)2n qualquer:n qualquer:onden qualquer:

__

Análise de Dados

Page 138: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

138

Esta expressão também pode ser escrita, desprezando o sinal, sob a forma:

O coeficiente de correlação é a medida do grau de associação entre a variável Y (critério) e as variáveis X, Z etc.; é definido como raiz quadrada do coeficiente de determinação e nota-se por r.

Coeficiente de correlação(continuação)

r2 =S2y . X

Sy21 –

r =variação explicada

variação total=

∑(Yest – Y)2

∑(Y – Y)2

_

_

Análise de Dados

Page 139: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

139

O coeficiente de correlação varia entre – 1 e + 1. Sendo – 1 significa que há total correlação negativa, + 1 total correlação positiva e 0, a inexistência de correlação.

O coeficiente de correlação também pode ser expresso por:

Onde:

S2y.x = variância de y em relação a xSy2 = variância de y.

Coeficiente de correlação(continuação)

r2 =S2y . x

Sy21 –

Análise de Dados

Page 140: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

140

Exemplos de diagramas de dispersão com os coeficientes de correlação linear associados

r = 0,90 r = 0r = 0,55 r = - 0,85

Coeficiente de correlação(continuação)

Análise de Dados

Page 141: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

141

Coeficiente de correlação simples

O coeficiente de correlação simples é a medida do grau de associação linear entre duas variáveis.

Sendo a fórmula matemática que representa esta associação igual a Y = a1 + a2X, a formulação geral para r ficará reduzida a:

A fórmula para o cálculo do coeficiente de correlação simples só poderá ser utilizada quando os seguintes pressupostos forem atendidos: X e Y precisam ser variáveis aleatórias e as observações originárias de amostras com distribuições normalmente distribuídas, tanto para X quanto para Y.

__

r = ∑(X – X) (Y –Y)

∑(X – X)2∑(Y – Y)2

=cov (X, Y)

var(X) var(Y)_ _

Análise de Dados

Page 142: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

142

Análise fatorial

É a denominação atribuída às técnicas estatísticas

paramétricas multivariadas utilizadas para estudar o

inter-relacionamento entre um conjunto de variáveis

observadas.

Diferentemente da regressão múltipla, em que uma variável

é, explicitamente, considerada critério e as demais

prognóstico, na análise fatorial todas as variáveis são

consideradas simultaneamente.

Análise de Dados

Page 143: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

143

Emprego da análise fatorial em pesquisas de marketing

Identificação da estrutura

Redução do volume de dados

Construção de escalas

Transformação dos dados

Análise de Dados

Page 144: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

144

Passos da análise fatorial

Cálculo das correlações.

Extração dos fatores iniciais.

Rotação da matriz.

Análise de Dados

Page 145: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

145

Exemplo dos passos na análise fatorial

Variáveis Correlação entre variáveis

1 2 3 4 5 6 7 8 9

1. Desempenho 1 ,76 ,48 ,20 ,08 ,25 ,05 ,28 ,18

2. Modelo moderno 1 ,47 ,19 ,07 ,25 ,10 ,30 ,21

3. Conforto 1 ,22 ,13 ,22 ,09 ,31 ,26

4. Confiança na marca 1 ,42 ,53 ,00 ,20 ,33

5. Durabilidade/ qualidade 1 ,36 ,01 ,09 ,18

6. Segurança 1 ,08 ,31 ,33

7. Espaço (passageiros e bagagens) 1 ,45 ,34

8. Economia (combustível e manutenção) 1 ,48

9. Preço de aquisição 1

Análise de Dados

Page 146: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

146

Fatores principais extraídos da matriz de correlação e a matriz girada ortogonal (rotação varimax)

Análise fatorial(continuação)

Análise de Dados

30,3632,6636,98100,0023,22 25,0451,74% variância comum

20,3421,8824,7867,0015,5616,7834,66% variância total

1,831,972,236,031,401,513,12Soma dos quadrados

–,68,36,13,61–,42,22,629. Preço de aquisição

–,77,13,28,69–,52–,04,658. Economia (combustível e manutenção)

–,83–,13–,02,70–,77–,04,337. Espaço (passageiros e bagagens)

–,20,73,20,62,16,44,636. Segurança

,03,76–,02,57,29,59,385. Durabilidade/ qualidade

–,08,81,14,69,27,53,584. Confiança na marca

–,17,15,69,53,16–,32,633. Conforto

–,01,07,89,80,26–,51,692. Modelo moderno

–,05,08,90,83,31–,52,681. Desempenho

C Econômico

B Racional

A Emocional

h2CBAVariáveis

Matriz giradaMatriz principal de fatores

Page 147: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

147

Permite ao pesquisador classificar objetos ou indivíduos observados em relação a inúmeras variáveis em subgrupos ou conglomerados não definidos a priori mas que surgem em função da análise realizada.

Uma das principais aplicações da análise de conglomerados em marketing é a subdivisão do mercado em segmentos utilizando medidas multivariadas dos consumidores, como: demográficas, sociais, econômicas e psicográficas.

Cada agrupamento (conglomerado) terá por característica grande similaridade interna e grande dissimilaridade externa.

Análise de conglomerados

Análise de Dados

Page 148: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

148

Exemplo de análise de conglomerados

Consumidor

Pontuação obtida na variável

Renda (X1) Ocupação (X2)

A 25,00 25,00

B –20,00 –22,50

C 30,00 20,00

D 25,00 17,50

E 2,50 10,00

F –15,00 –17,50

G 2,50 – 5,00

H 0,50 0,50

I –25,00 –20,00

Análise de Dados

Page 149: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

149

Identificação visual de conglomerados

0 5 10 15 20 25 30

5

10

15

20

25

5

10

15

15

20

20

25

25 10 5

Renda

A

CD

S1

G

E

HS2

IF

S3

B

Análise de conglomerados(continuação)

Análise de Dados

Page 150: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

150

Distância euclidiana de duas medidas

dD,H = (X1H – X1D) + (X2H – X2D) 22

dD,H = (5 – 25) + (5 – 17,5) 22

dD,H = 23,6

Análise de conglomerados(continuação)

Análise de Dados

Page 151: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

151

Matriz das distâncias médias A B C D E F G H I

A 0,0

B 32,7 0,0

C 3,5 32,8 0,0

D 3,7 30,1 2,8 0,0

E 13,5 19,7 14,6 11,9 0,0

F 29,2 3,5 29,3 26,6 16,3 0,0

G 18,7 14,2 18,6 15,9 7,5 10,8 0,0

H 14,1 18,6 14,6 11,8 2,8 15,1 5,1 0,0

I 33,6 2,8 34,0 31,2 20,3 5,1 15,7 19,5 0,0

Análise de conglomerados(continuação)

Análise de Dados

Page 152: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

152

Método das ligações simples

Distância Pares de consumidores

2,8 CD, BI e EH

3,5 AC e BF

3,7 AD

5,1 FI e GH

7,5 EG

Análise de conglomerados(continuação)

Análise de Dados

Page 153: Pesquisa Aplicada a Comunicação cap-6

PESQUISA DE MARKETING – Edição CompactaPESQUISA DE MARKETING – Edição Compacta MattarMattar

153

Diagrama de visualização dos conglomerados

A

CD 2,8

3,53,7

B

IF 5,1

2,83,5

E

HG 5,1

2,87,5

Análise de Dados