cap 12 - análise de dados categorizados
TRANSCRIPT
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
1/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Como medir e testar a significncia da associao entreduas variveis qualitativas (Captulo 12)
Como estudar a correlao entre duas variveisquantitativas (Captulo 13)
Como construir modelos para o relacionamento entreduas variveis (Captulo 13)
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
2/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Estatstica Aplicada s Cincias SociaisEstatstica Aplicada s Cincias SociaisSexta EdioSexta Edio
Pedro Alberto Barbetta
Florianpolis: Editora da UFSC, 2006
Cap. 12Cap. 12 Anlise de dadosAnlise de dadoscategorizadoscategorizados
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
3/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Comparao entre amostrasComparao entre amostras Comparao entre amostras em que a varivel-resposta
qualitativa (categrica). Exemplo: comparao entre amostras de homens e de mulheres
quanto ao tabagismo (fumanteou no-fumante)
Como testar, com base em amostras, se as populaesque geraram as amostras tm a mesma distribuio de
probabilidades em termos das categorias da varivel-resposta? (Teste de homogeneidade qui-quadrado)
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
4/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Anlise de associaoAnlise de associao Existe associaoentre duas variveis se o conhecimento
de uma altera a probabilidade de algum resultado daoutra. Exemplo: Clima (chuvoso ou ensolarado) e ir praia (sim ou
no)
Como testar se existe associao entre duas variveisqualitativas? (Teste de associao qui-quadrado)
Como medir o grau de associao descrita pelos dadosamostrais? (Coeficientes de associao)
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
5/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Teste de associaoTeste de associao quiqui--quadradoquadrado(equivalente ao teste de homogeneidade qui-quadrado)
Exemplo 12.1: Existe associao entre sexo (homem ou
mulher) e tabagismo (fumante ou no-fumante)? Hipteses:
H0: Sexoe tabagismoso variveisindependentesna populao
em estudo. H1: Existe associaoentre as variveis sexoe tabagismo, napopulao em estudo.
ou:
H0: h = m e H1: h mh = probabilidade de um homem ser fumante
m = probabilidade de uma mulher ser fumante
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
6/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1:Exemplo 12.1: os dadosos dados
(100)(100)(100)(%)
300100200Total
(56,7)(62)(54)(%)
17062108no-fumante
(43,3)(38)(46)(%)
1303892fumante
Total (%)femininomasculinoTabagismo
Sexo
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
7/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1:Exemplo 12.1: os clculosos clculos
Sexo
Tabagismo masculino feminino Total
fumante 67,86300200130 ==E 33,43300
100130 ==E 130
no fumante 33,113300
200170=
=E
6,56
300
100170=
=E
170
Total 200 100 300
( ) ( )( )ltotal gera
olunatotal da cinhatotal da lE =
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
8/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1:Exemplo 12.1: os clculosos clculos( )
=
E
EO 2
2Estatstica do teste:
Sexo
Tabagismo masculino feminino
fumante ( )328,067,86
67,8692 2
=
( )656,033,43
33,4338 2
=
no fumante ( )251,0
33,113
33,113108 2
= ( ) 501,0
67,56
67,5662 2
=
2 = 0,328 + 0,656 + 0,251 + 0,501 = 1,74
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
9/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Distribuio de refernciaDistribuio de referncia Sob H0, os possveis valores de 2 seguem uma
distribuio qui-quadrado com graus de liberdade:
onde o nmero de linhas e c o nmero de colunasda tabela.
Supe-se que as amostras sejam razoavelmente grandes(todas as freqncias esperadas pelo menos iguais acinco).
( ) ( )11 = cgl l
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
10/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
VValoralor--pp
x
f(x)
2
valor p
Amostra
Ver Tabela 6 no apndice do livro
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
11/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1:Exemplo 12.1: uso da Tabelauso da Tabela QuiQui--quadradoquadrado
Valor p entre 0,10 e 0,25. Portanto, o testeaceita H0 ao nvel de significncia de 5%.
x
f(x)
2 = 1,74
0,10 < valor p < 0,25
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
12/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Correo em tabelasCorreo em tabelas 2 x 22 x 2 No clculo do qui-quadrado, subtrai-se 0,5 unidades na
magnitude da diferena entre as freqncias observada eesperada, em cada casela.
( ) =2
2 50
E
,EO
Refazer o Exemplo 12.1
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
13/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Medidas de associaoMedidas de associao Um coeficiente de associao descreve, em termos das
amostras observadas, o quanto os dados de duasvariveis se mostram associados.
uma medida descritiva da(s) amostra(s). No umainferncia como o teste qui-quadrado!
Em geral, os coeficientes geram valores entre 0(independncia) e 1 (associao perfeita)
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
14/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de contingnciaCoeficiente de contingncia
2
2
+nC =
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
15/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de contingncia modificadoCoeficiente de contingncia modificado
)()1(2
2
+nk
k
C* =
onde k o menor valor entre (nmero de linhas da tabela)
e c (nmero de colunas da tabela).
-
7/21/2019 Cap 12 - Anlise de Dados Categorizados
16/16
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo:Exemplo: coeficiente de contingncia modificadocoeficiente de contingncia modificado
Tabagismo homem mulher
fumante 80 (40%) 40 (40%)
no-fumante 120 (60%) 60 (60%)
Total 200 (100%) 100 (100%)
Sexo
Amostra A
Tabagismo homem mulher
fumante 200 (100%) 0 (0%)
no-fumante 0 (0%) 100 (100%)
Total 200 (100%) 100 (100%)
Amostra B
Sexo
0=300)+(01)(2
(0)(2)=
C*
Independncia!
C* 1=300)+(3001)(2
(300)(2)=
Associao perfeita!
Ver, no livro, outros coeficientes de associao.