estatística aplicada à administração - aula 16: testes de normalidade das distribuições

19
Estatística Aplicada à Administração #AD400 Aula 16: Testes de Normalidade das Distribuições 1/16

Upload: marcus-araujo

Post on 28-Jan-2018

215 views

Category:

Education


5 download

TRANSCRIPT

Estatística Aplicada à Administração #AD400

Aula 16: Testes de Normalidade das Distribuições

1/16

Briefing

• Nessa aula você irá:

1. Tomar ciência sobre o que são dadosparamétricos e não paramétricos;

2. Aprender sobre os testes de normalidade;

3. Conhecer o Teorema do Limite Central.

2/16

Sumário

• Características da Estatística dos Dados;

• Testes de Normalidade;

• Hipóteses dos Testes;

• Interpretação dos Testes;

• Teorema do Limite Central.

3/16

Características da Estatística dos Dados

• Estatística Paramétrica:

– É um ramo da Estatística que formula testes tomandocomo pressuposto o fato dos dados a serem testadosserem provenientes de um tipo específico de distribuição;

– Esse tipo de distribuição é a distribuição normal;

– Tais distribuições são proveniente de mecanismosgaussianos aleatórios;

– A maioria dos teste estatísticos clássicos são paramétricos;

– Os teste paramétricos possuem um maior poder deexplicação.

4/16

Características da Estatística dos Dados

• Estatística Não Paramétrica:

– É um ramo da Estatística que formula testes que nãotomam como pressuposto o fato dos dados a seremparamétricos;

– São uma alternativa aos testes paramétricos e aos seuspressupostos;

– As distribuições testadas podem ser provenientes dequalquer mecanismo;

– Os teste não paramétricos possuem um menor poder deexplicação, mas possuem sua utilidade.

5/16

Características da Estatística dos Dados

• A distribuição égaussiana?

• Os dados sãoparamétricos ounão paramétricos?

• Quais tipos detestes utilizar naanálise dos dados?

6/16

0,5%1,2%

5,6%

11,1%

17,8%

23,8%

21,1%

12,0%

4,6%

1,7%0,7%

0 1 2 3 4 5 6 7 8 9 10

Conhecimento Científico (0-10)

0

20

40

60

80

100

120

140

160

Nº d

e O

bs

erv

õe

s

Testes de Normalidade

• Para responder tais perguntas, o pesquisador deveutilizar um ou mais testes de normalidade (ou deaderência);

• São testes empregados para determinar se uma dadadistribuição de frequências pode ou não ter sidogerada por um mecanismo gaussiano;

• Há diversos tipos distintos de testes de normalidade.Porém, a maioria deles possui a mesmainterpretação.

7/16

Testes de Normalidade

• Teste de Kolmogorov-Smirnov (K-S): Um dos mais

antigos testes, sendo também um dos que mais

aceita os dados como paramétricos;

• Teste de Lilliefors (L): Uma variante do teste K-S,

sendo mais precisa do que este;

• Teste de Shapiro-WilkK (W): Um dos testes mais

rigorosos na aceitação dos dados como

paramétricos, sendo, também, um dos mais

amplamente utilizados.

8/16

Testes de Normalidade

9/16

(W) (L) (K-S)

Maior número de distribuições aceitas como gaussianas

Hipóteses dos Testes

• Hipótese Nula (H0):

– A distribuição da amostra testada é retirada dadistribuição de referência (teste uniamostral);

– As distribuições das amostras testadas sãoretiradas da mesma distribuição (testebiamostral).

• Testa-se, portanto, se a distribuição é proveniente deum mecanismo aleatório gaussiano e, portanto,apresenta dados paramétricos.

10/16

Hipóteses dos Testes

• Hipótese Alternativa (H1):

– A distribuição da amostra testada não é retiradada distribuição de referência (teste uniamostral);

– As distribuições das amostras testadas não sãoretiradas da mesma distribuição (testebiamostral).

• Ao rejeitar H0, tem-se que a distribuição não éproveniente de um mecanismo aleatório gaussianoe, portanto, apresenta dados não paramétricos.

11/16

Hipóteses dos Testes

12/16

Interpretação dos Testes

• Os testes de normalidade, em geral, emitem umvalor de probabilidade (p) de H0 ser confirmada;

• Para valores de (p) ≤ 0,05: rejeita-se H0 e aceita-se H1

onde os dados são considerados não paramétricos eprovenientes de um mecanismo não gaussiano;

• Para valores de (p) > 0,05: confirma-se H0

considerando que os dados são paramétricos eprovenientes de um mecanismo gaussiano.

13/16

Interpretação dos Testes

14/16

K-S d=,18075, p<,01 ; Lil l iefors p<,01

Shapiro-Wilk W=,88242, p=0,0000

-1 0 1 2 3 4 5 6 7

Nº de Filhos

0

20

40

60

80

100

120

140

160

180

200

220

Nº d

e O

bs

erv

õe

s

Interpretação dos Testes

15/16

K-S d=,05133, p> .20; Lil l iefors p<,20

Shapiro-Wilk W=,97696, p=,00156

-0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

Indicador de Decisões Controladas

0

10

20

30

40

50

60

Nº d

e O

bs

erv

õe

s

Interpretação dos Testes

16/16

K-S d=,09386, p<,01 ; Lil l iefors p<,01

Shapiro-Wilk W=,98130, p=,00000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Acertos no Teste

0

20

40

60

80

100

120

Nº d

e O

bs

erv

õe

s

Teorema do Limite Central

• Trata-se de um fenômeno matemático;

• A média de muitas variáveis aleatóriasindependentes tende à distribuição gaussiana;

• Funciona sempre quando as distribuições são todasidênticas e na grande maioria dos casos quando elassão diferentes entre si;

• O teorema justifica o fato da elevada prevalência dadistribuição gaussiana nos fenômenos.

17/16

Teorema do Limite Central

18/16

K-S d=,08923, p<,01 ; Lilliefors p<,01

Gaussiana

0 10 20 30 40 50 60 70 80 90 100

PROBABILIDADE DE SUCESSO (R$ 50 Mil)

0

20

40

60

80

100

120

140

160

de

Ob

se

rva

çõ

es

K-S d=,11397, p<,01 ; Lilliefors p<,01

Gaussiana

0 10 20 30 40 50 60 70 80 90 100

PROBABILIDADE DE SUCESSO (R$ 200 mil)

0

20

40

60

80

100

120

140

160

180

de

Ob

se

rva

çõ

es

K-S d=,15573, p<,01 ; Lilliefors p<,01

Gaussiana

0 10 20 30 40 50 60 70 80 90 100

PROBABILIDADE DE SUCESSO (R$ 1 Milhão)

0

20

40

60

80

100

120

140

160

180

200

220

de

Ob

se

rva

çõ

es

K-S d=,11927, p<,01 ; Lilliefors p<,01

Gaussiana

-10 0 10 20 30 40 50 60 70 80 90 100

RETORNO DO INVESTIMENTO DE R$ 50 MIL (%)

0

20

40

60

80

100

120

140

160

de

Ob

se

rva

çõ

es

K-S d=,09270, p<,01 ; Lilliefors p<,01

Gaussiana

-10 0 10 20 30 40 50 60 70 80 90 100

RETORNO DO INVESTIMENTO DE R$ 200 MIL (%)

0

20

40

60

80

100

120

140

160

de

Ob

se

rva

çõ

es

K-S d=,14156, p<,01 ; Lilliefors p<,01

Gaussiana

-20 0 20 40 60 80 100 120 140 160 180 200

RETORNO DO INVESTIMENTO DE R$ 1 MILHÃO (%)

0

50

100

150

200

250

300

de

Ob

se

rva

çõ

es

K-S d=,20539, p<,01 ; Lilliefors p<,01

Gaussiana

-20 -10 0 10 20 30 40 50 60 70 80 90 100

TEMPO DE RETORNO DO INVESTIMENTO DE R$ 50 MIL (Meses)

0

50

100

150

200

250

300

350

400

450

500

550

de

Ob

se

rva

çõ

es

K-S d=,19744, p<,01 ; Lilliefors p<,01

Gaussiana

-10 -5 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80

TEMPO DE RETORNO DO INVESTIMENTO DE R$ 200 MIL (Meses)

0

50

100

150

200

250

de

Ob

se

rva

çõ

es

K-S d=,25238, p<,01 ; Lilliefors p<,01

Gaussiana

-20 -10 0 10 20 30 40 50 60 70 80 90 100 110 120

RETORNO DO INVESTIMENTO DE 1 MILHÃO (Meses)

0

50

100

150

200

250

300

350

400

de

Ob

se

rva

çõ

es

K-S d=,03898, p> .20; Lilliefors p<,01

Gaussiana

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85

MÈDIAS

0

20

40

60

80

100

120

140

160

180

de

Ob

se

rva

çõ

es

Média

Encerramento

Fim da Aula 16: Testes de

Normalidade

Prof. MSc. Marcus Araújo

[email protected]

br.linkedin.com/in/araujomarcus

@marcus_araujo19/16