1 estatÍstica. 2 udiii - relação entre duas ou mais variáveis estatÍstica ass 01: regressão...

28
1 ESTATÍSTICA

Upload: internet

Post on 17-Apr-2015

109 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

1

ESTATÍSTICA

Page 2: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

2

UDIII - Relação Entre Duas ou Mais Variáveis

ESTATÍSTICA

Ass 01: Regressão Múltipla (2a Parte)

Page 3: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

3

OBJETIVOS ESPECÍFICOS

• Calcular um intervalo de 95% de confiança para cada coeficiente angular do verdadeiro plano de regressão

• Calcular o valor-p para a hipótese nula =0 e para a hipótese nula =0

• Fazer predições sobre a variação de Y considerando a variação de um ou mais regressores.

Page 4: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

4

SUMÁRIO

1- Intervalos de Confiança e Testes Estatísticos

2. Coeficientes de Regressão como Fatores de Ampliação

Page 5: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

5

1. Intervalos de Confiança e Testes Estatísticos

a. Erro PadrãoTal como na regressão simples, a verdadeira relação de Y para X é avaliada pelo coeficiente populacional, desconhecido, : estimamo-lo por meio do coeficiente amostral b.

Enquanto que o verdadeiro é um valor fixo, a estimativa b varia de amostra para amostra, flutuando em torno do alvo com distribuição aproximadamente normal.

Page 6: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

6

Fig.1- Distribuição Amostral de b

Valor esperado =

2xb de padrão Erro

b

p(b)

Page 7: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

7

Da mesma forma, a verdadeira relação de Y para Z é avaliada pelo coeficiente angular populacional, desconhecido, : estimamo-lo por meio do coeficiente angular amostral c.

Enquanto que o verdadeiro é um valor fixo, a estimativa c varia de amostra para amostra, flutuando em torno do alvo com distribuição aproximadamente normal.

O erro padrão de b e o erro padrão de c são em geral calculados conjuntamente com os próprios valores de b e de c, através de soluções computadorizadas.

Page 8: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

8

Tab 1. Coeficientes, Erros Padrão e Razões t Calculados através do Excel

InterseçãoFertilizante

Nível Pluv

Coeficiente

28,095240,038095

0,833333

Erro Padrão

2,4914820,005832

0,154303

Razão-t

11,276526,531973

5,400617

Z83,0X038,028Y

Page 9: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

9

b. Intervalos de Confiança

b de EP tb 025,0

c de EP tc 025,0

Para k regressores:

g.l.= n-k-1

Page 10: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

10

Exemplo 1: Com base nos dados computadorizados da Tab.1, calcule um intervalo de 95% para cada coeficiente de regressão.

Solução:

1,260,40 ou 43,083,0

)154303,0(776,2833333,0

0,0540,022 ou 016,0038,0

)005832,0(776,2038095,0

776,2t :Student-t Tab4127.l.g 0,025

Page 11: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

11

c. Valor-p

A razão para testar =0 é, como de costume,

b de EP

bt

Da mesma forma, a razão para testar =0 é,

c de EP

ct

Page 12: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

12

Exemplo 2: Com base nos dados computadorizados da Tab.1, calcule o valor-p para a hipótese nula =0 (o fertilizante não influi na safra)

Solução:Ou, equivalentemente, podemos ter a mesma razão-t na última coluna da Tab.1

53,6005832,0

038095,0t

0025,0pValor598,5t

de além está 53,6tStudentt .Tab4.l.g

025,0

obs

Com tão pequena credibilidade, podemos rejeitar H0: concluímos que o fertilizante contribui, realmente, para aumentar a safra.

Page 13: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

13

Exemplo 3: Com base nos dados computadorizados da Tab.1, calcule o valor-p para a hipótese nula =0 (a precipitação pluviométrica não influi na safra)

Solução:Ou, equivalentemente, podemos ter a mesma razão-t na última coluna da Tab.1

40,5154303,0

833333,0t

005,0pValor604,4t

de além está 40,5tStudentt .Tab4.l.g

005,0

obs

Com tão pequena credibilidade, podemos também aqui rejeitar H0: concluímos que a chuva contribui para aumentar a safra.

Page 14: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

14

Costuma-se resumir os cálculos dos exemplos 2 e 3 dispondo-os em forma de equação, como se segue:

0,005 0,0025 p- Valor

5,40 6,53 t-Razão

0,43 0,016 C I

0,1543 0,0058 Padrão Erro

PLUV .PREC 83,0TEFERTILIZAN 038,028SAFRA

95%

Page 15: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

15

2. Coeficientes de Regressão como Fatores de Ampliação. a) Regressão Simples

X100 200 300 400 500 600 700

Y

Fig.2 –Interpretação do coeficiente angular

70

60

504030

Y=36+0,06X

1

06,0b

200

12

X

Yb

b=variação de Y correspondente a uma variação unitária de X

Variação de Y=b(Variação de X)

Page 16: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

16

Em estudos observacionais não-controlados coeficiente de regressão simples b nada prova quanto à causalidade.

O aumento de Y correspondente a um aumento unitário de X reflete não só o efeito de X mas também o efeito de todas as variáveis estranhas que estejam se modificando simultaneamente.

Para determinar especificamente o efeito de X sobre Y, devemos apelar para a regressão múltipla.

Page 17: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

17

2. Coeficientes de Regressão como Fatores de Ampliação.

b) Regressão Múltipla: “Outros Fatores Mantidos Iguais”

Y= a + bX + cZ

Se Z permanece constante, ainda é verdade que Y = b X:

Yinicial = a + bX + cZ

Ynovo = a + b(X+ X) + cZ

Y = b X

Page 18: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

18

Se o outro regressor Z permanece constante,

Variação de Y = b (Variação de X)

Qual seria o aumento da safra Y correspondente a um aumento de 5 lb do fertilizante X, supondo inalterada a precipitação pluviométrica?

Variação da safra = 0,038(5) = 0,19 bushel

Consideremos, por exemplo, o caso da safra de trigo: Y = 28 + 0,038X + 0,83Z

Page 19: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

19

Generalizando para o caso de k regressores:

Se Y = a + b1X1 + b2X2 +...+ bkXk

então b1 = variação de Y correspondente a uma variação unitária de X1, quando todos os outros regressores permanecem constantes

Page 20: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

20

Que ocorre se todos os regressores X variam simultaneamente?

A variação em Y é apenas a soma das variações individuais:

Se Y = a + b1X1 + b2X2 +...+ bkXk

então Y = b1 X1 + b2 X2 +...+ bk Xk

Page 21: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

21

Exemplo 4: As regressões simples e múltipla da safra sobre o fertilizante e a precipitação pluviométrica (chuva) são:

SAFRA = 36 + 0,059 FERT

SAFRA = 30 + 1,50 CHUVA

SAFRA = 28 + 0,038 FERT + 0,83 CHUVA

Page 22: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

22

a) Se um fazendeiro acrescenta 100 lb de fertilizante por acre, qual o aumento de safra que pode esperar?

Solução:

Quando o fazendeiro aumenta o fertilizante, não está modificando a precipitação pluviométrica em sua fazenda. Portanto, é a regressão múltipla que importa:

0,038(100) = 3,8 bushels

Page 23: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

23

b) Se ele irriga com 3 polegadas de água, qual o aumento de safra que pode esperar?

Solução:

Quando aumenta a água através de irrigação, o fazendeiro não está modificando o fertilizante em sua fazenda. Portanto, novamente aqui o que importa é a regressão múltipla:

0,83(3) = 2,5 bushels

Page 24: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

24

c) Se ele acrescenta 100 lb de fertilizante por acre e, simultaneamente, irriga com 3 polegadas de água, qual o aumento de safra que pode esperar?

Solução:

Quando os dois regressores variam simultaneamente: Y = 0,038(100) + 0,83(3)

Y = 3,8 + 2,5

Y = 6,3 bushels

Page 25: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

25

d) Já observamos que uma aplicação elevada de fertilizante tende estar associada a uma a uma alta precipitação pluviométrica, nos dados em que foram calculadas essas três equações de regressão.

Persistindo esta mesma tendência, qual o aumento de safra que se poderia esperar em um acre que recebesse mais 3 polegadas de água do que outro?

Page 26: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

26

Solução:

Não utilizaremos o coeficiente 0,83 ( regressão múltipla) porque o mesmo mostra como a safra aumenta em função da chuva somente (com o fertilizante constante). Em lugar disso, usaremos o coeficiente 1,50 que mostra como a safra aumenta com a chuva quando o fertilizante também varia:

1,50(3) = 4,5 bushels

Page 27: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

27

Resumindo:

O resultado da letra d) (4,5 bushels) é maior do que o da letra b) (2,5 bushels) porque este coeficiente de regressão simples (1,50) mostra como a safra é afetada pela precipitação pluviométrica e pelo aumento associado de fertilizante.

Observações: Admitimos que a irrigação artificial tivesse o mesmo efeito que a queda de chuva. Se tal hipótese não é justificada, as previsões em b) e c) podem estar bem longe da realidade.

Page 28: 1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)

28

PRATIQUE COM OS

EXERCÍCIOS .

BOA SORTE!