prof. carlos h. c. ribeiro [email protected] mb751 – modelos de previsão

25
Prof. Carlos H. C. Ribeiro [email protected] MB751 – Modelos de previsão MB751 – Modelos de previsão

Upload: internet

Post on 17-Apr-2015

111 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Prof. Carlos H. C. [email protected]

MB751 – Modelos de previsãoMB751 – Modelos de previsão

Page 2: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Aula 3

Análise de variância e correlação

Testes de hipótese

Intervalos de confiança

Regressão e correlação

2

Page 3: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

3

abXY i ˆ

ii

iiiYYyXXx

ii

ii

i

i iii

ii

i iiii

x

xy

XX

XXYY

XXN

YXYXN

biiii

2

,

22

2

Simplificação das expressões para regressão linear MQ

XbYN

X

bN

Y

a ii

ii

Exemplo 6

Page 4: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Regressão linear MQ: propriedades adicionais

Estimativa do coeficiente b:

Estimativa do coeficiente a:

Covariância do par a,b:

4

iix

bbbE2

2ˆvar ˆ

ii

ii

xN

X

aaaE2

2

2ˆvar ˆ

iiX

XbEbaEaEbaCov

2

2

ˆˆˆˆ)ˆ,ˆ(

Variância do erro

Page 5: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Decomposição da soma dos quadrados

Objetivo: estudar a variação da variável dependente Y.

Que parcela da variação é causada pela variação de X?

Que parcela da variação não é “explicada” pela variação de X?

5

X

Y

Y

Y

YX ,

YY ˆ

YY ˆ

yyYYYYYY ˆˆˆ

Page 6: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Decomposição da soma dos quadrados

6

yyYYYYYY ˆˆˆ

i

ii

iii

i xyby 22 ˆ

Variação total de Y

Parcela devida à X

Parcela residual

Page 7: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Análise de variância (ANOVA)

7

Fonte de variação de

Y

Variação ou soma de quadrados

Soma de quadrados

média

Variável X

resíduo

Variável X + resíduo

i

ii xybVE ˆ

22 ˆ i

iii

i YYVR

y

iyVT 2

kVE

12

kN

VRs

1NVT

Estatística F = (VE/k)/(VR/N-k-1): testa a significância do efeito das variáveis independentes sobre Y

Estatística t: testa significância dos parâmetros estimados.

ii

b

xs

bbt

2

2

ˆ

ii

ii

a

xN

Xs

aat

2

22

ˆ

Variância residual s2: mede grau de dispersão entre valores observados e estimados Coeficiente de determinação R2

= VE/VT = 1-VR/VT: indica a parcela da variação de Y explicada pela variação de XObservação: k é o número de variáveis independentes

Exemplo 7

Page 8: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Intervalos de confiança e testes de hipóteses

Podemos agora tentar definir intervalos de confiança e testes de hipóteses envolvendo a e b:Intervalos de confiança: que faixa de valores tem probabilidade

alta (ou nível de significância baixo) de conter os valores verdadeiros dos parâmetros (a ou b)

Testes de hipóteses: qual a probabilidade de que um modelo obtido por regressão linear tenha seus parâmetros estimados próximos aos valores reais?

Probabilidade = 1- Nível de significância

8

Page 9: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Exemplo Uma tentativa de explicar o consumo C em função da renda R:

Hipótese: b deve ser positivo, pois se a renda aumenta, o consumo deve aumentar.

Teste sobre hipótese nula (b=0). O objetivo é tentar rejeitar esta hipótese. Como?

1. Tento achar uma estimativa de b suficientemente > 0, para causar dúvida sobre a validade da hipótese nula. Suponha que a estimativa indique b = 0.9.

2. Suponha que para o valor estimado, o intervalo de confiança para um nível de significância de 10% seja: 0,6 < b < 1,2.

Isto quer dizer que P(0,6 < b < 1,2) = 100% - nível de significância = 90%.

Ou seja, rejeitamos a hipótese nula com nível de confiança de 90%.

9

bRaCE

Page 10: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Teste de hipótese em Econometria

Teste sempre para um dado modelo: aceitação ou rejeição deste modelo.

Normalmente nível de significância 5%, mas dependendo dos dados disponíveis posso ser mais ou menos preciso.

Rejeitar a hipótese nula significará aceitar o modelo, a menos que novos dados contrariem esta conclusão.

Teste usual: t. Adequado para variâncias desconhecidas.

10

Page 11: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Teste de hipótese usando teste FTeste F: testa a significância das variáveis independentes (no caso, X)

sobre Y:

Hipótese nula H0: X não afeta Y (b=0).

Hipótese não-nula H1: X afeta Y (b0).

1. Calculo o número de graus de liberdade no numerados (k=1) e no denominador (N-k-1 = N-2).

2. Defino o nível de significância.

3. Obtenho o valor crítico de teste Fc (tabelado).

4. Calculo F F > Fc ? Rejeito a hipótese b=0 no nível de significância. F < Fc ? Aceito a hipótese b=0 no nível de significância.

11

Page 12: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Teste de hipótese usando teste tTeste t: Testa significância dos parâmetros a e b:

Três conjuntos de hipóteses a testar para v = a ou b: v = 0 ou v 0: efeito positivo ou negativo (teste bilateral)

v = 0 ou v > 0: efeito positivo (teste unilateral positivo)

v = 0 ou v < 0: efeito negativo (teste unilateral negativo)

As hipóteses a testar dependem do interesse para o problema.

1.Defino o teste (unilateral ou bilateral).

2.Calculo o número de graus de liberdade N-k-1 = N-2.

3.Defino o nível de significância.

4.Obtenho o valor crítico de teste tc (tabelado).

5.Calculo t |t| > |tc| ? Rejeito ausência de efeito no nível de significância. |t| < |tc| ? Aceito ausência de efeito no nível de significância.

12

Page 13: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Exemplo 8

13

Exemplo 8

Page 14: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Exercício 2

Dia 1 2 3 4 5 6 7 8 9 10

Notas na prova 9 8 8 9 7 9 8 7 9 6

Horas de sono na véspera 8 6 6 8 9 6 5 8 8 6

14

Exercício 2

a) Elaborar a tabela ANOVAb) Calcular R2 e a estatística Fc) As notas do aluno foram afetadas pelas horas de sono na véspera? Verifique de acordo com o modelo de regressão linear e nivel de significância 0,01

Page 15: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Observações para a lista 1

SQE = VE (soma dos quadrados explicados)

SQT = VT (soma dos quadrados dos totais)

SQR = VR (soma dos quadrados dos resíduos)

“fazer o teste F” significa fazer teste F com nível de significância 0,05

“fazer o teste t” significa fazer teste t com nível de significância 0,05 para cada um dos coeficientes da reta.

15

Page 16: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

O que vimos até agora

O modelo de regressão linear a duas variáveis Para tentar explicar a relação entre duas variáveis (X e Y) a partir de um

conjunto de dados

Método dos mínimos quadrados Para achar os coeficientes da reta de regressão linear

Análise de variância (ANOVA) Para avaliar a reta de regressão e determinar quão bem ela aproxima os

dados

Testes de hipótese: F e t No caso geral: para avaliar estatisticamente a validade de uma hipótese

No caso específico de regressão linear, é parte do “kit”ANOVA

16

Page 17: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Intervalos de confiança

Define o intervalo dentro do qual o valor verdadeiro do parâmetro estará, com uma dada probabilidade.

Teste usual: t

O procedimento a seguir pode ser usado para determinar intervalos de confiança para qualquer parâmetro estimado.

17

Page 18: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Intervalo para b (unilateral +)

Defino:

NC (nível de confiança) = 1 – NS (nível de significância)

Portanto (aula passada):

P(tc > tb) = 1 – P(tc tb) = 1 – NS = NC

Mas

e portanto...

18

b

ii

b s

bb

x

s

bbt

ˆˆ

2

2

NCtsbbP cb ˆ

Page 19: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Intervalo para b (unilateral -)

19

NCtsbbP cb ˆ

Intervalo para b (bilateral)

NCtsbbtsbP cbcb ˆˆ

Exemplo 9

Page 20: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Regressão e correlação

20

X

Y

.. ..

..

.....

...

.

.

... .

.

X_

y=Y-Y_

x=X-X_

I: xy>0

III: xy > 0

II: xy < 0

IV: xy < 0

Y_

Page 21: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Correlação: ideia intuitivaMuitos pontos no Quadrante I:

– xy > 0 para muitos pontos

– some dos xy tende a ser positivo alto (soma de números positivos)

Muitos pontos no Quadrante II: – xy < 0 para muitos pontos

– some dos xy tende a ser negativo com módulo alto (soma de números negativos)

Muitos pontos no Quadrante III: – xy > 0 para muitos pontos

– some dos xy tende a ser positivo com alto (soma de números positivos)

Muitos pontos no Quadrante IV: – xy < 0 para muitos pontos

– some dos xy tende a ser negativo com módulo alto (soma de números negativos)

Pontos distribuídos em vários quadrantes:– xy > 0 para alguns pontos e xy < 0 para outros

– soma dos xy tende a ser positivo baixo ou negativo com módulo baixo.

21

Correlação -

Correlação +

Correlação +

Correlação -

Baixa Correlação

Page 22: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Correlação: definição formal

Coeficiente de correlação:

Pode-se mostrar que:

22

ii

ii

iii

yx

yx

r22

y

x

ii

ii

S

Sb

N

y

N

x

br ˆ

1

1ˆ2

2

Um teste para b também é um teste para r

0 então 0ˆ Se

0 então 0ˆ Se

0 então 0ˆ Se

rb

rb

rb

Page 23: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Exemplo

23

Exemplo 10

Page 24: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Diferença entre regressão e correlação

Regressão relaciona a variável independente à variável dependente, ou seja, procura gerar uma explicação (reta de regressão, no caso da regressão linear) para a variação em Y causada por variações em X. Meço a regressão através do coeficiente de determinação R2.

Correlação mede a associação entre X e Y, sem considerar que variável é dependente ou independente. Meço a correlação através do coeficiente de correlação r.

24

Page 25: Prof. Carlos H. C. Ribeiro carlos@ita.br MB751 – Modelos de previsão

Atividade 1 (tarde)

Município A B C D E F G H I JProdução agrícola (Y) 20 60 110 140 130 100 110 130 110 90Índice pluviométrico (X) 20 30 60 90 120 150 180 100 70 40

25

Atividade 1T

a) Plotar os pontos no sistema x-y.

b) Calcular a correlação entre a produção agrícola e o índice pluviométrico. O que pode ser concluído?