analise de regressão parte 2. interpretando valores x y um valor de y conhecendo x!
TRANSCRIPT
Analise de Regressão
Parte 2
Interpretando Valores
X
Y Um valor de Y conhecendo X!
Interpretando Valores
X
Y
Y
Y
Interpretando Valores e os Ruídos
X
Y
^
Yi (valor real)
*
Y
Interpretando os Valores e os Ruídos
X
Y
Y
^
Yi (valor real)
*
Y = b0 + b1X
Yi (valor estimado)^
Esta equação vai “procurar” passar no meio das distribuições para os possíveis valores de Y a partir de um dado valor X
Interpretando os Ruídos!
X
Y
Y
^
Yi (valor real)
*
Y = b0 + b1X
Yi (valor estimado)^
Yi^
YYi -
Yi - Y^
Yi -
Interpretando os ruídos / resíduos
YYi -
Resíduo Global ou Variação Total em Y
Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de
SQDy – Variação Total em Y
Yi - Y^
Variação de Y explicada pela regressão.
Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de
SQRegressão – Variação de Y explicada pela regressão
Yi -Yi
^Variação de Y Não explicada pela regressão.
Se elevar ao Quadrado e considerar o somatório de todos os possíveis valores obtenho o que se chama de
SQResíduo – Variação de Y não explicada pela regressão
Interpretando os Ruídos
X
Y
Y
^
Yi (valor real)
*Y
Y = b0 + b1X
Yi (valor estimado)^
Yi^
Yi -
Yi - Y^
Yi -
Modelo de Regressão Linearmais simples?!!
Yi
i
X
Y
0
1 Coeficienteangular
Y = E(Y) = 0 + 1 X
InclinaçãoPopulacional
InterceptoPopulacional
Erro Aleatório
Variável Independente
Variável Dependente Yi=0+1Xi +i
Ŷi=b0+b1Xi
i =Yi-Ŷi
Modelo estimado
Resíduo
Como?
10 1 1
2 2
1
ˆ b
n
i ii
n
ii
x y nxyb y x e
x nx
De onde surgiu? MMQO
Método dos Mínimos Quadrados Ordinários
MMQOYi
i
X
Y
0
1 Coeficienteangular
Y = E(Y) = 0 + 1 X
MMQOPara se encontrar o mínimo para uma equação, deve-se derivá-la em relação à “variável” de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente, ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados.
Derivando então a expressão (1) em relação aos parâmetros e igualando-as a zero, poderemos obter duas equações que, juntas, vão compor o chamado sistemas de equações normais. A solução desse sistema fornecerá:
Note: Novas Formas ou fórmulas!Será mesmo?
10 1 1
2 2
1
ˆ b
n
i ii
n
ii
x y nxyb y x e
x nx
Perguntas
Podemos extrapolar: isto é tentar avaliar previsões para fora do intervalo observado para os dados
= 1602,0971;
e
Erro Padrão da Estimativa: É a medida de variabilidade em torno da linha de regressão (isto é, o seu desvio padrão).
Medidas de Variação na Regressão e na Correlação
• Utilidade: – Verificar se a variável independente prevê
bem a variável dependente no modelo estatístico utilizado!
• Soma Total de Quadrados (STQ)• Coeficiente de Determinação• Coeficiente de Correlação Linear
Pressupostos da Regressão e da Correlação
• Normalidade• Afeta as inferências sobre os valores dos coeficientes de
regressão.
• Homocedasticidade• Afeta a forma de cálculo dos coeficientes de regressão
• Independência de Erros• Aplica-se, em especial, a valores coletados ao longo de
um período de tempo.
• Linearidade• O modelo utilizado não é adequado.
Análise dos Resíduos
( )i i ie Y Y
0
X
X
0
Erros Correlacionados
-4
-2
0
2
4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Estimativas de Intervalo de Confiança
• (valor médio)
• Efeito Banda de Confiança
2i n YX iY t S h
2 1i n YX iY t S h
Inferências sobre os Parâmetros: REGRESSÃO e CORRELAÇÃO
Testes de hipótese sobre o valor de 1.
Testes de hipótese sobre o valor de .
Testes de hipótese sobre o valor de 1
• Hipóteses:– Nula H0: 1 = 0 (não existe relação)– Alternativa H1: 1 0 (existe uma relação)
• Determinar o nível de significância do teste ()• Calcular a estatística do teste
– Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade)
• Concluir
Testes de hipótese sobre o valor de
• Hipóteses:– Nula H0: = 0 (não existe correlação)– Alternativa H1: 0 (existe correlação)
• Determinar o nível de significância do teste ()• Calcular a estatística do teste
– Comparar Região de Rejeição com a estatística do teste (Tabela da distribuição t com n-2 graus de liberdade)
• Concluir
Exercícios