Download - Regressão Linear
-
Estatstica Prof. Ricardo Lus Rocha
Regresso Linear
Unidade 3
-
Estatstica Prof. Ricardo Lus Rocha
Ementa
3.1 Reta dos mnimos quadrados
3.2 Ajuste da reta de regresso linear simples
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Na unidade anterior estudamos a medida da
intensidade de correlao entre duas variveis.
Se chegarmos concluso de que h uma grande
correlao linear entre as variveis, devemos
determinar qual relao essa.
A determinao da relao linear entre duas
variveis chamada de regresso linear.
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Dada uma coleo de dados amostrais
emparelhados, a equao de regresso
descreve a relao entre as duas variveis. O grfico
da equao de regresso chamado de reta de
regresso (ou reta de melhor ajuste, ou reta de
mnimos quadrados).
xbby 10
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Esta equao descreve a relao entre x (chamada
varivel independente ou varivel preditora) e
(chamada varivel dependente ou varivel
resposta).
Na equao, b0 chamado de intercepto y e b1 o
coeficiente angular.
Para o clculo de b0 e b1, utilizamos as frmulas a
seguir.
y
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Repare que os dados necessrios para o clculo de b0e b1 so os mesmos para o clculo do coeficiente de
correlao linear r, o que torna a determinao de
uma reta de regresso muito simples aps o clculo
do coeficiente de correlao.
221
xxn
yxxynb
n
xbyb
1
0
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Variao marginal:
Ao trabalharmos com duas variveis relacionadas
por uma equao de regresso, a variao marginal
em uma delas o quanto ela varia quando a outra
varivel sofre uma variao de exatamente uma
unidade. A variao marginal igual ao valor do
coeficiente angular da reta b1.
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Outliers:
Em um diagrama de disperso, um ponto extremo
(outlier) um ponto que est muito afastado dos
demais pontos.
Pontos de influncia:
Os dados amostrais emparelhados podem conter um
ou mais pontos de influncia, que so pontos que
afetam fortemente o grfico da reta de regresso.
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Predies:
As equaes de regresso podem ser teis quando
usadas para predizer o valor de uma varivel, dado
um valor determinado da outra varivel.
Se a reta de regresso se ajusta bem aos dados, ento
tem sentido utilizar uma equao para fazer
predies.
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Na ausncia de correlao linear significativa, no
podemos usar a equao de regresso para projetar
ou predizer.
Em vez disso, a melhor estimativa da segunda
varivel simplesmente a sua mdia.
Devemos tambm lembrar que no podemos
extrapolar os valores da varivel independente, pois
no sabemos o comportamento da varivel
dependente y para valores no determinados de x.
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Exemplo:
Os pesos de ursos machos podem ser determinados
pelo seu comprimento?
Como visto anteriormente, h uma correlao entre o
peso e o comprimento dos ursos.
Determine agora a reta de regresso que relacione o
peso dos ursos com o seu comprimento.
Comprimento em pol (x) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
Peso em libras (y) 80 344 416 348 262 360 332 34
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Resoluo: Como visto anteriormente, este o
grfico de disperso dos dados.
0
50
100
150
200
250
300
350
400
450
0 10 20 30 40 50 60 70 80
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Calculando agora o valor de b0 e b1:
221
xxn
yxxynb
659,975,9433
91128
5,51675,345258
21765,516151879821
b
66,3518
5,516659,921760
b
n
xbyb
1
0
Equao da reta: = 9,659x 351,66y
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
A reta de regresso ser:
0
50
100
150
200
250
300
350
400
450
0 10 20 30 40 50 60 70 80
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Desta forma, podemos agora prever quanto pesar
um urso macho que mea 71,0 polegadas:
= 9,659x 351,66
= 9,659.71 351,66
= 334,13 libras
A variao marginal de 9,659, que diz que para
cada polegada de tamanho que o urso cresa, ele
pesar mais 9,659 libras.
yyy
Unidade 3 Regresso Linear
-
Estatstica Prof. Ricardo Lus Rocha
Unidade 3 Regresso Linear
- Qualidade do modelo de regresso linear:
Definies:
Desvio total: distncia vertical yy
Desvio explicado: distncia vertical yy
Desvio no-explicado: distncia vertical ,
tambm chamado de resduo.
yy
y = valor observadoy = mdia dos valores observadosy = valor predito pela equao de regresso
-
Estatstica Prof. Ricardo Lus Rocha
Unidade 3 Regresso Linear
a: Desvio Total: Valor Real Mdia
a
c: Desvio No Explicado: Valor Real Predito
c
b: Desvio Explicado: Valor
Predito Mdia
b
yy
yy
yy
y
y
y
y
-
Estatstica Prof. Ricardo Lus Rocha
Unidade 3 Regresso Linear
Mais definies:
Variao total: soma dos quadrados dos desvios
totais2)( yy
Variao explicada: soma dos quadrados dos desvios
explicados2)( yy
2)( yy
Variao no-explicada: soma dos quadrados dos
desvios no-explicados
-
Estatstica Prof. Ricardo Lus Rocha
Unidade 3 Regresso Linear
(d. Total) = (d. explicado) + (d. no-explicado)
yy = yy + yy
(v. total) = (v. explicada) + (v. no-explicada)
De maneira anloga:
2)( yy =2)( yy + 2)( yy
Relaes entre os desvios:
-
Estatstica Prof. Ricardo Lus Rocha
Unidade 3 Regresso Linear
Coeficiente de determinao:
Definio: Valor da variao de y que explicado
pela reta de regresso.
totalvariao
explicada variao2 r
2
2
2
)(
)(
yy
yyr
Obs.: Podemos calcular r2 tanto pela definio
acima, como simplesmente elevando ao quadrado o
coeficiente de correlao linear r
r2 sempre assumir valores entre 0 e 1
ou
-
Estatstica Prof. Ricardo Lus Rocha
Exerccio:
Os dados emparelhados abaixo consistem nos pesos
totais (y) de plstico descartados e tamanhos de
residncias (x).
Determine a equao de regresso, a variao
explicada, a variao no explicada, a variao total
e o coeficiente de determinao.
Peso 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Tamanho 2 3 3 6 4 2 1 5
Unidade 3 Regresso Linear