correlaÇÃo e regressÃo prof. m.sc. ingrid millÉo 2012
TRANSCRIPT
CORRELAÇÃO E REGRESSÃO
PROF. M.Sc. INGRID MILLÉO2012
CORRELAÇÃO - DEFINIÇÃO• Segundo TRIOLA (2005):
“Existe uma correlação entre duas variáveis quando uma delas está relacionada com a outra de alguma maneira.”
CORRELAÇÃO• EXEMPLO:
– Idade e alturas das crianças– Tempo de prática de esporte e ritmo
cardíaco– Tempo de estudo e nota na prova– Taxa de desemprego e taxa de
criminalidade– Expectativa de vida e taxa de analfabetismo– Vendas e Gasto com publicidade
CORRELAÇÃOInvestigar a presença ou ausência de relação
linear sob dois pontos de vistas.
1. Quantificando a força dessa relação – Correlação;
2. Explicitando a forma dessa relação – Regressão.
Representação gráfica das duas variáveis quantitativas: Diagrama de dispersão
DIAGRAMA DE DISPERSÃO
• Um diagrama de dispersão é um gráfico no qual os dados amostrais emparelhados são plotados.
• Servem para mostrar, de forma mais clara, a relação entre duas variáveis.
CORRELAÇÃO POSITIVA
CORRELAÇÃO NEGATIVA
CORRELAÇÃO NÃO LINEAR
COEFICIENTE DE CORRELAÇÃO LINEAR
• O coeficiente de correlação linear r mede a intensidade da relação linear entre os valores quantitativos emparelhados x e y em uma amostra.
EXEMPLO• Usando os dados abaixo, calcule o
coeficiente de correlação linear.
X 1 1 3 5Y 2 8 6 4
MINITAB
EXCELL
EXEMPLO
EXEMPLO
INTERPRETAÇÃO DE r• O valor de r está sempre entre -1 e +1,
inclusive.
• Se r estiver muito próximo de 0, concluímos que não há correlação linear significante entre x e y.
INTERPRETAÇÃO DE r
• Se o valor absoluto do valor calculado de r exede o valor tabelado, concluímos que há uma correlação linear significativa. Caso contrário, não há evidência suficiente para apoiar a conclusão de uma correlação linear significativa.
EXEMPLO
• No exemplo anterior encontramos r = - 0,135.
• Será que podemos dizer que ele está “tão próximo de 0” para afirmar que não há correlação linear significativa?
EXEMPLO• Consultando o valor tabelado para n=4
temos para , o valor 0,950.• Comparando com o valor calculado para
r = - 0,135 temos:
• Podemos, então, concluir com mais precisão que não há correlação linear significativa entre as variáveis em questão.
TABELA DE CORRELAÇÃO
REGRESSÃO• Definição: dada uma coleção de dados
amostrais emparelhados, a equação de regressão,
descreve algebricamente a relação entre as duas variáveis.
REGRESSÃO• Calculo da inclinação :
REGRESSÃO• Calculo do intercepto y:
EXEMPLO• Para o exemplo anterior temos r = -
0,135 .• Calculamos primeiro a inclinação:
EXEMPLO• Agora calculamos o intercepto y:
EXEMPLO• Portanto a equação de regressão é:
PREDIÇÕES• Se não há correlação linear, o melhor
valor predito de y é .• Se há correlação linear, o melhor valor
predito de y é encontrado pela substituição do valor de x na equação de regressão linear.
• Na falta de uma correlação linear, não devemos usar a equação de regressão para projeções ou predições.
EXERCÍCIOS• LISTA 4