correlação e regressão linear - joinville.ifsc.edu.brjoinville.ifsc.edu.br/~joni.fusinato/eng...
TRANSCRIPT
• Existem situações nas quais há interesse em estudar o comportamentoconjunto de uma ou mais variáveis;
• Em muitos casos, a explicação de um fenômeno de interesse pode estarassociado a outros fatores (variáveis) que contribuem de algum modo para aocorrência deste fenômeno.
• O comportamento conjunto de duas variáveis quantitativas pode ser observadopor meio do gráfico de dispersão.
Introdução
Correlação e Regressão• Diagrama de Dispersão: representação gráfica da relação entre as
variáveis.• Correlação (r): mede o grau de relação entre duas variáveis.• Regressão: fornece uma função matemática que relaciona as
variáveis.
r = 0,802
y = 0,0056x + 1,350
Coeficiente de correlação linear de Pearson (r)
• Medida que avalia o quanto a “nuvem de pontos” no diagramade dispersão aproxima-se de uma reta.
• O resultado de r permite dizer se é adequado ou não a utilizaçãodo modelo linear para a modelagem de um fenômeno.
• Usar 3 casas decimais para arredondar o valor de r.
r > 0: Correlação Direta
r < 0: Correlação Inversa
r = 0: Correlação Nula
r Correlação0,000 Nula
0,000 ├ 0,350 Fraca0,350 ├ 0,650 Média0,650 ├ 0,950 Forte0,950 ├ 0,990 Muito forte
1,000 Perfeita
Interpretação do valor de r
• O valor de r informa como as variáveis X e Y se relacionam entre si. • Podemos adotar o critério de uma das tabelas:
r Correlação0,9 < r ≤ 1,0 Ótima0,8 < r ≤ 0,9 Boa0,7 < r ≤ 0,8 Razoável
0,6 < r ≤ 0,7 Medíocre0,5 < r ≤ 0,6 Péssima
r ≤ 0,5 Imprópria
Correlação linear positiva Correlação linear perfeita positiva
Correlação linear negativa Correlação linear perfeita negativa
Correlação não linear Correlação nula
• Resumindo: o termo correlação é usado em estatística para designar a força que mantém unidos dois conjuntos de valores.
• Caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função.
• A estimação dos parâmetros dessa função matemática é o objeto da regressão.
Regressão Linear Simples
Cálculo dos coeficientes
Equação da reta: y = mx + b
• Cuidado: As calculadoras geralmente (padrão) apresentam a equação da reta na forma y = A + Bx.
• Portanto A é o coeficiente linear e B é o coeficiente angular.
Linha de Regressão e Equação de Regressão linearVa
riáv
el D
epen
dent
e(Y
)
Variável Independente (X)
b: coeficiente linear
m: coeficiente angular (inclinação)
X : Tempo de estudo (em horas)
Y : Desempenho Acadêmico
1050
9,5
8,5
7,5
6,5
5,5
4,5
3,5
Tempo
Not
a
Diagrama de Dispersão
Exemplo 1: O diagrama relaciona o tempo de estudo com o desempenho acadêmico.a) Mostre se há relação entre o desempenho acadêmico e o tempo dedicado aos estudos.b) Caso houver a relação entre o desempenho e o tempo de estudo, apresente a função que relaciona as variáveis.
Tempo (X) Desempenho (Y)3,0 4,57,0 6,52,0 3,71,5 4,0
12,0 9,3
a) Para mostrar a relação entre as variáveis calculamos o valor de r.
• Usando a calculadora (Casio FX-82MS) digite Mode REG 3 eescolha 1 (LIN de Linear).
• Digite os valores dos pares (x,y) nesta ordem e aperte M+• Depois de inserir a sequência de pares ordenados digite Shift 2
deslocando o cursor até encontrar r e aperte a tecla 3 =• Como r = 0,996 podemos afirmar que há uma forte correlação
entre as variáveis.
b) Para encontrar a função que relaciona as variáveis usando acalculadora por padrão ela apresenta a equação da reta na formay = A + Bx portanto A é o coeficiente linear e B o coeficiente angular.
Equação da reta: y = 0,527x + 2,913
Exemplo 2: Relação entre consumo de cerveja e temperatura
Local Temperatura (X) Consumo (Y)
1 16 2902 31 3743 38 3934 39 4255 37 4066 36 3707 36 3658 22 3209 10 269
X: temperatura (em oC).
Y: consumo de cerveja diário por mil habitantes, em litros.
Exemplo 2: Relação entre consumo de cerveja e temperatura
As variáveis foram observadas em localidades com característicasdemográficas e sócio-econômicas semelhantes.a) Calcule e interprete a correlação entre as variáveisb) Determine a função que relaciona as variáveis.c) Calcule o consumo esperado para uma temperatura de 25 oC.
40302010
400
350
300
Temperatura
Con
sum
o
Diagrama de dispersão a) r = 0,962. A correlação entre as variáveis é forte.
b) y = 4,739x + 217,366
c) y = 4,739.25 + 217,366
y = 335,841 litros
Atividade Avaliativa• A atividade pode ser feita em duplas ou sozinho.
• Elaborar uma lista com 5 exercícios sobre regressão linear.• Os exercícios deverão ser digitados no Word. As tabelas devem ser
apresentadas assim como o gráfico correspondente de cada exercício.• Tabelas e gráficos podem ser feitos no Excel e depois copiados para o Word.• A apresentação da tabela e gráfico devem seguir as normas do IBGE.• O gráfico deve ter a equação da reta ajustada.• As fontes (livros e sites) usadas para a atividade devem ser citadas.• Entrega da atividade: envio para o e-mail [email protected] até dia
21/06/18.• O arquivo deve ser nomeado com o nome de um aluno ex: daniel.doc• O nome da dupla ou do aluno deve estar na folha de rosto do trabalho.• As aulas do dia 12/06 e 15/06 estarão liberadas para a realização da
atividade (pesquisa e digitação) ou tirar dúvidas sobre essa ou outrasatividades.
• Pontuação da atividade: 5,0 pontos.