correlação e regressão linear - joinville.ifsc.edu.brjoinville.ifsc.edu.br/~joni.fusinato/eng...

16
Correlação e Regressão Linear Prof.: Joni Fusinato [email protected] [email protected]

Upload: nguyendieu

Post on 18-Nov-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

Correlação e Regressão Linear

Prof.: Joni Fusinato

[email protected]

[email protected]

• Existem situações nas quais há interesse em estudar o comportamentoconjunto de uma ou mais variáveis;

• Em muitos casos, a explicação de um fenômeno de interesse pode estarassociado a outros fatores (variáveis) que contribuem de algum modo para aocorrência deste fenômeno.

• O comportamento conjunto de duas variáveis quantitativas pode ser observadopor meio do gráfico de dispersão.

Introdução

Correlação e Regressão• Diagrama de Dispersão: representação gráfica da relação entre as

variáveis.• Correlação (r): mede o grau de relação entre duas variáveis.• Regressão: fornece uma função matemática que relaciona as

variáveis.

r = 0,802

y = 0,0056x + 1,350

Coeficiente de correlação linear de Pearson (r)

• Medida que avalia o quanto a “nuvem de pontos” no diagramade dispersão aproxima-se de uma reta.

• O resultado de r permite dizer se é adequado ou não a utilizaçãodo modelo linear para a modelagem de um fenômeno.

• Usar 3 casas decimais para arredondar o valor de r.

r > 0: Correlação Direta

r < 0: Correlação Inversa

r = 0: Correlação Nula

r Correlação0,000 Nula

0,000 ├ 0,350 Fraca0,350 ├ 0,650 Média0,650 ├ 0,950 Forte0,950 ├ 0,990 Muito forte

1,000 Perfeita

Interpretação do valor de r

• O valor de r informa como as variáveis X e Y se relacionam entre si. • Podemos adotar o critério de uma das tabelas:

r Correlação0,9 < r ≤ 1,0 Ótima0,8 < r ≤ 0,9 Boa0,7 < r ≤ 0,8 Razoável

0,6 < r ≤ 0,7 Medíocre0,5 < r ≤ 0,6 Péssima

r ≤ 0,5 Imprópria

Correlação linear positiva Correlação linear perfeita positiva

Correlação linear negativa Correlação linear perfeita negativa

Correlação não linear Correlação nula

• Resumindo: o termo correlação é usado em estatística para designar a força que mantém unidos dois conjuntos de valores.

• Caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função.

• A estimação dos parâmetros dessa função matemática é o objeto da regressão.

• Determina a equação da reta ajustada (modelo matemático linear).

Regressão Linear Simples

Regressão Linear Simples

Cálculo dos coeficientes

Equação da reta: y = mx + b

• Cuidado: As calculadoras geralmente (padrão) apresentam a equação da reta na forma y = A + Bx.

• Portanto A é o coeficiente linear e B é o coeficiente angular.

Linha de Regressão e Equação de Regressão linearVa

riáv

el D

epen

dent

e(Y

)

Variável Independente (X)

b: coeficiente linear

m: coeficiente angular (inclinação)

X : Tempo de estudo (em horas)

Y : Desempenho Acadêmico

1050

9,5

8,5

7,5

6,5

5,5

4,5

3,5

Tempo

Not

a

Diagrama de Dispersão

Exemplo 1: O diagrama relaciona o tempo de estudo com o desempenho acadêmico.a) Mostre se há relação entre o desempenho acadêmico e o tempo dedicado aos estudos.b) Caso houver a relação entre o desempenho e o tempo de estudo, apresente a função que relaciona as variáveis.

Tempo (X) Desempenho (Y)3,0 4,57,0 6,52,0 3,71,5 4,0

12,0 9,3

a) Para mostrar a relação entre as variáveis calculamos o valor de r.

• Usando a calculadora (Casio FX-82MS) digite Mode REG 3 eescolha 1 (LIN de Linear).

• Digite os valores dos pares (x,y) nesta ordem e aperte M+• Depois de inserir a sequência de pares ordenados digite Shift 2

deslocando o cursor até encontrar r e aperte a tecla 3 =• Como r = 0,996 podemos afirmar que há uma forte correlação

entre as variáveis.

b) Para encontrar a função que relaciona as variáveis usando acalculadora por padrão ela apresenta a equação da reta na formay = A + Bx portanto A é o coeficiente linear e B o coeficiente angular.

Equação da reta: y = 0,527x + 2,913

Exemplo 2: Relação entre consumo de cerveja e temperatura

Local Temperatura (X) Consumo (Y)

1 16 2902 31 3743 38 3934 39 4255 37 4066 36 3707 36 3658 22 3209 10 269

X: temperatura (em oC).

Y: consumo de cerveja diário por mil habitantes, em litros.

Exemplo 2: Relação entre consumo de cerveja e temperatura

As variáveis foram observadas em localidades com característicasdemográficas e sócio-econômicas semelhantes.a) Calcule e interprete a correlação entre as variáveisb) Determine a função que relaciona as variáveis.c) Calcule o consumo esperado para uma temperatura de 25 oC.

40302010

400

350

300

Temperatura

Con

sum

o

Diagrama de dispersão a) r = 0,962. A correlação entre as variáveis é forte.

b) y = 4,739x + 217,366

c) y = 4,739.25 + 217,366

y = 335,841 litros

Atividade Avaliativa• A atividade pode ser feita em duplas ou sozinho.

• Elaborar uma lista com 5 exercícios sobre regressão linear.• Os exercícios deverão ser digitados no Word. As tabelas devem ser

apresentadas assim como o gráfico correspondente de cada exercício.• Tabelas e gráficos podem ser feitos no Excel e depois copiados para o Word.• A apresentação da tabela e gráfico devem seguir as normas do IBGE.• O gráfico deve ter a equação da reta ajustada.• As fontes (livros e sites) usadas para a atividade devem ser citadas.• Entrega da atividade: envio para o e-mail [email protected] até dia

21/06/18.• O arquivo deve ser nomeado com o nome de um aluno ex: daniel.doc• O nome da dupla ou do aluno deve estar na folha de rosto do trabalho.• As aulas do dia 12/06 e 15/06 estarão liberadas para a realização da

atividade (pesquisa e digitação) ou tirar dúvidas sobre essa ou outrasatividades.

• Pontuação da atividade: 5,0 pontos.

https://www.youtube.com/watch?v=5Nmzd9slQk0 – Correlação e Regressão Linear usando a calculadora.

https://www.youtube.com/watch?v=rTcp161k8q4 – Diagrama de Dispersão: Teoria + Exemplo no Excel.