aula 2 regressão e correlação linear · esse coeficiente deve indicar o grau de intensidade da...

18
1 ESTATÍSTICA E PROBABILIDADE Aula 2 Regressão e Correlação Linear Professor Luciano Nóbrega

Upload: hadieu

Post on 29-Nov-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

1

ESTATÍSTICA E PROBABILIDADE

Aula 2

Regressão e Correlação LinearProfessor Luciano Nóbrega

2

Regressão e Correlação Quando consideramos a observação de duas ou mais

variáveis, surge um novo problema:-as relações que podem existir entre as variáveis estudadas.

Assim, quando consideramos variáveis como por exemplo:-peso e altura de um grupo de pessoas;-uso de cigarro e incidência de câncer;-horas trabalhadas e salário à receber; etc...

Procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação.

Sendo a relação entre as variáveis de natureza

quantitativa, dizemos que a correlação é o

instrumento adequado para descobrir e medir essa relação.

Uma vez caracterizada a relação, procuramos descrevê-la

através de uma função matemática. A regressão é o

instrumento adequado para a determinação dos parâmetros da função.

3

Correlação

As relações entre grandezas do tipo: perímetro e lado de um quadrado são conhecidas como relações funcionais, pois existe uma função que associa uma à outra. Aqui, perímetro = 4 x lado.

Enquanto que as grandezas do tipo: peso e altura são conhecidas como relações estatísticas, uma vez que, apesar de podermos fazer uma estimativa do peso de uma pessoa baseando-se na sua altura, não podemos formalizar uma expressão matemática.

Quando duas variáveis estão ligadas por uma relação

estatística, dizemos que existe correlação entre elas.

4

Correlação

Diagrama de dispersãoConsideremos uma amostra aleatória, formada por dez dos 98 alunos desta

classe e pelas notas obtidas por eles em Matemática Financeira e Estatística.Representando, em um plano

cartesiano, os pares ordenados (x,y), obtemos uma nuvem de pontos que

denominamos diagrama de dispersão.

Aluno Notas

Mat. Finaceira Estatística

A 5,0 6,0

M 8,0 9,0

O 7,0 8,0

T 10,0 10,0

Od 6,0 5,0

Os 7,0 7,0

V 9,0 8,0

Oc 3,0 4,0

Ê 8,0 6,0

Xs 2,0 2,0

5

Correlação

Correlação LinearSe os pontos obtidos, vistos em

conjunto, formam uma elipse diagonal, então essa correlação de

forma elíptica tem como “imagem”uma reta, e por isso é denominada

correlação linear.

6

Correlação

ClassificaçãoAssim, uma correlação pode ser:

- Linear positiva: se os pontos têm como imagem uma reta ascendente;

- Linear negativa: se os pontos têm como imagem uma reta descendente;

- Não-linear: se os pontos têm como imagem uma curva.

7

Correlação

Coeficiente de Correlação LinearO instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre as duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).

O coeficiente de correlação de Pearson é dado por:

Calma! Essa fórmula é mais fácil do que parece...

2222

iiii

iiii

yynxxn

yxyxnr

8

Correlação

2222

iiii

iiii

yynxxn

yxyxnr

Quando: r = +1 então há correlação positiva entre duas variáveis;r = -1 então há correlação negativa;

r = 0 então não há correlação entre as variáveis.

Onde: r → é o coeficiente de correlação;r está sempre entre -1 e 1n → é o número de observações;

xi e yi → são as observações de uma mesma linha.

O numerador é a diferença entre “ o somatório de „xi e yi‟ multiplicado por

„n‟ ” e “ o produto entre o somatório de „xi‟ e o somatório de „yi‟ ”

O denominador é o produto entre “ o somatório dos quadrados de xi

multiplicado por n menos o quadrado do somatório de xi ” e “ a

mesma coisa só que y ao invés de x ”.

9

Correlação

Para que o Coeficiente de Correlação de Pearson possa descrever um resultado expressivo, é imprescindível que ele se aproxime de uma função linear. Isso ocorre quando verificamos que o diagrama de dispersão se comporta aparentemente como uma reta.

Algebricamente, podemos tirar conclusões segundo os parâmetros:

0,6 ≤ | r | ≤ 1 → Ideal

0,3 ≤ | r | < 0,6 → Correlação Fraca

0 < | r | < 0,3 → Correlação Muito Fraca

Não serve!

r = 0 → Não existe Correlação.

10Exemplo:Vamos calcular o coeficiente de correlação da tabela que segue:

Aluno Notas

Mat. Finaceira Estatística

A 5,0 6,0

M 8,0 9,0

O 7,0 8,0

T 10,0 10,0

Od 6,0 5,0

Os 7,0 7,0

V 9,0 8,0

Oc 3,0 4,0

Ê 8,0 6,0

Xs 2,0 2,0

Total

xifi xi2 yi

2

2222

iiii

iiii

yynxxn

yxyxnr

11Exemplo:Calcule o coeficiente de correlação da tabela que segue:

xi 4 6 8 10 12

Yi 12 10 8 12 14

12

Regressão

Ajustamento da RetaSempre que desejamos estudar determinada variável em

função de outra fazemos uma análise de regressão.

Supondo “ X ” a variável independente e “ Y ” a

dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja,

vamos obter uma função definida por: Y = aX + bonde “a” e “b” são parâmetros.

A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas

variáveis, partindo de “ n ” observações das mesmas.

A variável a qual desejamos fazer uma estimativa recebe

o nome de variável dependente e a outra recebe o

nome de variável independente.

13

Regressão

Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, como as que formam a tabela a seguir:

xi 5 8 7 10 6 7 9 3 8 2

yi 6 9 8 10 5 7 8 4 6 2

Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por:

Y = aX + b. Onde:“n” é o número de

observações;“ x ” é a média dos

valores de x;“ y ” é a média dos

valores de y.

14

Regressão

Vamos então completar a tabela:

5,0 6,0

8,0 9,0

7,0 8,0

10,0 10,0

6,0 5,0

7,0 7,0

9,0 8,0

3,0 4,0

8,0 6,0

2,0 2,0

Total

xiyi xi2 yi

2

a = ?x = ?y = ?b = ?Y = ?

15

Regressão

Solução:

Assim, podemos estimar valores que não pertenciam à tabela inicial:

Exemplo:Se X = 4,0, temos

Y = 4,33Se X = 1,0, temos

Y = 1,75

16Exemplo:Calcule o ajustamento de uma reta para os dados:

xi 2 4 6 8 10 12 14

Yi 30 25 22 18 15 11 10

∑xiyi = ?∑xi

2 = ?

17

1 – A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura:

Testando seus conhecimentos

Temperatura 10 15 20 25 30

Comprimento 1,003 1,005 1,010 1,011 1,014

a) Construa o diagrama de dispersão;b) Calcule o coeficiente de correlação;c) O ajustamento da reta;d) O valor estimado do comprimento da barra para uma temperatura de 18º C;e) O valor estimado da temperatura quando a barra medir exatamente 1