distribuições bidimensionais

Upload: claudia3

Post on 19-Jul-2015

465 views

Category:

Documents


0 download

TRANSCRIPT

Escola secundaria de Lousada Ano lectivo 2010/2011

Estatstica Matemtica A

So estudos estatsticos, sobre dois caracteres da mesma populao(coleco de unidades individuais, que podem ser entre outras, pessoas, animais resultados experimentais, com uma ou mais caractersticas em com um, que se pretende analisar), com o intuito de verificar se existe algum tipo de relao entre eles ou se, pelo contrrio, so independentes. Em muitas situaes, a variao de um dos caracteres influencia a variao do outro.

EXEMPLOS: Idade e estatura Estatura e peso Ordenado e gastos

2500 2000 1500 P() 1000 500 0 0 5 10 A(m2) 15

p = 200a

Num centro comercial o preo a pagar por cada loja varivel, dependendo da rea ocupada. Cada metro quadrado custa 200 . Variveis: A- rea ocupada P- preo a pagar Ento p = 200a

Nem sempre a existncia de uma relao entre duas variveis do tipo funcional.Homem (X)21 24 24 26 28 25 32 38 29 28 Mulher (Y) 19 21 23 24 24 25 27 35 26 29

Num casamento de Santo Antnio, retirou-se a idade de alguns casais presentes. Neste estudo, a populao formada por um conjunto de pares ordenados(x , y), em que x e y representam os homens e as mulheres, respectivamente. A varivel ( x, y), designa-se por varivel estatstica bidimensional. Estes pares ordenados podem ser representados a partir de um sistema de eixos coordenados (diagrama de disperso).

Considera-se um sistema de eixos ordenados e marcam-se os pontos de coordenadas ( x; y), correspondentes aos homens e mulheres.

40 Idade de casais presentes num casamento de S. 35 30 Mulher (y) 25 20 15 10 5

Antnio

A este tipo de representao grfica d-se o nome de diagrama de disperso ou nuvem de pontos. Este diagrama permite concluir que h uma tendncia para a idade das mulheres aumentar medida que a idade dos homens.

00 10 20 Homem (x) 30 40

Nota: Para desenhar o diagrama de disperso, escolha as escalas de tal maneira que a figura parea quadrada. Esse cuidado ajuda a obter melhor viso da associao das variveis.

Chama-se ponto mdio ou centro de gravidade da nuvem de pontos ao ponto de coordenadas (x, y) , em que x representa a mdia da idade dos homens e y a mdia da idade das mulheres. Assim:40 x 21 y 19 35 30

Idade de casais presentes num casamento de S. Antnio

2424 26 28 25 32 38 21 28

2123 24 24 25 27 35 26 29

O ponto mdio : x 26,7 y 25,3 (x , y) = (26,7; 25,3)

Mulher (y)

25 20 15 10 5 0 0 10 20

26.7, 25.3

30

40

Homem (x)

Considere a seguinte tabela que mostra os quilmetros que um carro apresenta e a sua valorizao ao longo dos anos de uso. Construa um diagrama de disperso e descubra o ponto mdio.

carros 1 2 3 4 5 6 7 8 9 10 11 12

Quilmetros (milhares) 20 30 200 45 50 150 100 130 40 80 180 90

Preo (milhares de euros)30 28 1 19 15 8 10 9 20 14 7 13

Indica a fora e a direco do relacionamento linear entre duas variveis aleatrias. A anlise de correlao o instrumento estatstico que permite estudar relaes quantitativas. Existem 3 tipos de correlao: correlao positiva, correlao negativa e correlao nula. Correlao positiva: Existe uma tendncia para uma das grandezas aumentar medida que a outra aumenta.

Correlao negativa: Existe uma tendncia para uma das grandezas aumentar medida que a outra diminui.

Correlao nula: No h correlao , as variveis dizem-se independentes, ou seja, a variao de uma no influencia a outra.

Quando a correlao um pouco difcil de encontrar podemos encontra-la de uma maneira bastante simples. Assim: Seja ( x, y) uma distribuio bivariada. No diagrama de disperso ,as rectas paralelas aos eixos e que se intersectam no centro de gravidade ( x, y) dividem o plano em quatro quadrantes : I, II, III, IV. Se houver uma maior concentrao de pontos nos quadrantes I e III, a correlao positiva. Se houver uma maior concentrao de pontos nos quadrantes II e IV , a correlao negativa. Nos casos em que no existe uma maior predominncia de pontos nos quadrantes I e III, ou nos quadrantes II e IV, diz-se que no h correlao , uma correlao nula.

y

IIy(X ,Y )

I

III

IVx

x

Atravs do diagrama de disperso possvel, intuitivamente, verificar se h correlao e se esta positiva ou negativa. No entanto, possvel quantificar a correlao e concluir se mais ou menos forte. Uma das medidas estatsticas que permite estabelecer o grau de correlao existente entre as variveis denominada de coeficiente de correlao, que se representa por r e toma valores pertencentes ao intervalo [-1, 1].

Se r 0, a correlao negativa. Se r 0, a correlao positiva. Se r = 0, a correlao nula. Quando r =1 ou r = -1, os pontos do diagrama de disperso esto sobre uma recta. Essa recta tem declive positivo se r =1 e tem declive negativo se r = -1.

Na correlao positiva, quanto mais prximo de 1 for o valor de r mais forte a correlao.y y y

x

x

x

Correlao fraca

Correlao forte

Correlao forte perfeita

Na correlao negativa, quanto mais prximo de -1 for o valor de r mais forte a correlao.y y y

x

Correlao fraca

Correlao forte

x

x

Correlao forte perfeita

Na correlao nula, r = 0.y

x

Correlao nula

Pode-se utilizar a seguinte escala, para avaliar a intensidade da correlao:

1 ETAPA 2nd calc

stat

enter

2 ETAPA 2nd Y=

enter

3 ETAPA

Quando existe correlao entre variveis, muitas vezes interessa prever o valor de uma das variveis quando se conhece o valor correspondente a outra varivel. Ao fazer uma anlise de regresso, estudam-se as relaes existentes entre fenmenos, quando so feitas observaes de duas ou mais variveis, atravs das suas distribuies. Quando se observam somente duas variveis, a distribuio diz-se bidimensional. O processo que vamos utilizar consiste em traar uma recta que se aproxime aos pontos do diagrama de disperso. Existem processos matemticos para a determinao da equao dessa recta , chamada recta de regresso. Prova-se que essa recta passa pelo ponto mdio da nuvem de pontos e o declive igual ao do coeficiente de correlao.

y = mx + bDeclive Ordenada na origem

Na biblioteca municipal de Lousada 10 voluntrios registou-se o numero de leitores e o numero de livros que requisitaram , e elaborou-se a seguinte tabela . Qual o numero de leitores que se prev que sejam entrevistados por um voluntrio que levem 7 livros?8 7 6 N de leitores 5 4 y = 1.0483x - 4.0818 R = 0.8798

N de livros (x)5 6 6 8 8 8 9 9 10 10

N de leitores (y)1 2 3 3 4 5 5 6 6 7

O ponto mdio : x 7,9 y 4,2 (x , y) = (7,9; 4,2)

32 1 0 0 2 4 6 8 10 12

N de livros

Por observao do grfico conclui-se que a ordenada do ponto da recta de regresso que tem de abcissa 7 aproximadamente 3,2. assim prevse que haja 3 leitores.

E a equao da recta de regresso : y=1,0483x-4,0818

1 ETAPA2nd calc stat enter

2 ETAPA2nd Y= enter

3 ETAPA

4 ETAPAstat calc 4:LinReg( ax+b)

5 ETAPA

escrever L1, L2, , L3 L2

6 ETAPAa equao da recta

Decidimos averiguar, junto dos nossos colegas, qual a relao entre o nmero de faltas s aulas e o nmero de horas semanais de estudo. Elaborou-se o quadro ao lado: Represente, num sistema de eixos, o conjunto de pontos ( x, y), correspondente a: (nmero de faltas, n de horas semanais de estudo) Indique o tipo de correlao e justifique. Determine a recta de regresso .

Alunos 1 2 3 4

Numero de faltas 10 0 2 3

N de horas de estudo semanais 4 10 9 10

56 7 8 9 10 11 12

612 8 1 1 7 5 12

31 7 6 5 2 6 14