4013759 introducao a probabilidade ppt

Post on 04-Aug-2015

45 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Introdução

Se tomarmos um determinado sólido, sabemos que a uma certa temperatura haverá a passagem para o estado líquido: Experimento Determinístico.

Quais as chances das vendas de uma empresa crescerem? Existem dois resultados possíveis: as vendas crescem ou não crescem Experimento Aleatório.

Experimento Aleatório

Processo de observação cujo resultado não é determinado.

O que caracteriza um experimento aleatório

- A possibilidade de repetição sob as mesmas condições- Os resultados não são determinados a priori - Existência de regularidade quando o número de

repetições é grande.

Exemplo 1: Experimentos Aleatórios

a) Lançar uma moeda honesta.b) Lançamento de um dado.c) Lançamento de duas moedas.d) Retirada de uma carta de um baralho completo

de 52 cartas.e) Determinação da vida útil de um componente.

Espaço de Resultados: Espaço Amostral

Conjunto de todos os possíveis resultados de um experimento.

Um resultado do espaço amostral é chamado de evento.

Representa-se por Ω.

Ω pode ser quantitativo (discreto ou contínuo)ou qualitativo.

i) No lançamento de um dado Ω = 1,2,3,4,5,6. Ω é discreto.ii) Observar os momentos de entrada X e saída Y de um clientede uma loja no período 9 – 19 horas . Ω é contínuo.

Ω = (X,Y): 9 < X < Y< 19

Espaços Amostrais do Exemplo 1a) Ω = c, rb) Ω = 1,2,3,4,5,6c) Ω = (c, r), (c,c), (r,c), (r,r)d) Ω = A0,...,K0,Ap,...,Kp,AE,..,KE,AC,...,KCe) Ω = t ∈ ℜ / t ≥ 0

Exemplo 2 : Evento Aleatório

Lançam dois dados iguais. Enumerar os seguintes eventos:

A: saída de faces iguais.B: saída de faces cuja soma seja igual a 10C: saída das faces cuja soma seja menor que 2D: saída das faces cuja soma seja menor que 15E: saída das faces onde uma face é o dobro da outra.

Espaço amostral do exemplo 2

1 2 3 4 5 61 (1,1) (1,2) (1,3) (1,4) (1,5)

(2,5)

(3,5)(4,5)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)(6,5)

(1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,6)4 (4,1) (4,2) (4,3) (4,4) (4,6)

6 (6,1) (6,2) (6,3) (6,4) (6,6)

Os eventos do exemplo 2A=(1,1),(2,2), (3,3), (4,4), (5,5), (6,6)B=(4,6), (5,5),(6,4)C=∅D=ΩE=(1,2),(2,1), (2,4),(3,6),(4,2),(6,3)

Classe de Eventos AleatóriosÉ o conjunto formado de todos os eventos (subconjuntos) do espaço amostral.Considere como exemplo um espaço amostral finito:

Ω = e1,e2,e3,e4A classe de eventos aleatórios F(Ω)

φe1,e2,e3,e4(e1,e2), (e1,e3), (e1,e4), (e2,e3) , (e2,e4), (e3,e4)(e1,e2,e3), (e1,e2,e4), (e1,e3,e4), (e2,e3,e4) (e1,e2,e3, e4)

O número de eventos de um espaço amostral é F(Ω)=2n .Usando esse espaço amostral temos que o número de eventos é 24

⎟⎟⎠

⎞⎜⎜⎝

⎛04

⎟⎟⎠

⎞⎜⎜⎝

⎛14

⎟⎟⎠

⎞⎜⎜⎝

⎛24

⎟⎟⎠

⎞⎜⎜⎝

⎛44

⎟⎟⎠

⎞⎜⎜⎝

⎛34

Propriedades com Eventos Aleatórios

Considere Ω = e1,e2,...,en. Sejam A e B dois eventos de F(Ω).Operações

Uunião: A ∪ B =ei ∈ Ω / ei ∈ A ou ei ∈ B . O evento formado pelos elementos que pertencem a pelo menos um dos eventos.

A BΩ

Propriedades com Eventos Aleatórios

OperaçõesInterseção. A ∩ B =ei ∈ Ω / ei ∈ A e ei ∈ B . O evento formado pelos elementos que pertencem simultaneamente aos dois eventos.

A B

A ∩ B

Ω

Propriedades com Eventos Aleatórios

Complementação: AΩ/eeAAΩ ii ∉∈==−

ΩAA

__

=−Ω A__

A

Exemplo 3: Lançam-se duas moedas. Sejam A: saída de faces iguais e B=saída de cara na primeira moeda.Determine

a) A∪Bb) A∩Bc) ,d) e) f) g) h) B-Ai) A-B

A B

BA∩BA∩

BA∪

BA∪

Resolução do Exemplo 3 Ω = (c,c), (c,r), (r,r), (r,c).A= (c,c), (r,r)B= (c,c), (c,r)

a) A∪B = (c,c, (c,r), (r,r)

b) A∩B=(c,c)

c) ,

d)

e)

f)

g)

h) B-A = (c,r)

i) A-B=(r,r)

c)(r,r),(c,A =

r)(r,c),(r,r),(c,BA =∩c)(r,BA =∩

c)(r,BA =∪

r)(r,c),(r,r),(c,BA =∪

r)(r,c),(r,B =

Propriedades das Operações

a) Idempontentes: A∩A=A, A∪A = A.b) Comutativas: A ∪ B=B∪A,

A ∩ B=B ∩ Ac) Associativas: A ∩ (B ∩ C)= (A ∩ B) ∩ C

A ∪ (B ∪ C)= (A ∪ B) ∪ C)d) Distribuitivas: A ∪ (B ∩ C)= (A ∪ B) ∩ (A ∪ C)

A ∩ (B ∪ C)= (A ∩ B) ∪ (A ∩ C)

Propriedades das Operaçõese) Absorções: A ∪ (A ∩ B)=A, A ∩ (A ∪ B)=Af) Identidades: A ∩ Ω =A, A ∪ Ω = Ω

A ∩ ∅ = ∅, A ∪ ∅ =Ag) Complementares:

g) Leis de Morgan

A)A(Ω,AA

,AAΩ,,Ω

==∪

φ=∩=φφ=

BAB) (A c ∪=∩BAB) (A c ∩=∪

Partição de um Espaço Amostral

Dizemos que os eventos A1,...,An formam uma partição do espaço amostral Ω se:

Ω=

≠φ=∩=φ≠

=U

n

1ii

ji

i

Ac)

ji,AA b)n,...,1i,A a)

A1 A4A6

A2

A5A3

Eventos Mutuamente ExclusivosDois eventos A e B são mutuamente exclusivos se eles

não puderem ocorrer simultaneamente, isto é

A ∩ B = ∅

Exemplo: No lançamento de um dado A: saída impar e B é saída par, então

A: 1,3,5 B: 2,4,6

c

b a

d

e

Permite contar o número de resultados quando n objetos estão para ser selecionados a partir de um conjunto de N objetos, SEM LEVAR EM CONTA A ORDEM DELES.

)!nN(!n!N

nN

CNn −

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

Experimentos de Contagem Combinações

cb a

de

N=5 e n=2

Ω= a,b, a,c, a,d, a,eb,c, b,d, b,e,c,d, c,e,d,e

10)!25(!2

!525

C52 =

−=⎟⎟

⎞⎜⎜⎝

⎛=

Exemplo 4

Experimentos de Contagem com Permutações

c

b a

d

e

Permite contar o número de resultados quando n objetos estão para ser selecionados a partir de um conjunto de N objetos,LEVANDO EM CONTA A ORDEM DELES.

)!nN(!N

nN

!nPNn −

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

Exemplo 5

c

b a

d

e

N=5 e n=2

Ω= a,b, b,a a,c, c,a a,d, d,a, a,e. e,ab,c, c,b b,d, d,b, b,e,e,bc,d, d,c, c,e, e,cd,e, e,d

20)!25(

!525

!2P52 =

−=⎟⎟

⎞⎜⎜⎝

⎛=

Introdução1 - Conceito Clássico

Se uma experiência tem N resultados possíveis e igualmente prováveis e nA é o número de resultados de um evento A então a probabilidade de A é

Exemplos: • Lançamento de um dado. Seja A o evento que registra a saída par.

• Lançamento de uma moeda. Seja A o evento que registra coroa

Nn)A(P A=

21)A(P =

21)( =AP

Introdução2 – Conceito Frequentista

Se em N realizações de um experimento, o evento A ocorre nA vezes, então a frequência relativa de A nasN realizações é

e a probalidade é

Exemplo: Uma experiência que consiste em observar o sexo de um recém-nascido. Tal experiência já se realizou diversas vezes e existem registros do seu resultado.

Ω = masculino, femininoP(masculino)=0,52 e P(feminino)=0.48

NnF A

A =

Nnlim)A(P A

N ∞→=

Introdução3 – Conceito subjetivo

A probabilidade é dada por um grau de crença ou de confiança que cada pessoa dá a realização de um evento.

Exemplo: O ministro afirma que a inflação para o próximo ano será de 3% com uma probabilidade de 90%.

.

Definição Formal de Probabilidade

Dado um experimento aleatório E e um evento A do espaço amostral Ω. A probabilidade de A P(A) é uma função que associa um evento um número real, satisfazendo os seguintes axiomas:

1) P(A) ≥ 0 ∀ A ⊆ Ω2) P(Ω) = 13) Sendo A e B dois eventos mutuamente exclusivos

ou seja A∩B=∅, tem-se que

P(A∪B) = P(A) + P(B)

Probabilidade de um eventoExemplo

Considere um experimento de seleção de cartas de um baralho. Cada carta tem a probabilidade 1/52.

A: a carta selecionada é um ASP(A) = 1/52+1/52+1/52+1/52=4/52

Principais Teoremas

1. Se φ é o conjunto vazio então P(φ)=0Demonstração:

Seja A um evento qualquer. Considerando que A∩ φ= φ temos que P(A ∪φ)=P(A)+P(φ) (Axioma 3).Como A ∪φ=A então, P(A) = P(A)+ P(φ). Logo P(φ)=0.

Principais Teoremas2. Se Ac é o complemento do evento A, então P(Ac) = 1- P(A).Demonstração: Considere que Ω=A ∪Ac e A ∩ Ac = φ. Então P(A∪ Ac)=P(A)+P(Ac).Assim, P(Ω)= P(A∪ Ac)= P(A)+P(Ac); 1=P(A)+P(Ac).P(Ac) = 1- P(A).

Exemplo Teorema 2

Exemplo: Um agente de compras declara que há umaprobabilidade de 0,90 de que um fornecedor enviaráuma carga livre de peças defeituosas.Usando o complemento podemos afirmar que há uma

probabilidade de 1-0,90 = 0,10 de que a carga conterápeças defeituosas.

Principais Teoremas3. Se A ⊂ B, então P(A) ≤ P(B)

DemonstraçãoConsidere B= A ∪ (Ac ∩ B). Ora A e Ac ∩ B são mutuamente exclusivos. Logo, P(B) = P(A)+P(Ac ∩ B). P(Ac ∩ B) = P(B)- P(A).Como P(B)- P(A) ≥ 0 por axioma 1.P(A) ≤ P(B).

Exemplo Teorema 3

Exemplo: Jogar um dado e observar o resultado. Ω=1,2,3,4,5,6. Sejam os eventos A=a face é potencia de 2 B=a face é par. Então, A=2,4 e B=2,4,6 e P(A)=2/6 e P(B)=3/6

Principais Teoremas4. Teorema da Soma (Lei da Adição)

É util quando temos dois eventos e estamosinteressados em conhecer a probabilidade de pelomenos um deles ocorra.Dados dois eventos A e B, estamos interessados emconhecer a probabilidade de que o evento A ou eventoB ocorra, ou ambos ocorram:

P(A∪B)=P(A)+P(B)-P(A∩B)Demonstração: a) Se A e B são mutuamente exclusivos

• P(A∩B) = 0.• Recai-se axioma 3

Principais Teoremasb) Se A∩B ≠ φ.

A e (Ac ∩ B) são mutuamente exclusivos .Pelo Axioma 2, P(A∪ Ac ∩ B)=P(A ∪B)= P(A)+P(Ac ∩ B) (i); .Considerando que B é a união dos eventosmutuamente exclusivos (B ∩ A) e (B ∩ Ac). Logo, P(B)= P(B ∩ A) +P(B ∩ Ac); P(B ∩ Ac)= P(B)-P(B ∩ A) (ii). Substituindo (ii) em (i), P(A∪B)=P(A)+P(B)-P(A∩B)

Exemplo Teorema 4Considere uma fábrica com 50 empregados. Um empregado não tem êxito em satisfazer os padrões de desempenho, se completa o trabalho mais tarde e/oumonta produtos com defeito.

Foi observado que 5 dos 50 tinham completado o trabalho mais tarde, 6 dos 50 trabalhadores tinhammontado peças defeituosas e 2 dos 50 tinham tandocompletado mais tarde como montado produtosdefeituosos.

Principais TeoremasA – o evento que o trabalho termina mais tardeB – o evento que o produto montado é defeituoso.

P(A) = 5/50 = 0,10P(B) = 6/50 = 0,12P(A∩B)= 2/50=0,04

P(A ∪ B) = P(A) + P(B) - P(A∩B)= 0,10+0,12-0,04= 0,18

A ∪ B significa a probabilidade de um trabalhador terminarmais tarde ou montar produtos defeituosos.

Probabilidades dos Espaços Amostrais

Seja Ω=a1,...,an. Considera-se cada evento formado por um resultado simples A=ai.Cada evento simples ai associa-se um número pi denominado probabilidade de ai satisfazendo as seguintes condições:

A) pi ≥ 0 i=1,2,...,nB) p1 + p2 +....+pn =1

ExemploTrês cavalos A, B e C, estão em uma corrida; A: tem duas vezes mais probabilidades de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que C. Quais são as probabilidades de vitória de cada um, isto é, P(A), P(B) e P(C)?

SoluçãoConsiderando P(C)=p então P(B)=2p e P(A)=2 P(B)=4p. Como a soma das probabilidades é 1, então:

p+2p+4p=1 ou 7p= 1 ou p=1/7

Logo temos, P(A)=4/7; P(B)=2/7 e P(C)=1/7.

Espaços Amostrais Finitos Equiprováveis

Quando se associa a cada ponto amostral a mesma probabilidade, o espaço amostral chama-se equiprovável ou iniforme. Se Ω contém n pontos, então a probabilidade de cada ponto será 1/nSe um evento A contém r pontos, então:

Este método de avaliar P(A) é enunciado da seguinte maneira.

⎟⎠⎞

⎜⎝⎛=

nrAP 1)(

ocorre amostral espaço o que em vezesde nocorrer podeA evento o que em vezesde n)( o

o

Ω=AP

ou

Ω de casos de totalnA a favoráveis casos de n)( o

o

=AP

ExemploEscolha aleatoriamente (indica que o espaço é equiprovável) uma carta de um baralho com 52 cartas. Sejam A: a carta é de ouros e Calcular P(A)

4

15213

cartas de nouros de nP(A) o

o

===

Problema de Contagem Combinação de r elementos tomados (combinados) p a p. Calcula-se por:

)!(!!

, prpr

pr

C pr −=⎟⎟

⎞⎜⎜⎝

⎛=

ExemploNum lote de 12 peças, 4 peças são defeituosas; duas peças são retiradas aleatoriamente. Calculea) A probabilidade de ambas serem defeituosas. Seja A=ambas são defeituosas.

A pode ocorrerΩ pode ocorrer

Logo,

624

=⎟⎟⎠

⎞⎜⎜⎝

66212

=⎟⎟⎠

⎞⎜⎜⎝

111

666)( ==AP

Exemplob) A probabilidade de ambas não serem defeituosas. Seja B=ambas não serem defeituosas.

B pode ocorrerΩ pode ocorrer

Logo,

2828

=⎟⎟⎠

⎞⎜⎜⎝

66212

=⎟⎟⎠

⎞⎜⎜⎝

3314

6628)( ==BP

Exemploc) A probabilidade de ao menos uma ser defeituosa.Seja C=ao menos uma defeituosa. C é o complemento de B, C = Bc

Logo,

3319

33141)( =−=CP

Probabilidade CondicionalSeja E: lançar um dado, e o evento A=sair o número 3. Então P(A) = 1/6.Considere o evento B=sair um número impar. P(A/B) =1/3Definição: Dado dois eventos A e B, denota-se

)()(

)(

)(

)()()/(

BNCFBANCF

NTCBNCF

NTCBANCF

BPBAPBAP ∩

=

=∩

=

Exemplo: Lançamento de dois dados

1 2 3 4 5 61 (1,1) (1,2) (1,3) (1,4) (1,5)

(2,5)

(3,5)(4,5)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)(6,5)

(1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,6)4 (4,1) (4,2) (4,3) (4,4) (4,6)

6 (6,1) (6,2) (6,3) (6,4) (6,6)

Exemplo 1A=(x1,x2)/x1 + x2 = 10, B==(x1,x2)/x1 > x2 onde x1 é o resultado do dado 1 e x2 é o resultado do dado 2.Calcular P(A), P(B), P(A/B) e P(B/A)

125

3615)()( ===

NCTBNCFBP

121

363)()( ===

NCTANCFAP

151

)()()/( =

∩=

BNCFBANCFBAP

31

)()()/( =

∩=

ANCFBANCFBAP

Exemplo 2Considere a situação promocional de oficiais dos Estados Unidos.

Homens Mulheres Total

Promovidos 288 36 324Não Promovidos 672 204 876

Total 960 240 1200

Status de Promoção dos Oficiais de Polícia

Exemplo 2H- evento em que um oficial seja um homenM – evento em que um oficial seja uma mulherA – evento em que um oficial é promovidoAc – evento em que um oficial não é promovido

Homens Mulheres Total

Promovidos 0,24 0,03 0,27Não Promovidos 0,56 0,17 0,73

Total 0,80 0,20 1

Tabela de Probabilidade Associada

P(H∩A)= 288/1200 =0,24P(H∩Ac)= 672/1200 =0,56P(M∩A)= 36/1200 =0,03

P(M∩Ac)= 204/1200 =0,17

Exemplo 2

Qual a probabilidade P(A/H)?Qual a probabilidade P(A/H)?

30,080,024,0

1200/9601200/288

960288)H/A(P ====

30,080,024,0

)H(P)HA(P

960288)H/A(P ==

∩==

Teorema do ProdutoA probabilidade de ocorrência simultânea de dois eventos, A e B, do mesmo espaço amostral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.

P(A/B)=P(A∩B)

P(B)

P(B/A)=P(A∩B)

P(A)

P(B)P(A/B)B)P(A =∩

P(A)P(B/A)B)P(A =∩

Exemplo 3Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas um após a outra sem reposição. Qual a probabilidade de que ambas são sejam boas?A=a primeira é boa, B=a segunda é boa

3314

117

128P(A)P(B/A)B)A( =×==∩P

Independência EstatísticaUm evento A é considerado independente de um outro evento B se a probabilidade de A é igual àprobabilidade condicional de A dado B, isto é

P(A)=P(A/B)P(B)= P(B/A)P(A∩B)=P(A) × P(B)

Exemplo 4Sendo Ω=1,2,3,4 um espaço amostralequiprovável e A=1,2; B=1,3; C=1,4 três eventos de S. Verificar se os eventos A, B e C são independentes.Solução;

P(A)=1/2; P(B)=1/2; P(A∩B)=1/4; logo, P(A ∩B)=1/2 × 1/2 =1/4. P(A)=1/2; P(C)=1/2; P(A∩C)=1/4; logo, P(A ∩C)=1/2 × 1/2 =1/4. P(B)=1/2; P(C)=1/2; P(B∩C)=1/4; logo, P(B ∩C)=1/2 × 1/2 =1/4. P(A)=1/2; P(B)=1/2; P(C)=1/2; P(A ∩B ∩C)=1/4. Logo A, B e C não são independentes

Teorema de BayesSejam A1,...,An um conjunto de eventos mutuamente disjuntos de um espaço amostral Ω, isto é, Ω =A1∪A2 ∪..., An. Seja B um evento de , então para cada i

)()/(...)()/()()/(

)()()/(

11

1

nn

iii APABPAPABP

APABPBP

BAPBAP++

=∩

=

Exemplo 5Considere uma empresa fabricante que recebe embarques

de peças de dois diferentes fornecedores. A1 = evento em que uma peça é do fornecedor 1 : P(A) = 0,65 A2 = evento em que uma peça é do fornecedor 2: P(B) = 0,35B = evento em que uma peça é boaR = evento em que uma peça é ruimP(B/A1) = 0,98, P(R/A1) = 0,02, P(B/A2) = 0,95 P(R/A2) = 0,05

Exemplo 5Dado que uma peça é ruim, qual é a probabilidade da peça ser do fornecedor 1 e qual é a probabilidadeda peça ser do fornecedor 2? P(A1/R)=? e P(A2/R)=?

Exemplo 5P(A1∩R)=P(A1)P(R/A1)P(R) = P(A1 ∩R)+P(A2∩ R) = P(A1)P(R/A1) + P(A2)P(R/A2)P(A1∩R)=(0,65)(0,02)=0,0130 P(A2∩R)=(0,35)(0,05)=0,0175P(R)= 0,0305 P(A1/R)= 0,013/0,0305

Exemplo 5P(A2∩R)=P(A2)P(R/A2)P(A1∩R)=(0,65)(0,02)=0,0130P(A2∩R)=(0,35)(0,05)=0,0175P(R)= 0,0305P(A2/R)= 0,0175/0,0305

IntroduçãoE: Lançamento de duas moedasΩ = (c,c), (c,k), (k,k), (k,c).X: número de caras obtidas nas duas moedasR=0,1,2X=0 → corresponde ao evento (c,c) com prob. 1/4X=1 → corresponde aos eventos (k,c) e (c,k) com prob. 2/4X=2 → corresponde ao evento (k,k) com prob. 1/4

DefiniçãoSejam E um experimento e Ω o espaço associado ao experimento. Uma função X, que associe a cada elemento ω ∈ Ω um número real X(ω) édenominada variável aleatória.

Uma variável aleatória pode ser contínua ou discreta.

ω X(ω)

Classificação de VariáveisDiscreta

Se o número de valores possíveis de X (seu contradomínio) for finito ou infinito enumerável.

ContínuaSe o contradomínio é um intervalo ou um conjunto de intervalos.

Exemplos de Variável Aleatória Discreta

Experimento Variável Aleatória X Valores da Variável Aleatória

Contratar Clientes Número de clientes que compram

0,1,2,3,4,5

Inspecionar um embarque de 50 rádios

Número de rádios defeituosos

0,1,2,3,4,5,...,49,50

Vender um automóvel Gênero do cliente 0 se masculino1 se feminino

Vendas no Shopping Número de clientes 0,1,2,3,4,5........

Exemplos de Variável Aleatória Contínua

Experimento Variável Aleatória X Valores da variávelAleatória

Operar um banco

Tempo entre as chegadas dos clientes

x ≥ 0

Encher um recipiente de refrigerante

Número de ml 0 ≤ x ≤ 343

Trabalhar em um projeto

Porcentagem do término do projeto após 6meses

0 ≤ x ≤ 100

Função de Probabilidades ou Distribuição de Probabilidade

Seja X uma variável aleatória discreta. A probabilidade de X assumir um valor x é uma função que se representa P(X=x) ou P(x).P(X=x) determina a distribuição de probabilidades da variável aleatória X. Exemplo:

E:lançamento de duas moedasX: número de caras obtidas

x 0 1 2

P(X) 1/4 2/4 1/4

Tabela: Função de Probabilidade

2,1,0 ,2

41)( =⎟⎟

⎞⎜⎜⎝

⎛= x

xxP

Função de Probabilidades

Representação Gráfica

1/2

1

1/4

x

f(x)

0 1 2

Função de uma variável aleatória Qualquer função de uma variável aleatória étambém uma variável aleatória. Se X é uma V.A., então Y=ϕ(x) é também uma V.A.Exemplo:

E:lançamento de dois dadosX: pontos de um dadoY=X1+X2 → soma dos pontos de dois lançamentosZ=max(X1,,X2) onde Xi – variável aleatória associada ao resultado do i-ésimo dado

Exemplo

x 1 2 3 4 5

1/6 1/61/6

6

P(X) 1/6 1/6 1/6

Tabela: Função de Probabilidade de X

y 2 3 4 5 6 7 8 9 10 11

3/36 2/364/365/366/365/364/363/36

12

P(Y) 1/36 2/36 1/36

Tabela: Função de Probabilidade de Y

Exemplo

z 1 2 3 4 5

7/36 9/365/36

6

P(Z) 1/36 3/36 11/36

Tabela: Função de Probabilidade de Z

Função de Distribuição (Repartição)

Seja X é uma V. A. discreta.A função de distribuição da variável X, no ponto x, é definida como sendo a probabilidade de que X assuma um valor menor ou igual a x.F(x)=P(X ≤x)Exemplo: Lançamento de duas moedas.F(x) = 0 se x < 0F(x) = ¼ se 0 ≤ x < 1F(x) = ¾ se 1 ≤ x < 2F(x) = 1 se x ≥ 2

1/2

1

1/4

x

f(x)

0 1 2

Função de Distribuição Propriedades

1. 2. F(- ∞)=0, F( ∞)=13. P(a < X ≤ b)=F(b)-F(a)4. P(a ≤ X ≤ b)=F(b)-F(a)+P(X=a)5. P(a < X < b)=F(b)-F(a)-P(X=b)6. F(x) é uma função não decrescente, isto é,

F(b) > F(a), para b>a

∑≤

=xx

ii

xPxF )()(

Função de Densidade de Probabilidade

Relembrando: Em uma variável aleatória contínua o conjunto dos possíveis valores pode ser um intervalo ou um conjunto de intervalos.Seja X uma variável aleatória continua. A função de densidade de probabilidade f(x) é uma função que satisfaz as seguintes condições:1. f(x) > 0 para todo x ∈Rx2. Para qualquer a < b em Rx

∫ =xR xf 1)(

∫=<< b

a dxxfbXaP )()(

Observações1. A probabilidade de qualquer ponto é zero2. P(a ≤ X ≤ b)=P(a ≤ X <b)=P(a < X ≤ b=

P(a < X <b).3. A função integrada entre dois limites a e b (a < b) é a probabilidade, ou seja, a área sob a curva.4. A função de distribuição é definida como:

∫∞−

=x

dxxfxF )()(

ExemploSeja X uma variável aleatória contínua com a seguinte função de densidade.

f(x) é uma função de densidade.

P(1/4 < x < 3/4)?

⎩⎨⎧ <<

=contrário caso 0

10 para 2)(

xxxf

101

020)( 21

0 1

0

==++= ∫ ∫∫∫∞

∞−

+∞

∞−

xdxxdxdxxf

2/141

43

4/14/3

2)4/34/1(224/3

4/1

2 =⎟⎠⎞

⎜⎝⎛−⎟

⎠⎞

⎜⎝⎛===<< ∫ xdxxP

1

x

f(x)

0 1 2

2

1

ExemploFunção de distribuição F(x)

Para x< 0Para 0 ≤ x < 1Para x ≥ 1

∫ ∞−== x xdxxF 0)(

∫ ∫∞−=+= 0

022)( x xxdxxdxxF

∫ ∫ ∫∞−=++= 0 1

0 1 102)( x dxxdxxdxxF

Variável Aleatória BidimensionalUsa-se quando há interesse por dois resultados simultâneos. Por exemplo, altura H e peso P duas pessoas.Definição:

Sejam E um experimento aleatório e Ω o espaço amostral associado a E.Sejam X=X(ω) e Y=Y(ω), duas funções, cada uma associando um número real a cada resultado ω ∈ Ω, denomina-se o par (X,Y) uma variável aleatória bidimensional.

Gráfico

ω

X(ω)

Y(ω)

Distribuição conjunta de duas variável aleatórias DISCRETAS

Seja (X,Y) uma variável aleatória bidimensional discreta.Função de probabilidade: Trata-se de uma função associada um número p(xi,yj) representado por P(X= xi, Y=yj) satisfazendo as seguintes condições:

p(xi,yj) > 0

Exemplo: Sejam E=jogar dois dados e (X,Y) pontos dos respectivos dados

• P(X= xi, Y=yj)= p(xi,yj)=1/36, i=j=1,2,3,4,5,6

1),(1 1

=∑∑∞

=

=j iji yxp

Função de densidade de probabilidade conjunta de duas variáveis CONTÍNUAS

Seja (X,Y) uma variável aleatória bidimensional discreta.Diz-se que f(x,y) é uma função de densidade de probabilidade conjunta se :1. f(x,y) ≥ 02. ∫ ∫

∞−

∞−

=1),( dxdyyxf

Função de Distribuição Conjunta

Definição: F(x,y)=P(X ≤x,Y ≤y)

Caso (X,Y) DISCRETA, tem-seF(x,y) = ΣΣ p(xi,yj) tal que x ≤ xi e y ≤ yj

Caso (X,Y) CONTÍNUA, tem-se ∫ ∫∞− ∞−

=x y

dxdyyxfyxF ),(),(

Distribuição de Probabilidade Marginal: Caso (X,Y) DISCRETA

Dado uma variável aleatória bidimensional (X,Y) e sua distribuição conjunta.Pode-se determinar a distribuição de X sem considerar Y: Distribuição Marginal de X (sem considerar Y)

P(X=xi) = P(X=xi, - ∞ < y < ∞) ouP(X=xi)=Σj P(xi,yj)

Distribuição Marginal de Y (sem considerar X)P(Y=yj) = P( - ∞ < x < ∞, Y=yj) ouP(Y=yj)=Σi P(xi,yj)

Distribuição de Probabilidade Marginal: Caso (X,Y) CONTÍNUA

Função de densidade marginal de X

Função de densidade marginal de Y

∫∞

∞−

= dyyxfxg ),()(

∫∞

∞−

= dxyxfyh ),()(

Variáveis Aleatórias Independentes

Caso DISCRETA:Seja (X,Y) uma variável aleatória discreta bidimensional. Diz-se que X e Y são independentes se e somente se p(xi,yj) = p(xi) × p(yj) para quaisquer i e j.Caso CONTÍNUA:Seja (X,Y) uma variável aleatória discreta bidimensional. Seja g(x) a função de densidade de X e h(x) a de Y. Diz-se que X e Y são independentes se e somente se f(x,y) = g(x) × h(y) para todo (x,y).

Exemplo

Verificar se X e Y são independentes.Solução: para todo para i e j; i=j=0, 1, 2 deve-se ter p(xi,yj)=p(xi) × p(yj)

0 1 2 p(yj)0 0,10 0,20 0,20 0,501 0,04 0,08 0,08 0,202 0,06 0,12 0,12 0,30p(xi) 0,20 0,40 0,40 1,00

ExemploSuponha que (X,Y) tenha a seguinte função de densidade

Faça a distribuição marginal de xFaça a distribuição marginal de yX e Y são independentes

⎩⎨⎧ <<<<+

=contrário caso 0

1y0 1,x0 ),(

yxyxf

Medidas de Posição: Média ou Esperança Matemática

Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra um acidente é 3%. Quanto espera a seguradora ganhar por cada carro segurado?

Solução: Suponhamos que entre 100 carros, 97 dão lucro de R$ 1.000,00 e 3 dão prejuízo de R$ 29.000,00.Lucro total: 97 × 1.000 - 3 × 29.000=10.000,00Lucro médio por carro = 10.000,00/100= R$ 100,00Se chamamos X: lucro por carro e E(X) por lucro médio por carro, teremos

Definição para o caso discreto

Definição para o caso contínuo

É um número real e também uma média ponderada. Notação: μ ou μx.

29.000,000,03-1.000,00 0,97

29.000,00100

3-1.000,0010097

10000,000.29300,000.197)(

××=

××=

×−×=XE

∑=

×=n

iii xpxXE

1)()(

∫∞

∞−

= dxxfXE )()(

Medidas de Posição: Média ou Esperança Matemática

Exemplo: Caso DiscretoSuponha que um número seja selecionado entre 1 e 10.

Seja X o número de divisores do número selecionado. Calcular o número médio de divisores do número selecionado. No No de Divisores

1 1

2 2

3 2

4 3

5 2

6 4

7 2

8 4

9 3

10 4

X P(x) X × P(X)

1 1/10

4/10

2/10

4 3/10 12/10

1

1/10

2 8/10

3 6/10

Total 2,7

E(X)=2,7

Exemplo: Caso ContínuoSeja X uma variável aleatória contínua com a seguinte função de densidade.

A esperança de X é⎩⎨⎧ <<

=contrário caso 0

10 para 2)(

xxxf

3/201

3222)(

1

0

32

1

0==== ∫∫

xdxxdxxxXE

Medidas de Posição: Propriedades da Média

Sejam X e Y duas variáveis aleatórias e k uma constante.

1. E(k)=k, k sendo uma constante.2. E(KX)=kE(X).3. E(X±Y)= E(X) ± E(Y).4. E(X±k)= E(X) ± k.

5. E(X-μ)=E(X)- μ=06. E(XY)=E(X) × E(Y) se X e Y são independentes.

Medidas de Posição: MedianaA mediana de uma variável aleatória é o valor que

divide a distribuição em duas partes iguais, ou seja F(Md)=0,5 onde Md é a mediana.Exemplos

Seja X uma v. a. contínua com a seguinte função de distribuiçãoF(x)=0 para x < 0F(x)=x2 para 0≤ x < 1F(x)=1 para x≥1Logo a mediana será o valor x tal que F(x=md)=0,5. A mediana é 2/1

Medidas de Posição: ModaÉ o valor da variável com maior probabilidade, se X é discreta, ou maior densidade se X for contínua.Exemplos:

Se X é discreta tal que

A moda m0 =2.Se X é contínua tal que f(x) = 2x para 0≤ x ≤ 1A moda m0 é 1 e a mediana F(md)=0,5

Mediana é 0,5.

X -1 0 2P(X) 0,3 0,2 0,5

5,002

25,02 2

0

2

==⇒=∫ MdMdxxdx

Md

Medidas de Dispersão: VariânciaDefine-se a variância de uma variável aleatória como sendo

Para X discreta

Para X contínua

])[()( 22XX XEXVar μ−=σ=

∑ μ−=σ )()( 2)(

2iXiX xPX

dxxfx XX )()( 22 ∫∞

∞−

μ−=σ

Medidas de Dispersão: Desvio Padrão

O desvio padrão é a raiz quadrada da variância

Pode-se encontrar o desvio usando a variância dada por

2XX σ=σ

222 )()( XX XE μ−=σ

Medidas de Dispersão: Propriedades da Variância

1. Seja k uma constante. A variância de uma constante é zero. Var(k)=0.2. Var(kX)=k2Var(X).3. Var(X±k)=Var(X)

ExemploSeja X discreta tal queA esperança de X é

A variância de X é

O desvio padrão é

X -1 0 2P(X) 0,3 0,2 0,5

81.15,0)3,1(2,0)7,0(3,0)7,1()())(()( 2223

1

2 =+−+−=−=∑=i

ii xpxxXVar μ

∑=

=×+×+×−==μ3

17,05,022,003,01)()(

iii xpxX

020,1041,1 ==σX

ExemploSeja X uma variável aleatória contínua com a seguinte função de densidade.

A esperança de X é 2/3.A variância de X é

O desvio padrão é

⎩⎨⎧ <<

=contrário caso 0

10 para 2)(

xxxf

18/12)3/2()(1

0

2 =−= ∫ dxxxXVar

235,018/1 ==σ X

Distribuição de BernoulliUma lâmpada é escolhida ao acaso

A lâmpada é defeituosa(sucesso)

X = 0 se a lâmpada não édefeituosaX = 1 se a lâmpada édefeituosa

P(X=1)= 3/5P(X=0)= 2/5

Ensaio de Bernoulli

Número de ensaios = 1

Distribuição de BernoulliSeja X uma v.ª com dois resultados possíveis: fracasso e sucesso.X→ x1 =1 sucesso; P(X=1)=pX→ x1 =0 fracasso; P(X=0)=1-p=qMédia: μX = p Variância σ2 = pq

Distribuição Binomial

P(não defeituosa)=1-p= 4/7P(defeituosa)= p =3/7

3 Ensaios de Bernoulli, n = 3

Seja X o número de defeituosas

1. O experimento consiste de três ensaios idênticos;2. Dois resultados são possíveis;3. As probabilidades p e (1-p) são as mesmas em cada ensaio;4. Os ensaios são independentes.

Distribuição Binomial

S= 111, 110, 101, 011, 001, 010, 100, 000

P(001) = 4/7 × 4/7 × 3/7= 48/343P(010) = 4/7 × 3/7 × 4/7=48/343P(100) = 3/7 × 4/7 × 4/7=48/343

P(X=1) = P(001) + P(010) + P(100)P(X=1) = 3 × 48/343

X = 0 - 000X = 1 – 001, 010, 100X = 2 - 110, 101, 011X = 3 - 111

Seja X o número de defeituosas

P(não defeituosa)= (1-p)= 4/7P(defeituosa)= p =3/7

Distribuição Binomial

( ) ( )21 7/47/313

)1( ⎟⎟⎠

⎞⎜⎜⎝

⎛==XP

P(X=1) = P(001) + P(010) + P(100)P(X=1) = 3 × 48/343

Seja X o número de defeituosas

Distribuição Binomial

( ) ( ) xnx ppxn

xXP −−⎟⎟⎠

⎞⎜⎜⎝

⎛== 1)(

Função de Probabilidade

ondep(x) = a probabilidade de x sucessos em n ensaiosn = o número de ensaios

p = probabilidade de um sucessoem um ensaio(1-p) = probabildidade de um fracasso em um ensaio

X ∼ B(n,p)

Distribuição Binomial

Seja X uma v.a. Binomial com parâmetros n e p onde p é a probabilidade de sucesso.X→ 0,1,2,..nMédia: μX = npVariância σ2 = npq

Exemplo

Considere uma loja de roupas que receba 3 clientesp = o cliente faz compra = 0,30(1-p) = o cliente não faz compra = 0,70

x p(x)

0 0,343

1 0,441

2 0,189

3 0,027

1,00

30 )70,0()30,0(!3!0

!3

Total

21 )70,0()30,0(!2!1

!3

12 )70,0()30,0(!1!2

!3

03 )70,0()30,0(!0!3

!3

X- número de clientesque compram

Exemplo: Representação Gráfica

0 1 2 3

0,10

0,20

0,30

0,40

0.50

x

P(x)

Função de Probabilidade

Exemplo: CaracterísticasValor Esperado

E(X) = μ = np

Variância

Var(X) = σ2 = np(1-p)

Considerando o exemplo, temos

E(X) = μ = 3 × 0,30 = 0,90

Var(X) = σ2 = np(1-p)= 3 × 0,30 × 0,70 = 0,63

Distribuição MultinomialÉ uma extensão da binomial para mais de dois resultados possíveis.Seja um experimento que permite ter k resultados diferentes (A1,...Ak) formando o espaço amostral.Considere n tentativas deste experimento, sendo que os pi i=1,..,k associados aos k resultados permanecem constantes durante as repetições do experimento, comSejam Xi,..Xk v. as. que são os números de ocorrências associados aos k resultados possíveis com

∑=

=k

iip

11

Distribuição MultinomialFunção de Probabilidade

Com Média: E(Xi)= n × pi

Variância: Var(Xi) = n × pi × qi

knk

nn

kkk ppp

nnnnXnXP ×××××

=== ....!...!

!)...,( 2121

1,1

∑=

=k

ik nn

1

ExemploUm dado é lançado 10 vezes. Qual é a probabilidade de terem aparecido duas vezes o no

2, duas vezes o no 5, três vezes o no 1 e uma vez os demais resultados?n=10 p1= p2= p3 = p5 = p6 = 1/6X1=3, X2=2, X3=1,X4=1,X5=2,X6=1

0025,061

61

61

61

61

61

!1!2!1!1!2!3!10

)1,2,1,1,2,3(121123

654321

=⎟⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛×⎟

⎠⎞

⎜⎝⎛

×××××=

======= XXXXXXP

ExemploE(Xi)=nipi e Var(Xi) = n × pi × qi

E(X1)= 10 × 1/6 =5/3 e Var(X1) = 10 × 1/6 ×5/6=50/36E(X2)= 10 × 1/6 =5/3 e Var(X2) =10 × 1/6 ×5/6=50/36E(X3)= 10 × 1/6 =5/3 e Var(X3) = 10 × 1/6 ×5/6=50/36E(X4)= 10 × 1/6 =5/3 e Var(X4) = 10 × 1/6 ×5/6=50/36E(X5)= 10 × 1/6 =5/3 e Var(X5) = 10 × 1/6 ×5/6=50/36

Carros que passam por um cruzamento por minuto, durante uma certa hora do dia.Erros tipográficos por página,em um material impresso.Defeitos por unidade (m2,m, etc) por peça fabricadaMortes por ataque de coração por ano, numa cidade.Problemas de filas de espera

Distribuição de Poisson

Distribuição de PoissonRepresenta a distribuição de probabilidade de umavariável aleatória que registra o número de ocorrências sobre um intervalo de tempo ouespaço específicos.Propriedades do experimento Poisson:

A probabilidade de uma ocorrência é a mesma paraquaisquer dois intervalos de tempo.A ocorrência ou não ocorrência em qualquer intervalo

é independente da ocorrência ou não-ocorrência em qualquer intervalo

!)(

xexP

x λ−λ= X ∼ P(λ)

Função de Probabilidade de Poisson

Uma variável aleatória de Poisson não tem limites. x = 0,,1,2,3,…P(x) = a probabilidade de x ocorrências em um intervaloλ = valor esperado ou número médio de ocorrências em um

intervaloe = 2,71828 Média: E(X) = λVariância: Var(X)= λ

ExemploSuponha que é observado o número de chegadas a uma caixa automática de um banco durante um período de 15 minutos.A probabilidade de um carro chegar é a mesma

para quaisquer dois períodos de tempo de igualcumprimento.A chegada ou não chegada de um carro em qualquer período de tempo é independente dachegada ou não chegada de um outro carro em qualquer outro período de tempo.

Suponha que o número médio de carros que chegam no período de 15 minutos é 10, então

!10

!)(

xe

xexP

xx λ−π−

=

X- número de carros que chegam em qualquer período de 15 minutos

A probabilidade de 5 chegadas em 15 minutos

0378,0!5

10)5(105

====−eXP

Exemplo

E(X) = 10 e Var(X) = 10

Distribuição UniformeSeja X uma variável aleatória que representa o tempo de vôo de uma aeronave viajando de Chicago até Nova York.Suponha que o tempo de vôo pode ser qualquer valor no intervalo de 120 até 140 minutos.Suponha que os intervalos de um minuto são equiprováveis.Parâmetro da distribuição: um intervalo [a,b]

Distribuição UniformeX é uma v.a. uniformemente distribuída se a sua função de densidade for dada por

A função de distribuição F(x) é dada por:

Logo

E(X)=(b+a)/2, VAR(X)=(b-a)2/ 12

b x a se 1)(

bou xax se 0)(

≤≤−

=

><=

abxf

xf

abaxdx

abxF

x

a −−

=−

= ∫1)(

b xse 1(x)

b x a se )(

ax se 0)(

≥=

<<−−

=

≤=

FabaxxF

xF

Exemplo: X ∼ U[3,7]

x76543

0.255

0.250

0.245

x

f(x)

Distribuição ExponencialÉ muito útil para descrever o tempo que se leva para completar uma tarefa. Ex: O tempo para carregar um caminhão considerando que em média gasta-se 15 minutos para realizar esta tarefa.Outras situações típicas: tempo de chegadas a um lava-jato, tempo de vida de aparelhos, tempo de espera em restaurantes, caixas de banco, etc Parâmetro: média (ex: tempo médio) ou valor esperado.

Distribuição ExponencialX tem uma distribuída exponencial se sua função de densidade é dada por

A função de distribuição é dada por

Logo

E(X)=1/λ VAR(X)=1/λ2

0 se )(0 x se 0)(≥λ=

<=λ− xexf

xfx

)1()(0

xx

x edxexF λ−λ− −=λ= ∫

0 se 1)(0x se 0)(

>−=

≤=λ− xexF

xFx

Exemplo: X ∼ Exp[1]

9876543210

1.0

0.5

0.0

f(x)λ

Distribuição NormalTem sido usada em uma ampla variedade de aplicações práticas nas quais as variáveis aleatórias são: alturas e pesos de pessoas, medições, índices , etc.Parâmetros: média e desvio padrão.Ex: Os salários dos diretores das empresas em São Paulo, distribuem-se normalmente com média de R$ 20.000,00 e desvio padrão de R$ 500,00.

Distribuição NormalX tem uma distribuída normal se sua função de densidade é dada por

Principais característicasO ponto máximo de f(x) é o ponto X=μ.Os pontos de inflexão da função são: X= μ+σ e X= μ-σ.A curva é simétrica com relação a μ.E(X)=μ e VAR(X)= σ2

Se X ∼N(μ, σ2) então a variável aleatória

∞<<∞πσ

=⎟⎠⎞

⎜⎝⎛

σμ−

− x -exf

x

,2

1)(2

21

σμ−

=XZ ∼ N(0,1)

Exemplo: Z∼ N(0,1)

3210-1-2-3

0.4

0.3

0.2

0.1

0.0

x

f(x)

Normal Padrão68,26%

95,44%

99,72%

Exemplo: X∼ N(3,16)

20100-10

0.10

0.05

0.00

3

f(x)

3+43-4

Probabilidades

20100-10

0.10

0.05

0.00

3

f(x)

3+43-4

P(-1 ≤ X ≤ 3 )= P(3 ≤ X ≤ 7 )

Probabilidades

3210-1-2-3

0.4

0.3

0.2

0.1

0.0

x

f(x)P(-1 ≤ Z ≤0 )= P(0 ≤ Z ≤ 1)

P(x1 ≤ X ≤x2 )= P(z1 ≤ Z ≤ z2)

σμ−

= 11

XZσμ−

= 22

XZ

23

24

7342

1722 33

35

36

30

2118

29

28

28

17

22

22

28

33

2822

29

18

18Distribuição das idades dos funcionários

idade

núm

ero

de fu

ncio

nário

s

0

2

4

6

8

10

12

14

10 20 30 40 50 60 70

Técnicas de Estatística Descritivatécnicas para extrair informações de conjuntos de dados

Conceitos de EstatísticaConceitos Antigos

a) simples contagem aritméticaExs:

estatística de asfaltos, mais de 2000 acidentesem seis meses no Estado do Rio de Janeiro.O Estado do Ceará tem 679 indústriasA população do Brasil no ano de 2000 é de

169.799.170.

b) Sinônimo de dados publicados oficialmentePublicações tais como: Anuário Estatístico do Brasil, RevistaBrasileira de Estatística, IBGE, Boletim Estatístico.

Exs: O anuário Estatístico do Brasil revelou mais de três

mil milionários no Braisl.Segundo as estatísticas realizadas pela OrganizaçãoMundial de Saúde, ultimamente divulgada, as doenças

cardíacas constituem a primeira causa de óbitos.

c) Simples transformação numéricas (percentagens, médiase razões, etc.)

Exs:Só 35 em 1000 alunos do curso primário concluem o

Secundário.58% dos veículos que rodam no país são nacionais.Um carro para 16 pessoas em São Paulo.

Conceitos de EstatísticaConceitos Antigos

Conceitos de EstatísticaConceitos Antigos

d) Construção de tabelas e gráficos

Sexo Norte Nordete

Masc. 5.44 7.80

Fem. 5.52 9.02

Total 10.96 16.82

Fonte: DataSus

Número de Pessoas por Região e Sexo

Cabeçalho, Corpo e Rodapé

Tabelas EstatísticasAs tabelas devem obedecer à Resolução n0 886, de 26 de

outrubro de 1966, do Conselho Nacional de Estatística.

O Cabeçalho deve conter o suficiente pra que sejamrespondidas as seguintes perguntas

•O que refere o fato? Vendas•Onde? ABC Veículos•Quando? no 10 bimestrede 1996

Período UnidadesVendidas

Janeiro/1996 20

Fevereiro/1996 10

Total 30

Vendas no 10 bimestre de 1996 daABC Veículos

Corpo: Contém osregistros dos dados

Rodapé: Fonte dos dados

Fonte: ABC Veículos

Tabelas Estatísticas

Séries EstatísticasÉ qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da

ÉPOCALOCAL OUESPÉCIE

Período UnidadesVendidas

Janeiro/1996 20

Fevereiro/1996 10

Total 30

Vendas no 10 bimestre de 1996 daABC Veículos, por mês

Fonte: ABC Veículos

1. Série Temporal ou CronológicaIdentifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos..

Filiais UnidadesVendidas

São Paulo 13

Rio de Janeiro 17

Total 30

Vendas no 10 bimestre de 1996 daABC Veículos, por filial

Fonte: ABC Veículos

2. Série Geográfica ou HistóricaApresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Tambémé chamada de espacial, territorial ou de localização.

.

Marca UnidadesVendidas

FIAT 18

GM 12

Total 30

Vendas segundo a marca, no 10 bimestrede 1996 da ABC Veículos

Fonte: ABC Veículos

3. Série EspecíficaO caráter variável é apenas o fato ou espécie. Também é chamada de série categórica.

4. Distribuição de FreqüênciasÉ a série em que os dados são agrupados com suas respectivas freqüências.

Número de Carros por dia

Número de de dias

100 200 42

200 300 18

Total 60

Vendas no 10 bimestre de 1996 daABC Veículos

Fonte: ABC Veículos

População: grande conjunto de dados que tem as características de interesse.

Em muitas situações não é possível acessar todas a população.Em geral as razões econômicas são as mais determinantes.

Amostra é um subconjunto da população

População e Amostra

Amostra

População

Estatisitica descritiva

Inferência Estatística

Estimação de quantidadesExtrapolação dos resultados

Testes de Hipóteses

• A seleção da amostra pode ser feita e diversas maneirasdependentes entre outros fatores, do grau de conhecimentoque temos da população e de recursos disponíveis.

• A idéia é que amostra tenta fornecer um subconjuto de valores o mais parecido possível com a população quelhe dá origem.

• A amostragem mais usada é a casual simples, em queselecionamos ao acaso, com ou sem reposição, os itensda população que farão parte da amostra.

População e Amostra

POPULAÇÃO:moradores de uma metrópole

AMOSTRA:uma parte dos moradores

Levantamento por Amostragem

• 1. Amostragem Aleatória

Um professor deseja oferecer prêmios (5 livros) a seusalunos em número de 35 e resolve apelar parao sorteio.

• 2 . Amostragem Estratificada

A turma tem 13 alunos e 22 alunas.

A amostra é71

355=

71 de 13 = 1,86 ≅ 2 alunos

71 de 22 = 3,14 ≅ 3 alunas

Exemplos de Tipo de Amostragem

• 3. Amostragem SistemáticaSorteia-se apens um número aleatoriamente entre 1 a 35 edepois de 7 em 7 somando sempre 7 ao número econtrado.

Suponha que o primeiro número é 14 então,

O segundo é 14+7=21O terceiro é 21+7 = 28O quarto é 35O quinto é 7

Por que de 7 em 7 ?

71

355= um em cada 7 é o intervalo da amostra

Exemplos de Tipo de Amostragem

O trabalho estatístico exige um conjunto de dados resultantede uma coleta de informações extraídas da população.

Exemplos:Suponha que um questionário foi aplicado aos alunos do primeiro ano da escola.Id: número de identificação do alunoTurma: turma em que foi alocado (A ou B)Sexo: F se feminino, M se masculinoIdade: idade em anosAltura: altura metrosPeso: peso em quilogramaClasse social: baixa, média ou alta

Cada Característicaé chamada de

variável

Tipos de Dados

Variável

Classificação de variáveis

Variável

Qualitativa

Quantitativa

Nominal

Ordinal

Discreta

Contínua

• Característica que pode ser observada (ou mensurada) nos elementos da população, devendo ter um e apenas um resultado para cada elemento observado.

VariáveisQualitativas - O resultado da variável é um atributo ou umaqualidade.Exemplos: tipo de unidade de I/O,

tipo de microprocessador, grau de instrução do usuário do sistema, etc.

Quantitativas - O resultado é um número numa escala pré-determinada.Exemplos: quantidade de máquinas ligadas,

número de transações por segundo, tempo de resposta, etc.

Ordinais - Representam atributos de qualidadescom uma ordenação naturalExemplos: Classe social: A – alta, M – média, C – baixaEscolaridade: 1 – Primário 2 – Secundário 3 – Superior

Não Ordinais (Nominais) - Representam atributosde qualidades sem uma ordenação naturalExemplos:Sexo: F- feminino M – masculinoTurma na escola: A ou BCor: amarelo, branco, verde e azulHábito de fumar: Sim ou não

Variáveis Qualitativas

Variáveis QuantitativasDiscretas - Os resultados possíveis formam umalista finita (geralmente, números inteiros).

Exemplo: quantidade de máquinas ligadas.Contínuas - Teoricamente, existem infinitos re-sultados possíveis (um intervalo dos números reais)

Exemplo: tempo de resposta (em segundos).

HistogramasRepresentação gráfica de uma distribuição de freqüências por meio de retângulos justapostosO método mais útil para

descrever resultados obtidos com respeito a uma variável é, sem sombra de dúvida, a distribuição de freqüência.

f

012345678

122

127

132

137

142

147

152

157

162

167

172

177

182

187

192

f

Distribuição de Freqüências

poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior precisão;muitos intervalos: risco de não realçar os aspectos relevantes;def. da amplitude dos intervalos

Polígono de Freqüências Acumuladas

37,5% das pessoas medidas tem menosde 1,47 m

37,5% de 40 = 15facum(x) = 15; x=?

f . acum.

0

5

10

15

20

25

30

35

40

45

122

127

132

137

142

147

152

157

162

167

172

177

182

187

192

f. acum.

Fig.: Polígono de Freqüências Acumuladas

f

012345678

122

127

132

137

142

147

152

157

162

167

172

177

182

187

192

f

Fig.: Polígono de Freqüência

127=(134-130)/2

Exemplo usando variávelqualitativa ordinal

Grau de instrução do chefe da casa, numa amostra de 40 famí-lias do Conj. Resid. Monte Verde, Florianópolis, SC, 1988.

Códigos: 1 - nenhum grau de instrução completo2 - primeiro grau completo e3 - segundo grau completo

Resultados observados em cada família3 3 2 2 3 1 3 3 3 2 2 1 2 2 3 2 3 3 3 3

3 3 3 2 2 3 1 3 2 3 3 2 3 1 1 1 3 3 3 3

Distribuição de Freqüências doGrau de Instrução do chefe da casa

Primeiro grauSegundo grau

61123

15,027,557,5

Total 40 100,0

Grau de Instrução FrequênciaAbsoluta

FrequênciaRelativa (em %)

Nenhum grau

0 4 8 12 16 20 24

Gráfico de Barras

nenhum

primeiro grau

segundo grau

número de famílias

Grau de Instrução do Chefe da Casa

Gráfico em colunasGrau de instrução do chefe da casa

0

5

10

15

20

25

nenhum primeiro grau segundo grau

núm

ero

de fa

mília

s

Gráfico de Setor

Grau de Instrução do chefe da casanenhum (15,0 %)

primeiro grau(27,5 %)

segundo grau (57,5 %)

Total → 360Parte → x’

Numa rede de computadores, a quantidade de máquinas que costumam estar ligadas, por dia

20 26 21 21 20 21 23 22 24 2222 22 23 23 23 22 23 22 24 21

Exemplo usando variável quantitativa Discreta

Distribuição de FreqüênciasMáquinas

em uso20212223242526

Total

Freqüência(absoluta)

2465201

20

Freqüência(relativa)

0,10 (10%)0,20 (20%)0,30 (30%)0,25 (25%)0,10 (10%)

00,05 ( 5%)

1 (100%)

Gráfico de Hastes

Máquinas em uso

2

6

4

20 24 25 2621 22 23

Freq.

Exemplo usando variável quantitativa Contínua

Tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observações):

5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,15,5 6,2 4,9 5,7 6,3 5,1 8,4 6,28,9 7,3 5,4 4,8 5,6 6,8 5,0 6,78,2 7,1 4,9 5,0 8,2 9,9 5,4 5,65,7 6,2 4,9 5,1 6,0 4,7 18,1 5,34,9 5,0 5,7 6,3 6,0 6,8 7,3 6,96,5 5,9

Primeiro passo: Determinar a amplitude

4,7 18,1Amplitude é 18,1-4,7 = 13,4

5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,15,5 6,2 4,9 5,7 6,3 5,1 8,4 6,28,9 7,3 5,4 4,8 5,6 6,8 5,0 6,78,2 7,1 4,9 5,0 8,2 9,9 5,4 5,65,7 6,2 4,9 5,1 6,0 4,7 18,1 5,34,9 5,0 5,7 6,3 6,0 6,8 7,3 6,96,5 5,9

poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior explicação do comportamento;muitos intervalos: risco de não realçar os aspectos relevantes;

Segundo passo: Determinar a amplitude

Estimativa do númerode intervalos

707,750 ==== nk

92,1914,17/4,13 ====k

rangeh

Estimativa da amplitudede intervalos

Máquinas em uso

4.70 |-- 6.626.62 |-- 8.548.54 |-- 10.46

10.46 |-- 12.3812.38 |-- 14.3014.30 |-- 16.2216.22 |-- 18.14

Total

Freqüência(absoluta)

341230001

50

Freqüência(relativa)

0,68 (68%)0,24 (24%)0,06 (6%)

0 (0%)0 (0%)0 (0%)

0,02 ( 2%)1 (100%)

Distribuição de Freqüências

Histograma do tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observações).

0

5

101520

25

30

35

40

5,66 7,58 9,5 11,42 13,34 15,26 17,18

tempo (seg)

Freq

uenc

ia

Diagramas de DispersãoUm diagrama de dispersão serve para saber se existe alguma correlação (forte, fraca, moderada, positiva, negativa, etc.) entre duas variáveis.

Turbidez no Rio Capivari

0

20

40

60

80

100

4/1 20/2

12/4

29/5 5/7 28/8

16/10 5/1

2

Dia/95

Turb

idez

(UN

T) Turbidez antes dabacia

Turbidez depois dabacia

Limite legislação

Fig.: Gráfico de Controle

Gráfico de CurvasUsados em processos para se acompanhar a evolução de uma variável em relação a um ou mais limites existentes

ConsideraçõesDados Qualitativos → melhor visualização com gráfico de barras, colunas ou circulares (tipo torta);Variáveis Discretas (tipo número de filhos por casal) → é comum que utilizemos medidas intervalares para melhor codificá-las

→ gráfico de hastes (com enumeração natural) com freqüências ou freqüências acumuladas;

Variáveis contínuas → gráficos em forma de histograma e polígonos

de freqüência.

ConsideraçõesMuitas vezes precisamos relacionar as variáveis em estudo: diagramas de dispersão são aconselháveis;Gráficos setoriais, particularmente úteis para visualizar diferenças entre classes. Não acomodam grandes quantidades de categorias →reagrupar as menos importantes em um grupo chamado

outros ou, → utilizar um gráfico de barras, sendo que estas devem

vir separadas;O uso de polígonos de freqüência induz o leitor a aceitar a continuidade da variável apresentada.

ConsideraçõesOs gráficos tipo torta (setor) permitem uma visualização das partes em função do todo. Servem para enfatizar a importância de um setor (grupo, produto, etc.) frente a outrosAs séries cronológicas podem ser representadas por gráficos de: colunas, curvas e barras.As séries específicas e geográficas podem ser representadas por gráficos de: colunas, barras e setor.

MedidasDepois que você conheceu os conceitos de coleta de dados, variação, causas comuns e causas especiais, chegou a hora de estudarmos algumas formas de medir os resultados.

Para melhor interpretar os resultados obtidos com uma amostra, são definidas algumas medidas:

medidas de posição centralmedidas de posição medidas de dispersão.

Mostram a tendência dos pontos se concentrarem em torno de um determinado valor

Medidas de Tendência Central

Medidas de Tendência Central

Há várias medidas de tendência central. Entre elas citamos a média aritmética, a mediana, a média harmônica, geométrica, etc.

Cada uma dessas medidas apresenta vantagens e desvantagens, e a escolha depende dos objetivos desejados.

Média AritméticaA média aritmética, ou simplesmente média, de um

conjunto de n valores x1, ..., xn é definida como:

As letras gregas são usadas para representar parâmetros populacionais e as letras comuns parâmetros amostrais.

A média de uma amostra é representada por e média de uma população é representada pela letra grega µ.

X x xn n

xni

i

n=

+ +=

=∑1

1

1...

Exemplo: A média aritmética de 7,5 7,9 8,1 8,2 8,7 é

X =+ + + +

=7 5 7 9 8 1 8 2 8 7

58 08, , , , , ,

X

Média Aritmética para Dados AgrupadosÉ calculada quando a informação disponível é o

valor médio do intervalo i (Xi) e a freqüência do intervalo i (fi):

X f X f Xf f

f X

fK K

K

i i

K

ii

K=+ ++ +

=∑

∑=

1 1

11

i=1....

....

Exemplo

12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47

Considere os seguintes dados

X =+ + + + +

=3 13 8 14 15 15 13 16 9 17 2 18

5015 46( ) ( ) ( ) ( ) ( ) ( ) ,

Intervalos de classe Freqüência absoluta

12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2

Média Aritmética PonderadaAlgumas vezes associa-se a cada observação um peso Wi.

onde esse peso representa a importância atribuída a cada observação. Nesse caso a média ponderada é calculada como:

X w x w xw w

wn n

n

i ii=

+ ++ +

= =∑

∑1 1

1

1........

x

w

n

ii=1

n

Exemplo: O exame de seleção pode ser composto de três provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70 75 e 90 terá média final:

X =+ +

=1 70 1 75 2 90

481 25( ) ( ) ( ) ,

MedianaDado um conjunto de valores em ordem

crescente, a mediana é definida como:Se n é impar, o valor central;Se n é par, a média simples dos dois valores centrais.

ExemplosExemplo 1: Na amostra 25 26 26 28 30 a mediana é

Exemplo 2: Na amostra 71 73 74 75 77 79 a mediana é26~ =x

5,742

)7574(~ =+

=x

Mediana: dados agrupadosIntervalos de classe Freqüência absoluta12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2

Freqüência acumulada3

1126

4850

39

1. Calcula-se n/2 50/2=252. Identifica-se a classe da mediana terceira classe3. Utiliza-se a fórmula

mdMd f

hf2n

lMd×⎟⎠⎞

⎜⎝⎛ −

+=∑

lMd - limite inferior da classe M 14,51Σf - soma das freqüências anteriores 11 a classe da medianah – amplitude da classe da mediana 0,99fMd – freqüência da classe da mediana 15

ModaA moda é o valor que ocorre com maior

freqüência, ou seja, é o valor mais comum.Exemplos

Exemplo 1: A amostra 23 25 25 26 26 26 27 29 tem moda 26.

Exemplo 2: A amostra 71 73 73 75 76 77 77 79 81 tem moda 73 e 77.

A moda pode ser múltipla ou pode não existir.

Moda: Dados agrupados12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47

Considere os seguintes dados

Intervalos de classe Freqüência absoluta

12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2

hlMo ×Δ+Δ

Δ+=

21

1

l- limite inferior da classe Modal 14,51Δ1 – diferença entre a freqüência da classe modal e a freqüência anterior = 7Δ2 – diferença entre a freqüência da classe modal e a freqüência posterior = 2h – amplitude da classe modal =0,99

Relações Empíricas entre Média, Moda e MedianaPara distribuições simétricas a média, a mediana e a moda

coincidem aproximadamente.

Para distribuições assimétricas observa-se o seguinte:

ExemploA relação entre média e mediana para as amostras a seguir é

A Distribuição simétrica 10 12 14 16 18 14~ 14 === xx

B Distribuição assimétrica à direita 10 12 14 16 23 14~ 15 =>= xx

C Distribuição assimétrica à esquerda 05 12 14 16 18 14~ 13 =<= xx

Relações Empíricas entre Média, Moda e Mediana

Comparação entre Média, Moda e Mediana

Quão freqüente?Média: mais familiarMediana: usada comumenteModa: usada às vezes

ExistênciaMédia: existe sempre.Mediana: existe sempre.Moda: pode não existir; pode haver mais de uma moda

Afetada pelos extremos?Média: simMediana: nãoModa: não

Comparação entre Média, Moda e Mediana

Vantagens e desvantagens:Média: funciona bem com muitos métodos estatísticosMediana: costuma ser uma boa escolha se háalguns valores extremos.Moda: apropriada para dados ao nível nominal

Média Geométrica (G)É a raiz de ordem n do produto dos valores da

amostra:G X Xn

n= 1X2....

ExemploA média geométrica de 12 14 16 é:

É usada em administração e economia para achar taxas médias de variação, de crescimento, ou razões médias

G = × × =12 14 16 13 903 ,

Média Harmônica (H)É o inverso da média aritmética dos inversos

das observações.

ExemploA média harmônica de 12 14 16 é:

H

n X

n

Xi i

= =∑ ∑

11 1 1

81,13

161

141

121

3=

++=H

Relação entre Média Aritmética, Geométrica e Harmônica:

Exemplo: Para a amostra 12 14 16 tem-se

H = 13,81 < G = 13,90 <

H G X≤ ≤

00,14=X

A média geométrica e a média harmônica são menores, ou no máximo igual, à média aritmética. A igualdade só ocorre no caso em que todos os valores da amostra são idênticos. Quanto maior a variabilidade, maior será a diferença entre as médias harmônica e geométrica e a média aritmética.

Comparação Média Aritmética e Média Harmônica

O gráfico abaixo mostra uma simulação comparativa entre a Média Harmônica e a Média Aritmética, calculadas para cinco avaliações,onde as notas de quatro avaliações correspondem a 6,0 e a nota da 5ªavaliação varia de 0 a 10.

Medidas de DispersãoInvariavelmente as observações individuais irão

apresentar alguma dispersão em torno do valor médio. Isso é chamado de variabilidade ou dispersão dos dados.

Há muitas medidas de variabilidade, como por exemplo, a amplitude total, o desvio padrão, a amplitude inter-quartílica ou o coeficiente de variação.

Os valores mínimos e máximos também podem ser usados como medidas de variabilidade

Amplitude totalÉ definida como a diferença entre o maior e o menor valor

das observações.

Exemplo : 8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9A amplitude é total: R = 11,9 - 8,5 = 3,4

A amplitude é fácil de calcular e fornece uma idéia da magnitude da faixa de variação dos dados.

Não informa a respeito da dispersão dos valores que caem entre os dois extremos.

Desvio PadrãoPara uma amostra de n observações, x1, ..., xn , o

desvio padrão S é definido como:

A vantagem do desvio padrão é que trata-se de uma medida de variabilidade que leva em conta toda a informação contida na amostra.

O desvio-padrão de uma população é representado por σ e o desvio padrão de uma amostra por S.

( )1n

xx=S

2i

−−∑

Medidas de Dispersão

As medidas mais utilizadas para representar a dispersão é a VARIÂNCIA e o DESVIO PADRÃO.Uma dificuldade é que a variância não é expressa nas mesmas unidades dos dados originais.

Desvio PadrãoExemplo: para a amostra 10 12 14 16 18 A média é e o desvio-padrão é calculado:Os desvios de cada valor em relação à média

totalizam zero pois a média é o valor central:

14=x

16,31

2)1418(2)1416(2)1414(2)1412(2)1410(=

−−+−+−+−+−

=n

S

4141821416

014142141241410

+=−+=−

=−−=−−=−

Desvio Padrão: Dados agrupados

12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47

Considere os seguintes dados

Intervalos de classe Freqüência absoluta

12,50 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2

46,15=X

50)46.1518(2)46.1517(9)46.1516(13)15(15)46.1514(8)46.1513(3S

222222 −+−+−++−+−=

Ponto médio do intervalo

VariânciaA variância S2 é definida como o quadrado do

desvio padrão.

A variância de uma população é representada pela

letra grega σ2.

A variância é o quadrado do desvio padrão, ou seja,

σ2 =3,16 2 = 9,98

( )1n

xx=S

2i2

−−∑

Amplitude Inter-quartílicaÉ definida como a amplitude do intervalo entre o

primeiro e o terceiro quartis, ou seja:

Às vezes também é usada a semi-amplitude inter-quartílica, que é a metade da anterior.

Trata-se de uma medida de variabilidade bastante robusta, que é pouco afetada pela presença de dados atípicos.

A amplitude inter-quartílica guarda a seguinte relação aproximada com o desvio padrão:

Q = (4/3) x desvio padrão

Q Q Q= −3 1

Coeficiente de VariaçãoÉ definido como o quociente entre o desvio padrão e a

média e, em geral, é expresso em percentual.

O coeficiente de variação é uma medida dimensional, útil para comparar resultados de amostras ou populações cujas unidades podem ser diferentes.

Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a média é próxima de zero.

CV SX

= ×100

Medidas de Posição: QuartisTanto a média como o desvio padrão podem não ser medidas adequadas para representar dados, pois:

São afetadas por valores extremosApenas com estes dois valores não temos idéia da simetria ou assimetria da distribuição dos dados

Se um conjunto de dados é organizado em ordem crescente, o valor central é a mediana.Valores que dividem o conjunto em quatro partes iguais são

representados por Q1, Q2, Q3 e denominam-se primeiro, segundo e terceiro quartis, respectivamente.Q1 separa os 25% inferiores dos 75% dos superiores.Q2 é a mediana.Q3 separa os 75% inferiores dos 25% dos superiores.

Resumo dos cinco números: Q1, Q2, Q3 e os valores mínimo e máximo.

Relações1o quartil = 25o percentilMediana = 5o decil =50o percentil3o quartil = 75o percentil

Cálculo do k ésimo percentilOrdenar os dados do menor para o maiorCalcular:

L=(k/100)×nn=número de valoresk=percentil desejado

Se L não é inteiro: arredonde L para o próximointeiro acima dele. Pk é L-ésimo valor da listaordenada.

Quartis: Exemplo

x(i)12,312,713,013,113,313,313,513,814,114,514,917,2

i123456789

101113

Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:13,3 13,5 17,2 13,8 12,3 12,7 13,0

14,5 14,9 15,8 13,1 13,3 14,1

Exemplo: Quartis1o quartil = 25o percentil

L=(25/100)×13=3,25L=4P25=Q1=13,1

3o quartil = 75o percentilL=(75/100)×13=9,25L=10P25=Q3 =14,5

Percentis: Dados agrupadosPi

i ∈ 1,2,3,4,5,6,...,99,100lPi - limite inferior da classe de Pi

Σf - soma das freqüências anteriores a classede Pi

h – amplitude da classe de Pi

fPi – freqüência da classe Pi

i

iP

Pi f

hfni

lP×⎟⎠⎞

⎜⎝⎛ −×

+=∑100

Percentis: Exemplo com dados agrupados

Intervalos de classe Freqüência absoluta

12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2

1o quartil = 25o percentil

0,060,220,520,780,96

100,00

Freqüência absoluta

52,141,051,1415

01,111100

5025

51,1425 =+=×⎟⎠⎞

⎜⎝⎛ −

×

+=P

Variável Reduzida ou Padronizada

Ela mede a magnitude do desvio em relação à média, em unidades do desvio padrão.

Z = 1,5 significa uma observação desviada 1,5 desvios padrão para cima da média.

A variável reduzida é muito útil para comparar distribuições e detectar dados atípicos.

Dados são considerados atípicos quando Z > 3.

Z X XS

=−

O engenheiro está analisando as espessuras de peças fabricadas em duas máquinas de corte. O operador mediu uma peça da máq. A com espessura de 90 mm e outra peça da máq. B com espessura de 100 mm.engenheiro deve considerar esses dados reais ou atípicos?

25,312

5190=

−=

−=

SXXZMMááqq. A. A Como Z > 3

é dado atípico

A máq. A possui média 51mm e desvio-padrão de 12mm.

75,116

72100=

−=

−=

SXXZMMááqq. B. B Como Z < 3

não é dado atípico

A máq. B possui média 72mm e desvio-padrão de 16mm.

Exemplo

ExemploSupondo que 51 fosse a média em uma prova de inglês,

onde o desvio padrão é 12, para um candidato que obtivesse 90 acertos tem-se:

Conclui-se que na prova de inglês este candidatocandidato está 3,25 desvios-padrão acima da média.

25,312

5190=

−=

−=

SXXZ

Medidas de assimetria e curtoseAs características mais importantes são o grau de deformação ou assimetria e o grau de achatamento ou afilamento da curva de freqüências ou do histograma, chamado curtose.

Coeficiente = 0 (SimCoeficiente = 0 (Siméétrica)trica)Coeficiente > 0 (Assimetria positiva)Coeficiente > 0 (Assimetria positiva)Coeficiente < 0 (Assimetria negativa)Coeficiente < 0 (Assimetria negativa)

S1

Assimetria: skewnessskewness

Média=Mediana=Moda Moda < Mediana < Média Moda > Mediana> Média

Cálculo da assimetriaConhecido como primeiro coeficiente de assimetria de PearsonS: desvio padrão amostralMo: moda

: médiaAssimetria assume valores entre -1 e +1

SMoXSk −

=

X

Curtose: kurtosiskurtosis

a4 = m4/s4, onde m4 = Σ(X - )4/nx

aa44 = 3 (= 3 (MesocMesocúúrticartica))aa44 > 3 (> 3 (LeptocLeptocúúrticartica))aa44 < 3 (< 3 (PlatocPlatocúúrticartica))

Coeficiente de curtose de Pearson

A distribuição normal tem curtose igual a 3

Aspectos GeraisA estatística descritiva tem por objetivo resumir ou descrever características importantes de dados populacionais ou amostrais conhecidos;A inferência estatística tem por objetivo fazer generalizações sobre a população em estudo, a partir dos dados amostrais

Estimativa pontual da médiaUm estimador é uma estatística amostral (como a média amostral) utilizada para obter uma aproximação de um parâmetro populacional.Uma estimativa pontual é um valor (ou ponto) único usado para aproximar um parâmetro populacional.A média amostral é a melhor estimativa pontual para a média populacional.No entanto, não devemos esperar que a estimativa pontual coincida com o verdadeiro valor de um parâmetro.

Estimativa pontual da média da população μ

Quão boa é esta estimativa?

é uma estimativa de μ. x

∑=

=n

iix

1n1x

Seja (x1,...,xn) uma amostra de uma variável aleatória X.

Um problemaA maioria crê que a temperatura média do corpo humano é 98,6oF. Uma amostra de dados parece sugerir que a média é 98,2oF. Sabemos que as amostras tendem a variar, de forma que talvez a verdadeira temperatura média seja 98,6oF e a média amostral 98,2oF seja resultado de uma flutuação aleatória.Veremos se a temperatura média do corpo humano é ou não é 98,6oF. Dados do problema: n=106, S = 0,62oF e

20,98=x

Estimativa intervalar (Grandes amostras)

A probabilidade de que uma estimativa pontual coincida com o verdadeiro valor de um parâmetro populacional é pequena.A estimativa intervalar complementa a estimação pontual.Procuramos um intervalo em torno da estimativa pontual, que acompanhado de uma medida de variabilidade, tenha uma alta probabilidade de conter o verdadeiro valor do parâmetro.

Estimativa intervalar (Grandes amostras)

Assim, um intervalo de confiança (estimativa intervalar) representa uma amplitude de valores que tem probabilidade de conter o verdadeiro valor da população.Todo intervalo de confiança está associado a um grau de confiança. O grau de confiança (ou nível de confiança) é uma medida que representa a probabilidade do intervalo conter o parâmetro populacional. Tal probabilidade é chamada de 1- α.

Estimativa intervalar (Grandes amostras)

A construção do intervalo para μ é baseada na distribuição amostral da média amostral e no grau de confiança (1- α).Não é necessário que a suposição de normalidade para os dados seja adequada.

Estimativa intervalar: variância conhecida

Usando o teorema central do limite a média amostral éuma variável aleatória que tem distribuição normal com

Transformando em uma variável aleatória (VA) normal padrão temos:

As médias amostrais apresentam uma chance relativamente pequena de estar em uma das caudas da distribuição normal. α. é a probabilidade da média estar em uma das caudas.

nσMédia μ e Desvio padrão

X

X

)1,0(~/

Nn

XZσ

μ−=

Estimativa intervalar: variância conhecida

-zα/2 e zα/2 são os valores críticos em cada cauda.Um valor crítico é um número na fronteira em que o valor da estatística amostral tem pouca chance de ocorrer.

f(x)

zα/2

α/2α/2

-zα/2

1 - α

0

onde zα/2 é um valor tal que a área dacurva normal padronizada à sua direita é α/2

Nível de confiança

Estimativa intervalar: variância conhecida

Com os valores críticos -zα/2 e zα/2 e podemos definir os valores do intervalo de confiança para μ, tal que

Assim

o que equivale a:

2//2 n-Xz- αα ≤

σ

μ≤ z nXnz- 2//2 σμσ αα z+≤≤X

ασ

μαα −=⎟⎟

⎞⎜⎜⎝

⎛≤

−≤− 1

/ 2/2/ zn

XzP

Estimativa intervalar: variância conhecida

A margem de erro E é a diferença máxima provável (com probabilidade 1- α) entre a média observada (a média amostral) e a verdadeira média (média populacional).O erro máximo pode ser obtido da seguinte maneira

nzE σα 2/=

Estima-se a variância populacional σ2

através da variância amostral.

Usa-se para calcular o intervalo de confiança para μ (n > 30).

Estimativa intervalar: variância desconhecida

( )1n

xx=S

2i2

−−∑

nXnz- 2//2 SμS αα z+≤≤X

2SS =

Resposta do problema

Como o intervalo acima não contém 98,6oF, parece muito pouco provável que o valor correto de μ seja 98,6oF.Devemos rejeitar a hipótese comum de que a temperatura média do corpo é 98,6oF

12,010662,096,1961 ==

nS,E=

32,9808,9812,020,9812,020,98

≤≤−≤≤−

+≤≤−

μμ

μ ExEx

ExercíciosRegistram-se os valores 0,27; 0,26; 0,27; 0,33; e 0,32 em segundos, obtidos em cinco medições do tempo de fabricação de certo produto. Seja σ = 0,03. Determine intervalos de confiança com níveis de 95% e 99%, para o tempo real médio que se requer para fabricar o produtoUm prefeito de certa cidade turística deseja estimar a média de gastos para os turistas que visitam a cidade. Com este propósito, uma amostra aleatória de 120 turistas foi selecionada para a investigação e encontrou-se que a média foi igual a 800 u.m.(unidades de medidas) com desvio padrão de 200 u.m.

Achar o intervalo de confiança, a 99% para a média de gastos dos turistas com a cidade.Qual deve ser o tamanho mínimo da amostra para que, ao nível de confiança de 95%, o erro de estimação seja 20 u.m.

Um problemaUm fabricante de latas deseja diminuir a espessura das latas a fim de reduzir o custo delas.Usualmente a espessura é de 0,0282 cm mas o fabricante está testando latas de 0,0278 cm. A carga axial de uma lata é o peso máximo suportado por seus lados. Isto é medido através de uma placa seus lados.É importante temos uma carga axial suficientemente grande a fim de a lata não ceder quando se coloca a tampa.

As latas de alumínio podem ter menor espessura para reduzir o custo?

Testes de Hipóteses para Grandes Amostrasσ1 e σ2 conhecidos.

H0: μ1 - μ2 ≥ 0

Ha: μ1 - μ2 < 0

H0: μ1 - μ2 ≤ 0

Ha: μ1 - μ2 > 0

Testes Unilaterais

Testes BilateralH0: μ1 - μ2 = 0

Ha: μ1 - μ2 ≠ 0

Se são σ1 e σ2 desconhecidos use s1 e s2 (desvio padrãoamostral) no lugar de σ1 e σ2

Teste de hipóteses (unilateral)

⎟⎟⎠

⎞⎜⎜⎝

⎛+−=−

2

22

1

21

2121 ,nn

NXXd σσμμ

μ1 - μ2 = 0

2

22

1

21

nnσσ

+

H0: μ1 - μ2 ≥ 0

Ha: μ1 - μ2 < 0

Teste de hipóteses (unilateral)

(1- α) = 0,95

α = 0,05

Rejeitar H0 Não rejeitar H0

H0: μ1 - μ2 ≥ 0

Ha: μ1 - μ2 < 0

2

22

1

21

2/ nnz σσα +

μ1 - μ2 =0

Teste de hipótese unilateral

2

22

1

21

21 )(

nn

xxzσσ

+

−=

0

(1- α) = 0,95

α = 0,05P(Z≤z)=0,05

-1,64

Rejeitar H0 Não rejeitar H0

Rejeitar H0 se

Convertendo para normal padrão21 XX −

Estatísticado teste

H0: μ1 - μ2 ≥ 0

Ha: μ1 - μ2 < 0

64,1)(

2

22

1

21

21 −≤

+

−=

nn

xxzσσ

Teste de hipóteses (unilateral)H0: μ1 - μ2 ≤ 0

Ha: μ1 - μ2 > 0

⎟⎟⎠

⎞⎜⎜⎝

⎛+−=−

2

22

1

21

2121 ,nn

NXXd σσμμ

μ1 - μ2 =0

2

22

1

21

nnσσ

+

Teste de hipóteses (unilateral)

(1- α) = 0,95

RejeitarH0

Não rejeitar H0

α = 005

H0: μ1 - μ2 ≤ 0

Ha: μ1 - μ2 > 0

μ1 - μ2=0

2

22

1

21

2/ nnz σσα +

Teste de hipóteses (unilateral)

P(Z≤z)=0,05

Rejeitar H0 se

Convertendo para normal padrãoX

0

(1- α) = 0,95

RejeitarH0

Não rejeitar H0

α = 0,05

Estatísticado teste

H0: μ1 - μ2 ≤ 0

Ha: μ1 - μ2 > 0

2

22

1

21

nnσσ

+

21 )( xxz −=

64,1)(

2

22

1

21

21 ≥

+

−=

nn

xxzσσ

1,64

Teste de hipóteses (bilateral)H0: μ1 - μ2 = 0

Ha: μ1 - μ2 ≠ 0

⎟⎟⎠

⎞⎜⎜⎝

⎛+−=−

2

22

1

21

2121 ,nn

NXXd σσμμ

μ1 - μ2 =0

Teste de hipóteses (bilateral)

α /2 = 0,025 α/2 = 0,0,25

0,4521- α = 0,95

RejeitarH0

Não rejeitar H0RejeitarH0

H0: μ1 - μ2 = 0

Ha: μ1 - μ2 ≠ 0

μ1 - μ2=0

2

22

1

21

2/ nnz σσα +

P(Z≤z)=0,05

Convertendo para normal padrão

Teste de hipóteses (bilateral)

X

α /2 = 0,025 α /2 = 0,0,25

0,452

0

1-α = 0,95

96,196,1−RejeitarH0

Não rejeitarH0

RejeitarH0

Rejeitar H0 se ou

Estatísticado teste

H0: μ1 - μ2 = 0

Ha: μ1 - μ2 ≠ 0

2

22

1

21

21 )(

nn

xxzσσ

+

−=

96.1)(

2

22

1

21

21 −≤

+

−=

nn

xxzσσ

96.1)(

2

22

1

21

21 ≥

+

−=

nn

xxzσσ

Estatística do teste

Usar a tabela t-Student e o número de graus de liberdade é o menor dentre valor entre n1-1 ou n2 -1.

Testes de Hipóteses para Grandes Amostrasσ1 e σ2 desconhecidos e desiguais.

2

22

1

21

21 )(

ns

ns

xxz+

−=

Teste de hipóteses: procedimento geral

1. Identifique o parâmetro de interesse no problema. Neste caso é μ.2. Formule a hipótese nula (H0)3. Formule uma hipótese alternativa apropriada (Ha)4. Defina o nível de significância5. Estabeleça a estatística usando

a distribuição normal quando as variâncias populacionais são conhecidasoua distribuição t-Student quando as variâncias são estimadas.

6. Estabeleça a região de rejeição usando o nível de significância7. Coletar os dados amostrais e calcular a estatística do teste8. Decida se H0 deve ou não ser rejeitada e transponha esta conclusão para o

contexto do problema

Resposta do problema

2

22

1

21

21 )(

ns

ns

xxt

+

−=

H0: μ1 - μ2 ≥ 0

Ha: μ1 - μ2 < 0

μ1 - carga axial média das latas com espessura 0,0278 μ2 - carga axial média das latas com espessura 0,0282

Estatísticado teste

α = 0,05Nível de significância do teste

0-1,64

Rejeitar H0 Não rejeitar H0

Região de rejeição

Hipóteses

Resposta do problemaDados da amostra 1 (carga das lata com espessura

0,0278):

Dados da amostra 2 (carga das lata com espessura 0,0282):

Estatística do teste

Como tα/2 = -1,64 (174 graus de liberdade) existe uma forte evidência para apoiar a afirmação que as latas de 0,0278 cm têm carga axial média inferior à das latas de 0,0282 cm

48,5

1758,27

1751,22

)8,2811,267()(

2

22

1

21

21 −=+

−=

+

−=

ns

ns

xxt

1,221751,267 111 === snx

8,2717580,281 111 === snx

Introdução

Estudar a relação entre duas variáveis quantitativas

Exemplos

Idade e altura das criançasTempo de prática de esportes e ritmo cardíacoTempo de estudo e nota na provaTaxa de desemprego e taxa de criminalidadeExpectativa de vida e taxa de analfabetismo

Estudo da relação entre variáveis

Investigar a presença ou ausência de relação linear sob dois pontos de vista:

a) Quantificando a força dessa relação: correlaçãob) Explicitando a forma dessa relação: regressão

Diagrama de dispersão: representação gráfica das duas variáveis quantitativas

Exemplo 1: nota na prova etempo de estudo

X : tempo de estudo (em horas)Y : nota na prova

Pares de observações (Xi , Yi)Tempo Nota

3,0 4,57,0 6,52,0 3,71,5 4,0

12,0 9,3

Diagrama de dispersão: forte associação positiva

Diagrama de dispersão: forte associação negativa

Coeficiente de correlação linear

O coeficiente de correlação linear é definido como:

Correlação LinearCorrelação entre duas variáveis quando uma delas está, de alguma forma, relacionada coma a outra.Suposições para medir a correlação:

Dados emparelhadosPares de dados terem distribuição normal bivariada .

Correlação linear mede o grua de relacionamento linear entre os valores emparelhados x e y em uma amostra.

Propriedades do coeficientede correlação linear

Propriedade:-1 ≤ r ≤ 1

Classificação da correlação:r = 1, correlação linear positiva e perfeitar = -1, correlação linear negativa e perfeitar = 0, inexistência de correlação linear

Os valores de r não varia se todos os valores de qualaquer uma das variáveis são convertidos para uma escala diferente.

O valor de r não é afetado pela escolha de x e y. Permutando todos valores de x e y o valor de r permanece o mesmo.

Diagrama de dispersão

Exemplo para r = 1

Diagrama de dispersão

Exemplo para r = -1

Diagrama de dispersão

Exemplo para 0 < r < 1

Diagrama de dispersão

Exemplo para -1 < r < 0

Diagrama de dispersão

Exemplo para r = 0

Diagrama de dispersão

Correlação não linear

Exemplo 2: criminalidadee analfabetismo

Considere as duas variáveis abaixo observadas em 50 estados norte-americanos. (vide dados)

Y: taxa de criminalidadeX: taxa de analfabetismo

Na figura a seguir, temos o diagrama de dispersão de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a taxa de criminalidade tende a aumentar. Nota-se também uma tendência linear.

Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-751 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 52 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.93 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.54 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.35 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.26 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.77 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.98 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.19 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4

10 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.411 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.412 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.213 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.114 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.415 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.616 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.717 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 1118 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.219 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.520 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.521 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.522 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.323 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.724 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 325 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9

Exemplo 2: diagrama de dispersão

28

Exemplo 2: cálculo da correlaçãomédia de Y = 7,38 e SY = 3,692média de X = 1,17 e SX = 0,609somatório de XiYi = 509,12Cálculo da correlação entre X e Y:

Exemplo 3: expectativa devida e analfabetismo

Considere as duas variáveis abaixo observadas em 50 estados norte-americanos. (vide dados)

Y: expectativa de vidaX: taxa de analfabetismo

Na figura a seguir, temos o diagrama de dispersão de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a expectativa de vida tende a diminuir. Nota-se também uma tendência linear.

Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-751 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 52 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.93 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.54 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.35 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.26 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.77 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.98 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.19 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4

10 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.411 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.412 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.213 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.114 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.415 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.616 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.717 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 1118 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.219 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.520 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.521 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.522 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.323 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.724 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 325 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9

Exemplo 3: diagrama de dispersão

11

28

Exemplo 3: cálculo da correlaçãomédia de Y = 70,88 e SY = 1,342média de X = 1,17 e SX = 0,609somatório de XiYi = 4122,8Cálculo da correlação entre X e Y:

Exercício: Calcular a correlação

Temperatura Consumo16 29031 37438 39339 42537 40636 37036 36522 32010 269

Modelo de RegressãoEstima ou prevê uma variável aleatória como uma função de outras variáveis aleatórias

Y, variável resposta, variável dependente

X, variável preditores, variáveis independentes

Y= f(X)

Equação de Regressão Linear

xbby 10ˆ +=

b0 e b1: parâmetros de regressão determinados a partir dos dados, (x1, y1), ..., (xn, yn).

Regressão Linear

SuposiçõesEstamos investigando apenas relações lineares.Para cada par (x,y) é uma variável com distribuição normal. Todas as distribuições de y tem a mesma variância.

Interpretação de b1

Para cada aumento de uma unidade em X, temos um aumento de b unidades em Y.

b0

θ

x x+1

∆x=1

∆y b0 : interceptob1 : inclinação da reta

Significado dos parametros b0 e b1

ii xbby 10ˆ +=

Determinando os parâmetros

yye iii−= Erro

y Valor observado da variável aleatória dependente

y Valor estimado da variável aleatória dependente

ii xy 10 ββ += ii xbby 10ˆ +=

Método dos Minímos Quadrados

−==

==n

1i

2n

1i

2i )iyiy(eSSE min

Minimização da soma dos quadrados devido ao erro

Resíduos

Os parâmetros b0 e b1

−=

−=

221

10

)(xnx

yxnyxb

xbyb

i

ii

Os parâmetros b0 e b1

Onde

xi = é o valor da variável independente para a i-ésima observação

yi = é o valor da variável dependente para a i-ésima observação

=x é a média da variável independente

=y é a média da variável independente

n = número de observaçãoes

Exemplo 4: dados amostrais

Temperatura Consumo16 29031 37438 39339 42537 40636 37036 36522 32010 269

Coeficiente de correlação e a reta ajustada

A correlação entre X e Y é r = 0,962.

A reta ajustada para este exemplo é:

ExercícioQual o consumo previsto para uma temperatura de 25ºC?

top related