4013759 introducao a probabilidade ppt
TRANSCRIPT
Introdução
Se tomarmos um determinado sólido, sabemos que a uma certa temperatura haverá a passagem para o estado líquido: Experimento Determinístico.
Quais as chances das vendas de uma empresa crescerem? Existem dois resultados possíveis: as vendas crescem ou não crescem Experimento Aleatório.
Experimento Aleatório
Processo de observação cujo resultado não é determinado.
O que caracteriza um experimento aleatório
- A possibilidade de repetição sob as mesmas condições- Os resultados não são determinados a priori - Existência de regularidade quando o número de
repetições é grande.
Exemplo 1: Experimentos Aleatórios
a) Lançar uma moeda honesta.b) Lançamento de um dado.c) Lançamento de duas moedas.d) Retirada de uma carta de um baralho completo
de 52 cartas.e) Determinação da vida útil de um componente.
Espaço de Resultados: Espaço Amostral
Conjunto de todos os possíveis resultados de um experimento.
Um resultado do espaço amostral é chamado de evento.
Representa-se por Ω.
Ω pode ser quantitativo (discreto ou contínuo)ou qualitativo.
i) No lançamento de um dado Ω = 1,2,3,4,5,6. Ω é discreto.ii) Observar os momentos de entrada X e saída Y de um clientede uma loja no período 9 – 19 horas . Ω é contínuo.
Ω = (X,Y): 9 < X < Y< 19
Espaços Amostrais do Exemplo 1a) Ω = c, rb) Ω = 1,2,3,4,5,6c) Ω = (c, r), (c,c), (r,c), (r,r)d) Ω = A0,...,K0,Ap,...,Kp,AE,..,KE,AC,...,KCe) Ω = t ∈ ℜ / t ≥ 0
Exemplo 2 : Evento Aleatório
Lançam dois dados iguais. Enumerar os seguintes eventos:
A: saída de faces iguais.B: saída de faces cuja soma seja igual a 10C: saída das faces cuja soma seja menor que 2D: saída das faces cuja soma seja menor que 15E: saída das faces onde uma face é o dobro da outra.
Espaço amostral do exemplo 2
1 2 3 4 5 61 (1,1) (1,2) (1,3) (1,4) (1,5)
(2,5)
(3,5)(4,5)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)(6,5)
(1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,6)4 (4,1) (4,2) (4,3) (4,4) (4,6)
6 (6,1) (6,2) (6,3) (6,4) (6,6)
Os eventos do exemplo 2A=(1,1),(2,2), (3,3), (4,4), (5,5), (6,6)B=(4,6), (5,5),(6,4)C=∅D=ΩE=(1,2),(2,1), (2,4),(3,6),(4,2),(6,3)
Classe de Eventos AleatóriosÉ o conjunto formado de todos os eventos (subconjuntos) do espaço amostral.Considere como exemplo um espaço amostral finito:
Ω = e1,e2,e3,e4A classe de eventos aleatórios F(Ω)
φe1,e2,e3,e4(e1,e2), (e1,e3), (e1,e4), (e2,e3) , (e2,e4), (e3,e4)(e1,e2,e3), (e1,e2,e4), (e1,e3,e4), (e2,e3,e4) (e1,e2,e3, e4)
O número de eventos de um espaço amostral é F(Ω)=2n .Usando esse espaço amostral temos que o número de eventos é 24
⎟⎟⎠
⎞⎜⎜⎝
⎛04
⎟⎟⎠
⎞⎜⎜⎝
⎛14
⎟⎟⎠
⎞⎜⎜⎝
⎛24
⎟⎟⎠
⎞⎜⎜⎝
⎛44
⎟⎟⎠
⎞⎜⎜⎝
⎛34
Propriedades com Eventos Aleatórios
Considere Ω = e1,e2,...,en. Sejam A e B dois eventos de F(Ω).Operações
Uunião: A ∪ B =ei ∈ Ω / ei ∈ A ou ei ∈ B . O evento formado pelos elementos que pertencem a pelo menos um dos eventos.
A BΩ
Propriedades com Eventos Aleatórios
OperaçõesInterseção. A ∩ B =ei ∈ Ω / ei ∈ A e ei ∈ B . O evento formado pelos elementos que pertencem simultaneamente aos dois eventos.
A B
A ∩ B
Ω
Propriedades com Eventos Aleatórios
Complementação: AΩ/eeAAΩ ii ∉∈==−
ΩAA
__
=−Ω A__
A
Exemplo 3: Lançam-se duas moedas. Sejam A: saída de faces iguais e B=saída de cara na primeira moeda.Determine
a) A∪Bb) A∩Bc) ,d) e) f) g) h) B-Ai) A-B
A B
BA∩BA∩
BA∪
BA∪
Resolução do Exemplo 3 Ω = (c,c), (c,r), (r,r), (r,c).A= (c,c), (r,r)B= (c,c), (c,r)
a) A∪B = (c,c, (c,r), (r,r)
b) A∩B=(c,c)
c) ,
d)
e)
f)
g)
h) B-A = (c,r)
i) A-B=(r,r)
c)(r,r),(c,A =
r)(r,c),(r,r),(c,BA =∩c)(r,BA =∩
c)(r,BA =∪
r)(r,c),(r,r),(c,BA =∪
r)(r,c),(r,B =
Propriedades das Operações
a) Idempontentes: A∩A=A, A∪A = A.b) Comutativas: A ∪ B=B∪A,
A ∩ B=B ∩ Ac) Associativas: A ∩ (B ∩ C)= (A ∩ B) ∩ C
A ∪ (B ∪ C)= (A ∪ B) ∪ C)d) Distribuitivas: A ∪ (B ∩ C)= (A ∪ B) ∩ (A ∪ C)
A ∩ (B ∪ C)= (A ∩ B) ∪ (A ∩ C)
Propriedades das Operaçõese) Absorções: A ∪ (A ∩ B)=A, A ∩ (A ∪ B)=Af) Identidades: A ∩ Ω =A, A ∪ Ω = Ω
A ∩ ∅ = ∅, A ∪ ∅ =Ag) Complementares:
g) Leis de Morgan
A)A(Ω,AA
,AAΩ,,Ω
==∪
φ=∩=φφ=
BAB) (A c ∪=∩BAB) (A c ∩=∪
Partição de um Espaço Amostral
Dizemos que os eventos A1,...,An formam uma partição do espaço amostral Ω se:
Ω=
≠φ=∩=φ≠
=U
n
1ii
ji
i
Ac)
ji,AA b)n,...,1i,A a)
A1 A4A6
A2
A5A3
Eventos Mutuamente ExclusivosDois eventos A e B são mutuamente exclusivos se eles
não puderem ocorrer simultaneamente, isto é
A ∩ B = ∅
Exemplo: No lançamento de um dado A: saída impar e B é saída par, então
A: 1,3,5 B: 2,4,6
c
b a
d
e
Permite contar o número de resultados quando n objetos estão para ser selecionados a partir de um conjunto de N objetos, SEM LEVAR EM CONTA A ORDEM DELES.
)!nN(!n!N
nN
CNn −
=⎟⎟⎠
⎞⎜⎜⎝
⎛=
Experimentos de Contagem Combinações
cb a
de
N=5 e n=2
Ω= a,b, a,c, a,d, a,eb,c, b,d, b,e,c,d, c,e,d,e
10)!25(!2
!525
C52 =
−=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
Exemplo 4
Experimentos de Contagem com Permutações
c
b a
d
e
Permite contar o número de resultados quando n objetos estão para ser selecionados a partir de um conjunto de N objetos,LEVANDO EM CONTA A ORDEM DELES.
)!nN(!N
nN
!nPNn −
=⎟⎟⎠
⎞⎜⎜⎝
⎛=
Exemplo 5
c
b a
d
e
N=5 e n=2
Ω= a,b, b,a a,c, c,a a,d, d,a, a,e. e,ab,c, c,b b,d, d,b, b,e,e,bc,d, d,c, c,e, e,cd,e, e,d
20)!25(
!525
!2P52 =
−=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
Introdução1 - Conceito Clássico
Se uma experiência tem N resultados possíveis e igualmente prováveis e nA é o número de resultados de um evento A então a probabilidade de A é
Exemplos: • Lançamento de um dado. Seja A o evento que registra a saída par.
• Lançamento de uma moeda. Seja A o evento que registra coroa
Nn)A(P A=
21)A(P =
21)( =AP
Introdução2 – Conceito Frequentista
Se em N realizações de um experimento, o evento A ocorre nA vezes, então a frequência relativa de A nasN realizações é
e a probalidade é
Exemplo: Uma experiência que consiste em observar o sexo de um recém-nascido. Tal experiência já se realizou diversas vezes e existem registros do seu resultado.
Ω = masculino, femininoP(masculino)=0,52 e P(feminino)=0.48
NnF A
A =
Nnlim)A(P A
N ∞→=
Introdução3 – Conceito subjetivo
A probabilidade é dada por um grau de crença ou de confiança que cada pessoa dá a realização de um evento.
Exemplo: O ministro afirma que a inflação para o próximo ano será de 3% com uma probabilidade de 90%.
.
Definição Formal de Probabilidade
Dado um experimento aleatório E e um evento A do espaço amostral Ω. A probabilidade de A P(A) é uma função que associa um evento um número real, satisfazendo os seguintes axiomas:
1) P(A) ≥ 0 ∀ A ⊆ Ω2) P(Ω) = 13) Sendo A e B dois eventos mutuamente exclusivos
ou seja A∩B=∅, tem-se que
P(A∪B) = P(A) + P(B)
Probabilidade de um eventoExemplo
Considere um experimento de seleção de cartas de um baralho. Cada carta tem a probabilidade 1/52.
A: a carta selecionada é um ASP(A) = 1/52+1/52+1/52+1/52=4/52
Principais Teoremas
1. Se φ é o conjunto vazio então P(φ)=0Demonstração:
Seja A um evento qualquer. Considerando que A∩ φ= φ temos que P(A ∪φ)=P(A)+P(φ) (Axioma 3).Como A ∪φ=A então, P(A) = P(A)+ P(φ). Logo P(φ)=0.
Principais Teoremas2. Se Ac é o complemento do evento A, então P(Ac) = 1- P(A).Demonstração: Considere que Ω=A ∪Ac e A ∩ Ac = φ. Então P(A∪ Ac)=P(A)+P(Ac).Assim, P(Ω)= P(A∪ Ac)= P(A)+P(Ac); 1=P(A)+P(Ac).P(Ac) = 1- P(A).
Exemplo Teorema 2
Exemplo: Um agente de compras declara que há umaprobabilidade de 0,90 de que um fornecedor enviaráuma carga livre de peças defeituosas.Usando o complemento podemos afirmar que há uma
probabilidade de 1-0,90 = 0,10 de que a carga conterápeças defeituosas.
Principais Teoremas3. Se A ⊂ B, então P(A) ≤ P(B)
DemonstraçãoConsidere B= A ∪ (Ac ∩ B). Ora A e Ac ∩ B são mutuamente exclusivos. Logo, P(B) = P(A)+P(Ac ∩ B). P(Ac ∩ B) = P(B)- P(A).Como P(B)- P(A) ≥ 0 por axioma 1.P(A) ≤ P(B).
Exemplo Teorema 3
Exemplo: Jogar um dado e observar o resultado. Ω=1,2,3,4,5,6. Sejam os eventos A=a face é potencia de 2 B=a face é par. Então, A=2,4 e B=2,4,6 e P(A)=2/6 e P(B)=3/6
Principais Teoremas4. Teorema da Soma (Lei da Adição)
É util quando temos dois eventos e estamosinteressados em conhecer a probabilidade de pelomenos um deles ocorra.Dados dois eventos A e B, estamos interessados emconhecer a probabilidade de que o evento A ou eventoB ocorra, ou ambos ocorram:
P(A∪B)=P(A)+P(B)-P(A∩B)Demonstração: a) Se A e B são mutuamente exclusivos
• P(A∩B) = 0.• Recai-se axioma 3
Principais Teoremasb) Se A∩B ≠ φ.
A e (Ac ∩ B) são mutuamente exclusivos .Pelo Axioma 2, P(A∪ Ac ∩ B)=P(A ∪B)= P(A)+P(Ac ∩ B) (i); .Considerando que B é a união dos eventosmutuamente exclusivos (B ∩ A) e (B ∩ Ac). Logo, P(B)= P(B ∩ A) +P(B ∩ Ac); P(B ∩ Ac)= P(B)-P(B ∩ A) (ii). Substituindo (ii) em (i), P(A∪B)=P(A)+P(B)-P(A∩B)
Exemplo Teorema 4Considere uma fábrica com 50 empregados. Um empregado não tem êxito em satisfazer os padrões de desempenho, se completa o trabalho mais tarde e/oumonta produtos com defeito.
Foi observado que 5 dos 50 tinham completado o trabalho mais tarde, 6 dos 50 trabalhadores tinhammontado peças defeituosas e 2 dos 50 tinham tandocompletado mais tarde como montado produtosdefeituosos.
Principais TeoremasA – o evento que o trabalho termina mais tardeB – o evento que o produto montado é defeituoso.
P(A) = 5/50 = 0,10P(B) = 6/50 = 0,12P(A∩B)= 2/50=0,04
P(A ∪ B) = P(A) + P(B) - P(A∩B)= 0,10+0,12-0,04= 0,18
A ∪ B significa a probabilidade de um trabalhador terminarmais tarde ou montar produtos defeituosos.
Probabilidades dos Espaços Amostrais
Seja Ω=a1,...,an. Considera-se cada evento formado por um resultado simples A=ai.Cada evento simples ai associa-se um número pi denominado probabilidade de ai satisfazendo as seguintes condições:
A) pi ≥ 0 i=1,2,...,nB) p1 + p2 +....+pn =1
ExemploTrês cavalos A, B e C, estão em uma corrida; A: tem duas vezes mais probabilidades de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que C. Quais são as probabilidades de vitória de cada um, isto é, P(A), P(B) e P(C)?
SoluçãoConsiderando P(C)=p então P(B)=2p e P(A)=2 P(B)=4p. Como a soma das probabilidades é 1, então:
p+2p+4p=1 ou 7p= 1 ou p=1/7
Logo temos, P(A)=4/7; P(B)=2/7 e P(C)=1/7.
Espaços Amostrais Finitos Equiprováveis
Quando se associa a cada ponto amostral a mesma probabilidade, o espaço amostral chama-se equiprovável ou iniforme. Se Ω contém n pontos, então a probabilidade de cada ponto será 1/nSe um evento A contém r pontos, então:
Este método de avaliar P(A) é enunciado da seguinte maneira.
⎟⎠⎞
⎜⎝⎛=
nrAP 1)(
ocorre amostral espaço o que em vezesde nocorrer podeA evento o que em vezesde n)( o
o
Ω=AP
ou
Ω de casos de totalnA a favoráveis casos de n)( o
o
=AP
ExemploEscolha aleatoriamente (indica que o espaço é equiprovável) uma carta de um baralho com 52 cartas. Sejam A: a carta é de ouros e Calcular P(A)
4
15213
cartas de nouros de nP(A) o
o
===
Problema de Contagem Combinação de r elementos tomados (combinados) p a p. Calcula-se por:
)!(!!
, prpr
pr
C pr −=⎟⎟
⎠
⎞⎜⎜⎝
⎛=
ExemploNum lote de 12 peças, 4 peças são defeituosas; duas peças são retiradas aleatoriamente. Calculea) A probabilidade de ambas serem defeituosas. Seja A=ambas são defeituosas.
A pode ocorrerΩ pode ocorrer
Logo,
624
=⎟⎟⎠
⎞⎜⎜⎝
⎛
66212
=⎟⎟⎠
⎞⎜⎜⎝
⎛
111
666)( ==AP
Exemplob) A probabilidade de ambas não serem defeituosas. Seja B=ambas não serem defeituosas.
B pode ocorrerΩ pode ocorrer
Logo,
2828
=⎟⎟⎠
⎞⎜⎜⎝
⎛
66212
=⎟⎟⎠
⎞⎜⎜⎝
⎛
3314
6628)( ==BP
Exemploc) A probabilidade de ao menos uma ser defeituosa.Seja C=ao menos uma defeituosa. C é o complemento de B, C = Bc
Logo,
3319
33141)( =−=CP
Probabilidade CondicionalSeja E: lançar um dado, e o evento A=sair o número 3. Então P(A) = 1/6.Considere o evento B=sair um número impar. P(A/B) =1/3Definição: Dado dois eventos A e B, denota-se
)()(
)(
)(
)()()/(
BNCFBANCF
NTCBNCF
NTCBANCF
BPBAPBAP ∩
=
∩
=∩
=
Exemplo: Lançamento de dois dados
1 2 3 4 5 61 (1,1) (1,2) (1,3) (1,4) (1,5)
(2,5)
(3,5)(4,5)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)(6,5)
(1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,6)4 (4,1) (4,2) (4,3) (4,4) (4,6)
6 (6,1) (6,2) (6,3) (6,4) (6,6)
Exemplo 1A=(x1,x2)/x1 + x2 = 10, B==(x1,x2)/x1 > x2 onde x1 é o resultado do dado 1 e x2 é o resultado do dado 2.Calcular P(A), P(B), P(A/B) e P(B/A)
125
3615)()( ===
NCTBNCFBP
121
363)()( ===
NCTANCFAP
151
)()()/( =
∩=
BNCFBANCFBAP
31
)()()/( =
∩=
ANCFBANCFBAP
Exemplo 2Considere a situação promocional de oficiais dos Estados Unidos.
Homens Mulheres Total
Promovidos 288 36 324Não Promovidos 672 204 876
Total 960 240 1200
Status de Promoção dos Oficiais de Polícia
Exemplo 2H- evento em que um oficial seja um homenM – evento em que um oficial seja uma mulherA – evento em que um oficial é promovidoAc – evento em que um oficial não é promovido
Homens Mulheres Total
Promovidos 0,24 0,03 0,27Não Promovidos 0,56 0,17 0,73
Total 0,80 0,20 1
Tabela de Probabilidade Associada
P(H∩A)= 288/1200 =0,24P(H∩Ac)= 672/1200 =0,56P(M∩A)= 36/1200 =0,03
P(M∩Ac)= 204/1200 =0,17
Exemplo 2
Qual a probabilidade P(A/H)?Qual a probabilidade P(A/H)?
30,080,024,0
1200/9601200/288
960288)H/A(P ====
30,080,024,0
)H(P)HA(P
960288)H/A(P ==
∩==
Teorema do ProdutoA probabilidade de ocorrência simultânea de dois eventos, A e B, do mesmo espaço amostral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.
P(A/B)=P(A∩B)
P(B)
P(B/A)=P(A∩B)
P(A)
P(B)P(A/B)B)P(A =∩
P(A)P(B/A)B)P(A =∩
Exemplo 3Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas um após a outra sem reposição. Qual a probabilidade de que ambas são sejam boas?A=a primeira é boa, B=a segunda é boa
3314
117
128P(A)P(B/A)B)A( =×==∩P
Independência EstatísticaUm evento A é considerado independente de um outro evento B se a probabilidade de A é igual àprobabilidade condicional de A dado B, isto é
P(A)=P(A/B)P(B)= P(B/A)P(A∩B)=P(A) × P(B)
Exemplo 4Sendo Ω=1,2,3,4 um espaço amostralequiprovável e A=1,2; B=1,3; C=1,4 três eventos de S. Verificar se os eventos A, B e C são independentes.Solução;
P(A)=1/2; P(B)=1/2; P(A∩B)=1/4; logo, P(A ∩B)=1/2 × 1/2 =1/4. P(A)=1/2; P(C)=1/2; P(A∩C)=1/4; logo, P(A ∩C)=1/2 × 1/2 =1/4. P(B)=1/2; P(C)=1/2; P(B∩C)=1/4; logo, P(B ∩C)=1/2 × 1/2 =1/4. P(A)=1/2; P(B)=1/2; P(C)=1/2; P(A ∩B ∩C)=1/4. Logo A, B e C não são independentes
Teorema de BayesSejam A1,...,An um conjunto de eventos mutuamente disjuntos de um espaço amostral Ω, isto é, Ω =A1∪A2 ∪..., An. Seja B um evento de , então para cada i
)()/(...)()/()()/(
)()()/(
11
1
nn
iii APABPAPABP
APABPBP
BAPBAP++
=∩
=
Exemplo 5Considere uma empresa fabricante que recebe embarques
de peças de dois diferentes fornecedores. A1 = evento em que uma peça é do fornecedor 1 : P(A) = 0,65 A2 = evento em que uma peça é do fornecedor 2: P(B) = 0,35B = evento em que uma peça é boaR = evento em que uma peça é ruimP(B/A1) = 0,98, P(R/A1) = 0,02, P(B/A2) = 0,95 P(R/A2) = 0,05
Exemplo 5Dado que uma peça é ruim, qual é a probabilidade da peça ser do fornecedor 1 e qual é a probabilidadeda peça ser do fornecedor 2? P(A1/R)=? e P(A2/R)=?
Exemplo 5P(A1∩R)=P(A1)P(R/A1)P(R) = P(A1 ∩R)+P(A2∩ R) = P(A1)P(R/A1) + P(A2)P(R/A2)P(A1∩R)=(0,65)(0,02)=0,0130 P(A2∩R)=(0,35)(0,05)=0,0175P(R)= 0,0305 P(A1/R)= 0,013/0,0305
Exemplo 5P(A2∩R)=P(A2)P(R/A2)P(A1∩R)=(0,65)(0,02)=0,0130P(A2∩R)=(0,35)(0,05)=0,0175P(R)= 0,0305P(A2/R)= 0,0175/0,0305
IntroduçãoE: Lançamento de duas moedasΩ = (c,c), (c,k), (k,k), (k,c).X: número de caras obtidas nas duas moedasR=0,1,2X=0 → corresponde ao evento (c,c) com prob. 1/4X=1 → corresponde aos eventos (k,c) e (c,k) com prob. 2/4X=2 → corresponde ao evento (k,k) com prob. 1/4
DefiniçãoSejam E um experimento e Ω o espaço associado ao experimento. Uma função X, que associe a cada elemento ω ∈ Ω um número real X(ω) édenominada variável aleatória.
Uma variável aleatória pode ser contínua ou discreta.
ω X(ω)
XΩ
Classificação de VariáveisDiscreta
Se o número de valores possíveis de X (seu contradomínio) for finito ou infinito enumerável.
ContínuaSe o contradomínio é um intervalo ou um conjunto de intervalos.
Exemplos de Variável Aleatória Discreta
Experimento Variável Aleatória X Valores da Variável Aleatória
Contratar Clientes Número de clientes que compram
0,1,2,3,4,5
Inspecionar um embarque de 50 rádios
Número de rádios defeituosos
0,1,2,3,4,5,...,49,50
Vender um automóvel Gênero do cliente 0 se masculino1 se feminino
Vendas no Shopping Número de clientes 0,1,2,3,4,5........
Exemplos de Variável Aleatória Contínua
Experimento Variável Aleatória X Valores da variávelAleatória
Operar um banco
Tempo entre as chegadas dos clientes
x ≥ 0
Encher um recipiente de refrigerante
Número de ml 0 ≤ x ≤ 343
Trabalhar em um projeto
Porcentagem do término do projeto após 6meses
0 ≤ x ≤ 100
Função de Probabilidades ou Distribuição de Probabilidade
Seja X uma variável aleatória discreta. A probabilidade de X assumir um valor x é uma função que se representa P(X=x) ou P(x).P(X=x) determina a distribuição de probabilidades da variável aleatória X. Exemplo:
E:lançamento de duas moedasX: número de caras obtidas
x 0 1 2
P(X) 1/4 2/4 1/4
Tabela: Função de Probabilidade
2,1,0 ,2
41)( =⎟⎟
⎠
⎞⎜⎜⎝
⎛= x
xxP
Função de Probabilidades
Representação Gráfica
1/2
1
1/4
x
f(x)
0 1 2
Função de uma variável aleatória Qualquer função de uma variável aleatória étambém uma variável aleatória. Se X é uma V.A., então Y=ϕ(x) é também uma V.A.Exemplo:
E:lançamento de dois dadosX: pontos de um dadoY=X1+X2 → soma dos pontos de dois lançamentosZ=max(X1,,X2) onde Xi – variável aleatória associada ao resultado do i-ésimo dado
Exemplo
x 1 2 3 4 5
1/6 1/61/6
6
P(X) 1/6 1/6 1/6
Tabela: Função de Probabilidade de X
y 2 3 4 5 6 7 8 9 10 11
3/36 2/364/365/366/365/364/363/36
12
P(Y) 1/36 2/36 1/36
Tabela: Função de Probabilidade de Y
Exemplo
z 1 2 3 4 5
7/36 9/365/36
6
P(Z) 1/36 3/36 11/36
Tabela: Função de Probabilidade de Z
Função de Distribuição (Repartição)
Seja X é uma V. A. discreta.A função de distribuição da variável X, no ponto x, é definida como sendo a probabilidade de que X assuma um valor menor ou igual a x.F(x)=P(X ≤x)Exemplo: Lançamento de duas moedas.F(x) = 0 se x < 0F(x) = ¼ se 0 ≤ x < 1F(x) = ¾ se 1 ≤ x < 2F(x) = 1 se x ≥ 2
1/2
1
1/4
x
f(x)
0 1 2
Função de Distribuição Propriedades
1. 2. F(- ∞)=0, F( ∞)=13. P(a < X ≤ b)=F(b)-F(a)4. P(a ≤ X ≤ b)=F(b)-F(a)+P(X=a)5. P(a < X < b)=F(b)-F(a)-P(X=b)6. F(x) é uma função não decrescente, isto é,
F(b) > F(a), para b>a
∑≤
=xx
ii
xPxF )()(
Função de Densidade de Probabilidade
Relembrando: Em uma variável aleatória contínua o conjunto dos possíveis valores pode ser um intervalo ou um conjunto de intervalos.Seja X uma variável aleatória continua. A função de densidade de probabilidade f(x) é uma função que satisfaz as seguintes condições:1. f(x) > 0 para todo x ∈Rx2. Para qualquer a < b em Rx
∫ =xR xf 1)(
∫=<< b
a dxxfbXaP )()(
Observações1. A probabilidade de qualquer ponto é zero2. P(a ≤ X ≤ b)=P(a ≤ X <b)=P(a < X ≤ b=
P(a < X <b).3. A função integrada entre dois limites a e b (a < b) é a probabilidade, ou seja, a área sob a curva.4. A função de distribuição é definida como:
∫∞−
=x
dxxfxF )()(
ExemploSeja X uma variável aleatória contínua com a seguinte função de densidade.
f(x) é uma função de densidade.
P(1/4 < x < 3/4)?
⎩⎨⎧ <<
=contrário caso 0
10 para 2)(
xxxf
101
020)( 21
0 1
0
==++= ∫ ∫∫∫∞
∞−
+∞
∞−
xdxxdxdxxf
2/141
43
4/14/3
2)4/34/1(224/3
4/1
2 =⎟⎠⎞
⎜⎝⎛−⎟
⎠⎞
⎜⎝⎛===<< ∫ xdxxP
1
x
f(x)
0 1 2
2
1
ExemploFunção de distribuição F(x)
Para x< 0Para 0 ≤ x < 1Para x ≥ 1
∫ ∞−== x xdxxF 0)(
∫ ∫∞−=+= 0
022)( x xxdxxdxxF
∫ ∫ ∫∞−=++= 0 1
0 1 102)( x dxxdxxdxxF
Variável Aleatória BidimensionalUsa-se quando há interesse por dois resultados simultâneos. Por exemplo, altura H e peso P duas pessoas.Definição:
Sejam E um experimento aleatório e Ω o espaço amostral associado a E.Sejam X=X(ω) e Y=Y(ω), duas funções, cada uma associando um número real a cada resultado ω ∈ Ω, denomina-se o par (X,Y) uma variável aleatória bidimensional.
Gráfico
ω
X(ω)
Y(ω)
Distribuição conjunta de duas variável aleatórias DISCRETAS
Seja (X,Y) uma variável aleatória bidimensional discreta.Função de probabilidade: Trata-se de uma função associada um número p(xi,yj) representado por P(X= xi, Y=yj) satisfazendo as seguintes condições:
p(xi,yj) > 0
Exemplo: Sejam E=jogar dois dados e (X,Y) pontos dos respectivos dados
• P(X= xi, Y=yj)= p(xi,yj)=1/36, i=j=1,2,3,4,5,6
1),(1 1
=∑∑∞
=
∞
=j iji yxp
Função de densidade de probabilidade conjunta de duas variáveis CONTÍNUAS
Seja (X,Y) uma variável aleatória bidimensional discreta.Diz-se que f(x,y) é uma função de densidade de probabilidade conjunta se :1. f(x,y) ≥ 02. ∫ ∫
∞
∞−
∞
∞−
=1),( dxdyyxf
Função de Distribuição Conjunta
Definição: F(x,y)=P(X ≤x,Y ≤y)
Caso (X,Y) DISCRETA, tem-seF(x,y) = ΣΣ p(xi,yj) tal que x ≤ xi e y ≤ yj
Caso (X,Y) CONTÍNUA, tem-se ∫ ∫∞− ∞−
=x y
dxdyyxfyxF ),(),(
Distribuição de Probabilidade Marginal: Caso (X,Y) DISCRETA
Dado uma variável aleatória bidimensional (X,Y) e sua distribuição conjunta.Pode-se determinar a distribuição de X sem considerar Y: Distribuição Marginal de X (sem considerar Y)
P(X=xi) = P(X=xi, - ∞ < y < ∞) ouP(X=xi)=Σj P(xi,yj)
Distribuição Marginal de Y (sem considerar X)P(Y=yj) = P( - ∞ < x < ∞, Y=yj) ouP(Y=yj)=Σi P(xi,yj)
Distribuição de Probabilidade Marginal: Caso (X,Y) CONTÍNUA
Função de densidade marginal de X
Função de densidade marginal de Y
∫∞
∞−
= dyyxfxg ),()(
∫∞
∞−
= dxyxfyh ),()(
Variáveis Aleatórias Independentes
Caso DISCRETA:Seja (X,Y) uma variável aleatória discreta bidimensional. Diz-se que X e Y são independentes se e somente se p(xi,yj) = p(xi) × p(yj) para quaisquer i e j.Caso CONTÍNUA:Seja (X,Y) uma variável aleatória discreta bidimensional. Seja g(x) a função de densidade de X e h(x) a de Y. Diz-se que X e Y são independentes se e somente se f(x,y) = g(x) × h(y) para todo (x,y).
Exemplo
Verificar se X e Y são independentes.Solução: para todo para i e j; i=j=0, 1, 2 deve-se ter p(xi,yj)=p(xi) × p(yj)
0 1 2 p(yj)0 0,10 0,20 0,20 0,501 0,04 0,08 0,08 0,202 0,06 0,12 0,12 0,30p(xi) 0,20 0,40 0,40 1,00
ExemploSuponha que (X,Y) tenha a seguinte função de densidade
Faça a distribuição marginal de xFaça a distribuição marginal de yX e Y são independentes
⎩⎨⎧ <<<<+
=contrário caso 0
1y0 1,x0 ),(
yxyxf
Medidas de Posição: Média ou Esperança Matemática
Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra um acidente é 3%. Quanto espera a seguradora ganhar por cada carro segurado?
Solução: Suponhamos que entre 100 carros, 97 dão lucro de R$ 1.000,00 e 3 dão prejuízo de R$ 29.000,00.Lucro total: 97 × 1.000 - 3 × 29.000=10.000,00Lucro médio por carro = 10.000,00/100= R$ 100,00Se chamamos X: lucro por carro e E(X) por lucro médio por carro, teremos
Definição para o caso discreto
Definição para o caso contínuo
É um número real e também uma média ponderada. Notação: μ ou μx.
29.000,000,03-1.000,00 0,97
29.000,00100
3-1.000,0010097
10000,000.29300,000.197)(
××=
××=
×−×=XE
∑=
×=n
iii xpxXE
1)()(
∫∞
∞−
= dxxfXE )()(
Medidas de Posição: Média ou Esperança Matemática
Exemplo: Caso DiscretoSuponha que um número seja selecionado entre 1 e 10.
Seja X o número de divisores do número selecionado. Calcular o número médio de divisores do número selecionado. No No de Divisores
1 1
2 2
3 2
4 3
5 2
6 4
7 2
8 4
9 3
10 4
X P(x) X × P(X)
1 1/10
4/10
2/10
4 3/10 12/10
1
1/10
2 8/10
3 6/10
Total 2,7
E(X)=2,7
Exemplo: Caso ContínuoSeja X uma variável aleatória contínua com a seguinte função de densidade.
A esperança de X é⎩⎨⎧ <<
=contrário caso 0
10 para 2)(
xxxf
3/201
3222)(
1
0
32
1
0==== ∫∫
xdxxdxxxXE
Medidas de Posição: Propriedades da Média
Sejam X e Y duas variáveis aleatórias e k uma constante.
1. E(k)=k, k sendo uma constante.2. E(KX)=kE(X).3. E(X±Y)= E(X) ± E(Y).4. E(X±k)= E(X) ± k.
5. E(X-μ)=E(X)- μ=06. E(XY)=E(X) × E(Y) se X e Y são independentes.
Medidas de Posição: MedianaA mediana de uma variável aleatória é o valor que
divide a distribuição em duas partes iguais, ou seja F(Md)=0,5 onde Md é a mediana.Exemplos
Seja X uma v. a. contínua com a seguinte função de distribuiçãoF(x)=0 para x < 0F(x)=x2 para 0≤ x < 1F(x)=1 para x≥1Logo a mediana será o valor x tal que F(x=md)=0,5. A mediana é 2/1
Medidas de Posição: ModaÉ o valor da variável com maior probabilidade, se X é discreta, ou maior densidade se X for contínua.Exemplos:
Se X é discreta tal que
A moda m0 =2.Se X é contínua tal que f(x) = 2x para 0≤ x ≤ 1A moda m0 é 1 e a mediana F(md)=0,5
Mediana é 0,5.
X -1 0 2P(X) 0,3 0,2 0,5
5,002
25,02 2
0
2
==⇒=∫ MdMdxxdx
Md
Medidas de Dispersão: VariânciaDefine-se a variância de uma variável aleatória como sendo
Para X discreta
Para X contínua
])[()( 22XX XEXVar μ−=σ=
∑ μ−=σ )()( 2)(
2iXiX xPX
dxxfx XX )()( 22 ∫∞
∞−
μ−=σ
Medidas de Dispersão: Desvio Padrão
O desvio padrão é a raiz quadrada da variância
Pode-se encontrar o desvio usando a variância dada por
2XX σ=σ
222 )()( XX XE μ−=σ
Medidas de Dispersão: Propriedades da Variância
1. Seja k uma constante. A variância de uma constante é zero. Var(k)=0.2. Var(kX)=k2Var(X).3. Var(X±k)=Var(X)
ExemploSeja X discreta tal queA esperança de X é
A variância de X é
O desvio padrão é
X -1 0 2P(X) 0,3 0,2 0,5
81.15,0)3,1(2,0)7,0(3,0)7,1()())(()( 2223
1
2 =+−+−=−=∑=i
ii xpxxXVar μ
∑=
=×+×+×−==μ3
17,05,022,003,01)()(
iii xpxX
020,1041,1 ==σX
ExemploSeja X uma variável aleatória contínua com a seguinte função de densidade.
A esperança de X é 2/3.A variância de X é
O desvio padrão é
⎩⎨⎧ <<
=contrário caso 0
10 para 2)(
xxxf
18/12)3/2()(1
0
2 =−= ∫ dxxxXVar
235,018/1 ==σ X
Distribuição de BernoulliUma lâmpada é escolhida ao acaso
A lâmpada é defeituosa(sucesso)
X = 0 se a lâmpada não édefeituosaX = 1 se a lâmpada édefeituosa
P(X=1)= 3/5P(X=0)= 2/5
Ensaio de Bernoulli
Número de ensaios = 1
Distribuição de BernoulliSeja X uma v.ª com dois resultados possíveis: fracasso e sucesso.X→ x1 =1 sucesso; P(X=1)=pX→ x1 =0 fracasso; P(X=0)=1-p=qMédia: μX = p Variância σ2 = pq
Distribuição Binomial
P(não defeituosa)=1-p= 4/7P(defeituosa)= p =3/7
3 Ensaios de Bernoulli, n = 3
Seja X o número de defeituosas
1. O experimento consiste de três ensaios idênticos;2. Dois resultados são possíveis;3. As probabilidades p e (1-p) são as mesmas em cada ensaio;4. Os ensaios são independentes.
Distribuição Binomial
S= 111, 110, 101, 011, 001, 010, 100, 000
P(001) = 4/7 × 4/7 × 3/7= 48/343P(010) = 4/7 × 3/7 × 4/7=48/343P(100) = 3/7 × 4/7 × 4/7=48/343
P(X=1) = P(001) + P(010) + P(100)P(X=1) = 3 × 48/343
X = 0 - 000X = 1 – 001, 010, 100X = 2 - 110, 101, 011X = 3 - 111
Seja X o número de defeituosas
P(não defeituosa)= (1-p)= 4/7P(defeituosa)= p =3/7
Distribuição Binomial
( ) ( )21 7/47/313
)1( ⎟⎟⎠
⎞⎜⎜⎝
⎛==XP
P(X=1) = P(001) + P(010) + P(100)P(X=1) = 3 × 48/343
Seja X o número de defeituosas
Distribuição Binomial
( ) ( ) xnx ppxn
xXP −−⎟⎟⎠
⎞⎜⎜⎝
⎛== 1)(
Função de Probabilidade
ondep(x) = a probabilidade de x sucessos em n ensaiosn = o número de ensaios
p = probabilidade de um sucessoem um ensaio(1-p) = probabildidade de um fracasso em um ensaio
X ∼ B(n,p)
Distribuição Binomial
Seja X uma v.a. Binomial com parâmetros n e p onde p é a probabilidade de sucesso.X→ 0,1,2,..nMédia: μX = npVariância σ2 = npq
Exemplo
Considere uma loja de roupas que receba 3 clientesp = o cliente faz compra = 0,30(1-p) = o cliente não faz compra = 0,70
x p(x)
0 0,343
1 0,441
2 0,189
3 0,027
1,00
30 )70,0()30,0(!3!0
!3
Total
21 )70,0()30,0(!2!1
!3
12 )70,0()30,0(!1!2
!3
03 )70,0()30,0(!0!3
!3
X- número de clientesque compram
Exemplo: Representação Gráfica
0 1 2 3
0,10
0,20
0,30
0,40
0.50
x
P(x)
Função de Probabilidade
Exemplo: CaracterísticasValor Esperado
E(X) = μ = np
Variância
Var(X) = σ2 = np(1-p)
Considerando o exemplo, temos
E(X) = μ = 3 × 0,30 = 0,90
Var(X) = σ2 = np(1-p)= 3 × 0,30 × 0,70 = 0,63
Distribuição MultinomialÉ uma extensão da binomial para mais de dois resultados possíveis.Seja um experimento que permite ter k resultados diferentes (A1,...Ak) formando o espaço amostral.Considere n tentativas deste experimento, sendo que os pi i=1,..,k associados aos k resultados permanecem constantes durante as repetições do experimento, comSejam Xi,..Xk v. as. que são os números de ocorrências associados aos k resultados possíveis com
∑=
=k
iip
11
Distribuição MultinomialFunção de Probabilidade
Com Média: E(Xi)= n × pi
Variância: Var(Xi) = n × pi × qi
knk
nn
kkk ppp
nnnnXnXP ×××××
=== ....!...!
!)...,( 2121
1,1
∑=
=k
ik nn
1
ExemploUm dado é lançado 10 vezes. Qual é a probabilidade de terem aparecido duas vezes o no
2, duas vezes o no 5, três vezes o no 1 e uma vez os demais resultados?n=10 p1= p2= p3 = p5 = p6 = 1/6X1=3, X2=2, X3=1,X4=1,X5=2,X6=1
0025,061
61
61
61
61
61
!1!2!1!1!2!3!10
)1,2,1,1,2,3(121123
654321
=⎟⎠⎞
⎜⎝⎛×⎟
⎠⎞
⎜⎝⎛×⎟
⎠⎞
⎜⎝⎛×⎟
⎠⎞
⎜⎝⎛×⎟
⎠⎞
⎜⎝⎛×⎟
⎠⎞
⎜⎝⎛
×××××=
======= XXXXXXP
ExemploE(Xi)=nipi e Var(Xi) = n × pi × qi
E(X1)= 10 × 1/6 =5/3 e Var(X1) = 10 × 1/6 ×5/6=50/36E(X2)= 10 × 1/6 =5/3 e Var(X2) =10 × 1/6 ×5/6=50/36E(X3)= 10 × 1/6 =5/3 e Var(X3) = 10 × 1/6 ×5/6=50/36E(X4)= 10 × 1/6 =5/3 e Var(X4) = 10 × 1/6 ×5/6=50/36E(X5)= 10 × 1/6 =5/3 e Var(X5) = 10 × 1/6 ×5/6=50/36
Carros que passam por um cruzamento por minuto, durante uma certa hora do dia.Erros tipográficos por página,em um material impresso.Defeitos por unidade (m2,m, etc) por peça fabricadaMortes por ataque de coração por ano, numa cidade.Problemas de filas de espera
Distribuição de Poisson
Distribuição de PoissonRepresenta a distribuição de probabilidade de umavariável aleatória que registra o número de ocorrências sobre um intervalo de tempo ouespaço específicos.Propriedades do experimento Poisson:
A probabilidade de uma ocorrência é a mesma paraquaisquer dois intervalos de tempo.A ocorrência ou não ocorrência em qualquer intervalo
é independente da ocorrência ou não-ocorrência em qualquer intervalo
!)(
xexP
x λ−λ= X ∼ P(λ)
Função de Probabilidade de Poisson
Uma variável aleatória de Poisson não tem limites. x = 0,,1,2,3,…P(x) = a probabilidade de x ocorrências em um intervaloλ = valor esperado ou número médio de ocorrências em um
intervaloe = 2,71828 Média: E(X) = λVariância: Var(X)= λ
ExemploSuponha que é observado o número de chegadas a uma caixa automática de um banco durante um período de 15 minutos.A probabilidade de um carro chegar é a mesma
para quaisquer dois períodos de tempo de igualcumprimento.A chegada ou não chegada de um carro em qualquer período de tempo é independente dachegada ou não chegada de um outro carro em qualquer outro período de tempo.
Suponha que o número médio de carros que chegam no período de 15 minutos é 10, então
!10
!)(
xe
xexP
xx λ−π−
=λ
=
X- número de carros que chegam em qualquer período de 15 minutos
A probabilidade de 5 chegadas em 15 minutos
0378,0!5
10)5(105
====−eXP
Exemplo
E(X) = 10 e Var(X) = 10
Distribuição UniformeSeja X uma variável aleatória que representa o tempo de vôo de uma aeronave viajando de Chicago até Nova York.Suponha que o tempo de vôo pode ser qualquer valor no intervalo de 120 até 140 minutos.Suponha que os intervalos de um minuto são equiprováveis.Parâmetro da distribuição: um intervalo [a,b]
Distribuição UniformeX é uma v.a. uniformemente distribuída se a sua função de densidade for dada por
A função de distribuição F(x) é dada por:
Logo
E(X)=(b+a)/2, VAR(X)=(b-a)2/ 12
b x a se 1)(
bou xax se 0)(
≤≤−
=
><=
abxf
xf
abaxdx
abxF
x
a −−
=−
= ∫1)(
b xse 1(x)
b x a se )(
ax se 0)(
≥=
<<−−
=
≤=
FabaxxF
xF
Exemplo: X ∼ U[3,7]
x76543
0.255
0.250
0.245
x
f(x)
Distribuição ExponencialÉ muito útil para descrever o tempo que se leva para completar uma tarefa. Ex: O tempo para carregar um caminhão considerando que em média gasta-se 15 minutos para realizar esta tarefa.Outras situações típicas: tempo de chegadas a um lava-jato, tempo de vida de aparelhos, tempo de espera em restaurantes, caixas de banco, etc Parâmetro: média (ex: tempo médio) ou valor esperado.
Distribuição ExponencialX tem uma distribuída exponencial se sua função de densidade é dada por
A função de distribuição é dada por
Logo
E(X)=1/λ VAR(X)=1/λ2
0 se )(0 x se 0)(≥λ=
<=λ− xexf
xfx
)1()(0
xx
x edxexF λ−λ− −=λ= ∫
0 se 1)(0x se 0)(
>−=
≤=λ− xexF
xFx
Exemplo: X ∼ Exp[1]
9876543210
1.0
0.5
0.0
f(x)λ
Distribuição NormalTem sido usada em uma ampla variedade de aplicações práticas nas quais as variáveis aleatórias são: alturas e pesos de pessoas, medições, índices , etc.Parâmetros: média e desvio padrão.Ex: Os salários dos diretores das empresas em São Paulo, distribuem-se normalmente com média de R$ 20.000,00 e desvio padrão de R$ 500,00.
Distribuição NormalX tem uma distribuída normal se sua função de densidade é dada por
Principais característicasO ponto máximo de f(x) é o ponto X=μ.Os pontos de inflexão da função são: X= μ+σ e X= μ-σ.A curva é simétrica com relação a μ.E(X)=μ e VAR(X)= σ2
Se X ∼N(μ, σ2) então a variável aleatória
∞<<∞πσ
=⎟⎠⎞
⎜⎝⎛
σμ−
− x -exf
x
,2
1)(2
21
σμ−
=XZ ∼ N(0,1)
Exemplo: Z∼ N(0,1)
3210-1-2-3
0.4
0.3
0.2
0.1
0.0
x
f(x)
Normal Padrão68,26%
95,44%
99,72%
Exemplo: X∼ N(3,16)
20100-10
0.10
0.05
0.00
3
f(x)
3+43-4
Probabilidades
20100-10
0.10
0.05
0.00
3
f(x)
3+43-4
P(-1 ≤ X ≤ 3 )= P(3 ≤ X ≤ 7 )
Probabilidades
3210-1-2-3
0.4
0.3
0.2
0.1
0.0
x
f(x)P(-1 ≤ Z ≤0 )= P(0 ≤ Z ≤ 1)
P(x1 ≤ X ≤x2 )= P(z1 ≤ Z ≤ z2)
σμ−
= 11
XZσμ−
= 22
XZ
23
24
7342
1722 33
35
36
30
2118
29
28
28
17
22
22
28
33
2822
29
18
18Distribuição das idades dos funcionários
idade
núm
ero
de fu
ncio
nário
s
0
2
4
6
8
10
12
14
10 20 30 40 50 60 70
Técnicas de Estatística Descritivatécnicas para extrair informações de conjuntos de dados
Conceitos de EstatísticaConceitos Antigos
a) simples contagem aritméticaExs:
estatística de asfaltos, mais de 2000 acidentesem seis meses no Estado do Rio de Janeiro.O Estado do Ceará tem 679 indústriasA população do Brasil no ano de 2000 é de
169.799.170.
b) Sinônimo de dados publicados oficialmentePublicações tais como: Anuário Estatístico do Brasil, RevistaBrasileira de Estatística, IBGE, Boletim Estatístico.
Exs: O anuário Estatístico do Brasil revelou mais de três
mil milionários no Braisl.Segundo as estatísticas realizadas pela OrganizaçãoMundial de Saúde, ultimamente divulgada, as doenças
cardíacas constituem a primeira causa de óbitos.
c) Simples transformação numéricas (percentagens, médiase razões, etc.)
Exs:Só 35 em 1000 alunos do curso primário concluem o
Secundário.58% dos veículos que rodam no país são nacionais.Um carro para 16 pessoas em São Paulo.
Conceitos de EstatísticaConceitos Antigos
Conceitos de EstatísticaConceitos Antigos
d) Construção de tabelas e gráficos
Sexo Norte Nordete
Masc. 5.44 7.80
Fem. 5.52 9.02
Total 10.96 16.82
Fonte: DataSus
Número de Pessoas por Região e Sexo
Cabeçalho, Corpo e Rodapé
Tabelas EstatísticasAs tabelas devem obedecer à Resolução n0 886, de 26 de
outrubro de 1966, do Conselho Nacional de Estatística.
O Cabeçalho deve conter o suficiente pra que sejamrespondidas as seguintes perguntas
•O que refere o fato? Vendas•Onde? ABC Veículos•Quando? no 10 bimestrede 1996
Período UnidadesVendidas
Janeiro/1996 20
Fevereiro/1996 10
Total 30
Vendas no 10 bimestre de 1996 daABC Veículos
Corpo: Contém osregistros dos dados
Rodapé: Fonte dos dados
Fonte: ABC Veículos
Tabelas Estatísticas
Séries EstatísticasÉ qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da
ÉPOCALOCAL OUESPÉCIE
Período UnidadesVendidas
Janeiro/1996 20
Fevereiro/1996 10
Total 30
Vendas no 10 bimestre de 1996 daABC Veículos, por mês
Fonte: ABC Veículos
1. Série Temporal ou CronológicaIdentifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos..
Filiais UnidadesVendidas
São Paulo 13
Rio de Janeiro 17
Total 30
Vendas no 10 bimestre de 1996 daABC Veículos, por filial
Fonte: ABC Veículos
2. Série Geográfica ou HistóricaApresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Tambémé chamada de espacial, territorial ou de localização.
.
Marca UnidadesVendidas
FIAT 18
GM 12
Total 30
Vendas segundo a marca, no 10 bimestrede 1996 da ABC Veículos
Fonte: ABC Veículos
3. Série EspecíficaO caráter variável é apenas o fato ou espécie. Também é chamada de série categórica.
4. Distribuição de FreqüênciasÉ a série em que os dados são agrupados com suas respectivas freqüências.
Número de Carros por dia
Número de de dias
100 200 42
200 300 18
Total 60
Vendas no 10 bimestre de 1996 daABC Veículos
Fonte: ABC Veículos
População: grande conjunto de dados que tem as características de interesse.
Em muitas situações não é possível acessar todas a população.Em geral as razões econômicas são as mais determinantes.
Amostra é um subconjunto da população
População e Amostra
Amostra
População
Estatisitica descritiva
Inferência Estatística
Estimação de quantidadesExtrapolação dos resultados
Testes de Hipóteses
• A seleção da amostra pode ser feita e diversas maneirasdependentes entre outros fatores, do grau de conhecimentoque temos da população e de recursos disponíveis.
• A idéia é que amostra tenta fornecer um subconjuto de valores o mais parecido possível com a população quelhe dá origem.
• A amostragem mais usada é a casual simples, em queselecionamos ao acaso, com ou sem reposição, os itensda população que farão parte da amostra.
População e Amostra
POPULAÇÃO:moradores de uma metrópole
AMOSTRA:uma parte dos moradores
Levantamento por Amostragem
• 1. Amostragem Aleatória
Um professor deseja oferecer prêmios (5 livros) a seusalunos em número de 35 e resolve apelar parao sorteio.
• 2 . Amostragem Estratificada
A turma tem 13 alunos e 22 alunas.
A amostra é71
355=
71 de 13 = 1,86 ≅ 2 alunos
71 de 22 = 3,14 ≅ 3 alunas
Exemplos de Tipo de Amostragem
• 3. Amostragem SistemáticaSorteia-se apens um número aleatoriamente entre 1 a 35 edepois de 7 em 7 somando sempre 7 ao número econtrado.
Suponha que o primeiro número é 14 então,
O segundo é 14+7=21O terceiro é 21+7 = 28O quarto é 35O quinto é 7
Por que de 7 em 7 ?
71
355= um em cada 7 é o intervalo da amostra
Exemplos de Tipo de Amostragem
O trabalho estatístico exige um conjunto de dados resultantede uma coleta de informações extraídas da população.
Exemplos:Suponha que um questionário foi aplicado aos alunos do primeiro ano da escola.Id: número de identificação do alunoTurma: turma em que foi alocado (A ou B)Sexo: F se feminino, M se masculinoIdade: idade em anosAltura: altura metrosPeso: peso em quilogramaClasse social: baixa, média ou alta
Cada Característicaé chamada de
variável
Tipos de Dados
Variável
Classificação de variáveis
Variável
Qualitativa
Quantitativa
Nominal
Ordinal
Discreta
Contínua
• Característica que pode ser observada (ou mensurada) nos elementos da população, devendo ter um e apenas um resultado para cada elemento observado.
VariáveisQualitativas - O resultado da variável é um atributo ou umaqualidade.Exemplos: tipo de unidade de I/O,
tipo de microprocessador, grau de instrução do usuário do sistema, etc.
Quantitativas - O resultado é um número numa escala pré-determinada.Exemplos: quantidade de máquinas ligadas,
número de transações por segundo, tempo de resposta, etc.
Ordinais - Representam atributos de qualidadescom uma ordenação naturalExemplos: Classe social: A – alta, M – média, C – baixaEscolaridade: 1 – Primário 2 – Secundário 3 – Superior
Não Ordinais (Nominais) - Representam atributosde qualidades sem uma ordenação naturalExemplos:Sexo: F- feminino M – masculinoTurma na escola: A ou BCor: amarelo, branco, verde e azulHábito de fumar: Sim ou não
Variáveis Qualitativas
Variáveis QuantitativasDiscretas - Os resultados possíveis formam umalista finita (geralmente, números inteiros).
Exemplo: quantidade de máquinas ligadas.Contínuas - Teoricamente, existem infinitos re-sultados possíveis (um intervalo dos números reais)
Exemplo: tempo de resposta (em segundos).
HistogramasRepresentação gráfica de uma distribuição de freqüências por meio de retângulos justapostosO método mais útil para
descrever resultados obtidos com respeito a uma variável é, sem sombra de dúvida, a distribuição de freqüência.
f
012345678
122
127
132
137
142
147
152
157
162
167
172
177
182
187
192
f
Distribuição de Freqüências
poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior precisão;muitos intervalos: risco de não realçar os aspectos relevantes;def. da amplitude dos intervalos
Polígono de Freqüências Acumuladas
37,5% das pessoas medidas tem menosde 1,47 m
37,5% de 40 = 15facum(x) = 15; x=?
f . acum.
0
5
10
15
20
25
30
35
40
45
122
127
132
137
142
147
152
157
162
167
172
177
182
187
192
f. acum.
Fig.: Polígono de Freqüências Acumuladas
f
012345678
122
127
132
137
142
147
152
157
162
167
172
177
182
187
192
f
Fig.: Polígono de Freqüência
127=(134-130)/2
Exemplo usando variávelqualitativa ordinal
Grau de instrução do chefe da casa, numa amostra de 40 famí-lias do Conj. Resid. Monte Verde, Florianópolis, SC, 1988.
Códigos: 1 - nenhum grau de instrução completo2 - primeiro grau completo e3 - segundo grau completo
Resultados observados em cada família3 3 2 2 3 1 3 3 3 2 2 1 2 2 3 2 3 3 3 3
3 3 3 2 2 3 1 3 2 3 3 2 3 1 1 1 3 3 3 3
Distribuição de Freqüências doGrau de Instrução do chefe da casa
Primeiro grauSegundo grau
61123
15,027,557,5
Total 40 100,0
Grau de Instrução FrequênciaAbsoluta
FrequênciaRelativa (em %)
Nenhum grau
0 4 8 12 16 20 24
Gráfico de Barras
nenhum
primeiro grau
segundo grau
número de famílias
Grau de Instrução do Chefe da Casa
Gráfico em colunasGrau de instrução do chefe da casa
0
5
10
15
20
25
nenhum primeiro grau segundo grau
núm
ero
de fa
mília
s
Gráfico de Setor
Grau de Instrução do chefe da casanenhum (15,0 %)
primeiro grau(27,5 %)
segundo grau (57,5 %)
Total → 360Parte → x’
Numa rede de computadores, a quantidade de máquinas que costumam estar ligadas, por dia
20 26 21 21 20 21 23 22 24 2222 22 23 23 23 22 23 22 24 21
Exemplo usando variável quantitativa Discreta
Distribuição de FreqüênciasMáquinas
em uso20212223242526
Total
Freqüência(absoluta)
2465201
20
Freqüência(relativa)
0,10 (10%)0,20 (20%)0,30 (30%)0,25 (25%)0,10 (10%)
00,05 ( 5%)
1 (100%)
Gráfico de Hastes
Máquinas em uso
2
6
4
20 24 25 2621 22 23
Freq.
Exemplo usando variável quantitativa Contínua
Tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observações):
5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,15,5 6,2 4,9 5,7 6,3 5,1 8,4 6,28,9 7,3 5,4 4,8 5,6 6,8 5,0 6,78,2 7,1 4,9 5,0 8,2 9,9 5,4 5,65,7 6,2 4,9 5,1 6,0 4,7 18,1 5,34,9 5,0 5,7 6,3 6,0 6,8 7,3 6,96,5 5,9
Primeiro passo: Determinar a amplitude
4,7 18,1Amplitude é 18,1-4,7 = 13,4
5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,15,5 6,2 4,9 5,7 6,3 5,1 8,4 6,28,9 7,3 5,4 4,8 5,6 6,8 5,0 6,78,2 7,1 4,9 5,0 8,2 9,9 5,4 5,65,7 6,2 4,9 5,1 6,0 4,7 18,1 5,34,9 5,0 5,7 6,3 6,0 6,8 7,3 6,96,5 5,9
poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior explicação do comportamento;muitos intervalos: risco de não realçar os aspectos relevantes;
Segundo passo: Determinar a amplitude
Estimativa do númerode intervalos
707,750 ==== nk
92,1914,17/4,13 ====k
rangeh
Estimativa da amplitudede intervalos
Máquinas em uso
4.70 |-- 6.626.62 |-- 8.548.54 |-- 10.46
10.46 |-- 12.3812.38 |-- 14.3014.30 |-- 16.2216.22 |-- 18.14
Total
Freqüência(absoluta)
341230001
50
Freqüência(relativa)
0,68 (68%)0,24 (24%)0,06 (6%)
0 (0%)0 (0%)0 (0%)
0,02 ( 2%)1 (100%)
Distribuição de Freqüências
Histograma do tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observações).
0
5
101520
25
30
35
40
5,66 7,58 9,5 11,42 13,34 15,26 17,18
tempo (seg)
Freq
uenc
ia
Diagramas de DispersãoUm diagrama de dispersão serve para saber se existe alguma correlação (forte, fraca, moderada, positiva, negativa, etc.) entre duas variáveis.
Turbidez no Rio Capivari
0
20
40
60
80
100
4/1 20/2
12/4
29/5 5/7 28/8
16/10 5/1
2
Dia/95
Turb
idez
(UN
T) Turbidez antes dabacia
Turbidez depois dabacia
Limite legislação
Fig.: Gráfico de Controle
Gráfico de CurvasUsados em processos para se acompanhar a evolução de uma variável em relação a um ou mais limites existentes
ConsideraçõesDados Qualitativos → melhor visualização com gráfico de barras, colunas ou circulares (tipo torta);Variáveis Discretas (tipo número de filhos por casal) → é comum que utilizemos medidas intervalares para melhor codificá-las
→ gráfico de hastes (com enumeração natural) com freqüências ou freqüências acumuladas;
Variáveis contínuas → gráficos em forma de histograma e polígonos
de freqüência.
ConsideraçõesMuitas vezes precisamos relacionar as variáveis em estudo: diagramas de dispersão são aconselháveis;Gráficos setoriais, particularmente úteis para visualizar diferenças entre classes. Não acomodam grandes quantidades de categorias →reagrupar as menos importantes em um grupo chamado
outros ou, → utilizar um gráfico de barras, sendo que estas devem
vir separadas;O uso de polígonos de freqüência induz o leitor a aceitar a continuidade da variável apresentada.
ConsideraçõesOs gráficos tipo torta (setor) permitem uma visualização das partes em função do todo. Servem para enfatizar a importância de um setor (grupo, produto, etc.) frente a outrosAs séries cronológicas podem ser representadas por gráficos de: colunas, curvas e barras.As séries específicas e geográficas podem ser representadas por gráficos de: colunas, barras e setor.
MedidasDepois que você conheceu os conceitos de coleta de dados, variação, causas comuns e causas especiais, chegou a hora de estudarmos algumas formas de medir os resultados.
Para melhor interpretar os resultados obtidos com uma amostra, são definidas algumas medidas:
medidas de posição centralmedidas de posição medidas de dispersão.
Mostram a tendência dos pontos se concentrarem em torno de um determinado valor
Medidas de Tendência Central
Medidas de Tendência Central
Há várias medidas de tendência central. Entre elas citamos a média aritmética, a mediana, a média harmônica, geométrica, etc.
Cada uma dessas medidas apresenta vantagens e desvantagens, e a escolha depende dos objetivos desejados.
Média AritméticaA média aritmética, ou simplesmente média, de um
conjunto de n valores x1, ..., xn é definida como:
As letras gregas são usadas para representar parâmetros populacionais e as letras comuns parâmetros amostrais.
A média de uma amostra é representada por e média de uma população é representada pela letra grega µ.
X x xn n
xni
i
n=
+ +=
=∑1
1
1...
Exemplo: A média aritmética de 7,5 7,9 8,1 8,2 8,7 é
X =+ + + +
=7 5 7 9 8 1 8 2 8 7
58 08, , , , , ,
√
X
Média Aritmética para Dados AgrupadosÉ calculada quando a informação disponível é o
valor médio do intervalo i (Xi) e a freqüência do intervalo i (fi):
X f X f Xf f
f X
fK K
K
i i
K
ii
K=+ ++ +
=∑
∑=
1 1
11
i=1....
....
Exemplo
12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47
Considere os seguintes dados
X =+ + + + +
=3 13 8 14 15 15 13 16 9 17 2 18
5015 46( ) ( ) ( ) ( ) ( ) ( ) ,
Intervalos de classe Freqüência absoluta
12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2
Média Aritmética PonderadaAlgumas vezes associa-se a cada observação um peso Wi.
onde esse peso representa a importância atribuída a cada observação. Nesse caso a média ponderada é calculada como:
X w x w xw w
wn n
n
i ii=
+ ++ +
= =∑
∑1 1
1
1........
x
w
n
ii=1
n
Exemplo: O exame de seleção pode ser composto de três provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70 75 e 90 terá média final:
X =+ +
=1 70 1 75 2 90
481 25( ) ( ) ( ) ,
MedianaDado um conjunto de valores em ordem
crescente, a mediana é definida como:Se n é impar, o valor central;Se n é par, a média simples dos dois valores centrais.
ExemplosExemplo 1: Na amostra 25 26 26 28 30 a mediana é
Exemplo 2: Na amostra 71 73 74 75 77 79 a mediana é26~ =x
5,742
)7574(~ =+
=x
Mediana: dados agrupadosIntervalos de classe Freqüência absoluta12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2
Freqüência acumulada3
1126
4850
39
1. Calcula-se n/2 50/2=252. Identifica-se a classe da mediana terceira classe3. Utiliza-se a fórmula
mdMd f
hf2n
lMd×⎟⎠⎞
⎜⎝⎛ −
+=∑
lMd - limite inferior da classe M 14,51Σf - soma das freqüências anteriores 11 a classe da medianah – amplitude da classe da mediana 0,99fMd – freqüência da classe da mediana 15
ModaA moda é o valor que ocorre com maior
freqüência, ou seja, é o valor mais comum.Exemplos
Exemplo 1: A amostra 23 25 25 26 26 26 27 29 tem moda 26.
Exemplo 2: A amostra 71 73 73 75 76 77 77 79 81 tem moda 73 e 77.
A moda pode ser múltipla ou pode não existir.
Moda: Dados agrupados12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47
Considere os seguintes dados
Intervalos de classe Freqüência absoluta
12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2
hlMo ×Δ+Δ
Δ+=
21
1
l- limite inferior da classe Modal 14,51Δ1 – diferença entre a freqüência da classe modal e a freqüência anterior = 7Δ2 – diferença entre a freqüência da classe modal e a freqüência posterior = 2h – amplitude da classe modal =0,99
Relações Empíricas entre Média, Moda e MedianaPara distribuições simétricas a média, a mediana e a moda
coincidem aproximadamente.
Para distribuições assimétricas observa-se o seguinte:
ExemploA relação entre média e mediana para as amostras a seguir é
A Distribuição simétrica 10 12 14 16 18 14~ 14 === xx
B Distribuição assimétrica à direita 10 12 14 16 23 14~ 15 =>= xx
C Distribuição assimétrica à esquerda 05 12 14 16 18 14~ 13 =<= xx
Relações Empíricas entre Média, Moda e Mediana
Comparação entre Média, Moda e Mediana
Quão freqüente?Média: mais familiarMediana: usada comumenteModa: usada às vezes
ExistênciaMédia: existe sempre.Mediana: existe sempre.Moda: pode não existir; pode haver mais de uma moda
Afetada pelos extremos?Média: simMediana: nãoModa: não
Comparação entre Média, Moda e Mediana
Vantagens e desvantagens:Média: funciona bem com muitos métodos estatísticosMediana: costuma ser uma boa escolha se háalguns valores extremos.Moda: apropriada para dados ao nível nominal
Média Geométrica (G)É a raiz de ordem n do produto dos valores da
amostra:G X Xn
n= 1X2....
ExemploA média geométrica de 12 14 16 é:
É usada em administração e economia para achar taxas médias de variação, de crescimento, ou razões médias
G = × × =12 14 16 13 903 ,
Média Harmônica (H)É o inverso da média aritmética dos inversos
das observações.
ExemploA média harmônica de 12 14 16 é:
H
n X
n
Xi i
= =∑ ∑
11 1 1
81,13
161
141
121
3=
++=H
Relação entre Média Aritmética, Geométrica e Harmônica:
Exemplo: Para a amostra 12 14 16 tem-se
H = 13,81 < G = 13,90 <
H G X≤ ≤
00,14=X
A média geométrica e a média harmônica são menores, ou no máximo igual, à média aritmética. A igualdade só ocorre no caso em que todos os valores da amostra são idênticos. Quanto maior a variabilidade, maior será a diferença entre as médias harmônica e geométrica e a média aritmética.
Comparação Média Aritmética e Média Harmônica
O gráfico abaixo mostra uma simulação comparativa entre a Média Harmônica e a Média Aritmética, calculadas para cinco avaliações,onde as notas de quatro avaliações correspondem a 6,0 e a nota da 5ªavaliação varia de 0 a 10.
Medidas de DispersãoInvariavelmente as observações individuais irão
apresentar alguma dispersão em torno do valor médio. Isso é chamado de variabilidade ou dispersão dos dados.
Há muitas medidas de variabilidade, como por exemplo, a amplitude total, o desvio padrão, a amplitude inter-quartílica ou o coeficiente de variação.
Os valores mínimos e máximos também podem ser usados como medidas de variabilidade
Amplitude totalÉ definida como a diferença entre o maior e o menor valor
das observações.
Exemplo : 8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9A amplitude é total: R = 11,9 - 8,5 = 3,4
A amplitude é fácil de calcular e fornece uma idéia da magnitude da faixa de variação dos dados.
Não informa a respeito da dispersão dos valores que caem entre os dois extremos.
Desvio PadrãoPara uma amostra de n observações, x1, ..., xn , o
desvio padrão S é definido como:
A vantagem do desvio padrão é que trata-se de uma medida de variabilidade que leva em conta toda a informação contida na amostra.
O desvio-padrão de uma população é representado por σ e o desvio padrão de uma amostra por S.
( )1n
xx=S
2i
−−∑
Medidas de Dispersão
As medidas mais utilizadas para representar a dispersão é a VARIÂNCIA e o DESVIO PADRÃO.Uma dificuldade é que a variância não é expressa nas mesmas unidades dos dados originais.
Desvio PadrãoExemplo: para a amostra 10 12 14 16 18 A média é e o desvio-padrão é calculado:Os desvios de cada valor em relação à média
totalizam zero pois a média é o valor central:
14=x
16,31
2)1418(2)1416(2)1414(2)1412(2)1410(=
−−+−+−+−+−
=n
S
4141821416
014142141241410
+=−+=−
=−−=−−=−
Desvio Padrão: Dados agrupados
12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,2114,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,1315,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,7315,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,5216,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47
Considere os seguintes dados
Intervalos de classe Freqüência absoluta
12,50 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2
46,15=X
50)46.1518(2)46.1517(9)46.1516(13)15(15)46.1514(8)46.1513(3S
222222 −+−+−++−+−=
Ponto médio do intervalo
VariânciaA variância S2 é definida como o quadrado do
desvio padrão.
A variância de uma população é representada pela
letra grega σ2.
A variância é o quadrado do desvio padrão, ou seja,
σ2 =3,16 2 = 9,98
( )1n
xx=S
2i2
−−∑
Amplitude Inter-quartílicaÉ definida como a amplitude do intervalo entre o
primeiro e o terceiro quartis, ou seja:
Às vezes também é usada a semi-amplitude inter-quartílica, que é a metade da anterior.
Trata-se de uma medida de variabilidade bastante robusta, que é pouco afetada pela presença de dados atípicos.
A amplitude inter-quartílica guarda a seguinte relação aproximada com o desvio padrão:
Q = (4/3) x desvio padrão
Q Q Q= −3 1
Coeficiente de VariaçãoÉ definido como o quociente entre o desvio padrão e a
média e, em geral, é expresso em percentual.
O coeficiente de variação é uma medida dimensional, útil para comparar resultados de amostras ou populações cujas unidades podem ser diferentes.
Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a média é próxima de zero.
CV SX
= ×100
Medidas de Posição: QuartisTanto a média como o desvio padrão podem não ser medidas adequadas para representar dados, pois:
São afetadas por valores extremosApenas com estes dois valores não temos idéia da simetria ou assimetria da distribuição dos dados
Se um conjunto de dados é organizado em ordem crescente, o valor central é a mediana.Valores que dividem o conjunto em quatro partes iguais são
representados por Q1, Q2, Q3 e denominam-se primeiro, segundo e terceiro quartis, respectivamente.Q1 separa os 25% inferiores dos 75% dos superiores.Q2 é a mediana.Q3 separa os 75% inferiores dos 25% dos superiores.
Resumo dos cinco números: Q1, Q2, Q3 e os valores mínimo e máximo.
Relações1o quartil = 25o percentilMediana = 5o decil =50o percentil3o quartil = 75o percentil
Cálculo do k ésimo percentilOrdenar os dados do menor para o maiorCalcular:
L=(k/100)×nn=número de valoresk=percentil desejado
Se L não é inteiro: arredonde L para o próximointeiro acima dele. Pk é L-ésimo valor da listaordenada.
Quartis: Exemplo
x(i)12,312,713,013,113,313,313,513,814,114,514,917,2
i123456789
101113
Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:13,3 13,5 17,2 13,8 12,3 12,7 13,0
14,5 14,9 15,8 13,1 13,3 14,1
Exemplo: Quartis1o quartil = 25o percentil
L=(25/100)×13=3,25L=4P25=Q1=13,1
3o quartil = 75o percentilL=(75/100)×13=9,25L=10P25=Q3 =14,5
Percentis: Dados agrupadosPi
i ∈ 1,2,3,4,5,6,...,99,100lPi - limite inferior da classe de Pi
Σf - soma das freqüências anteriores a classede Pi
h – amplitude da classe de Pi
fPi – freqüência da classe Pi
i
iP
Pi f
hfni
lP×⎟⎠⎞
⎜⎝⎛ −×
+=∑100
Percentis: Exemplo com dados agrupados
Intervalos de classe Freqüência absoluta
12,51 a 13,50 313,51 a 14,50 814,51 a 15,50 1515,51 a 16,50 1316,51 a 17,50 917,51 a 18,50 2
1o quartil = 25o percentil
0,060,220,520,780,96
100,00
Freqüência absoluta
52,141,051,1415
01,111100
5025
51,1425 =+=×⎟⎠⎞
⎜⎝⎛ −
×
+=P
Variável Reduzida ou Padronizada
Ela mede a magnitude do desvio em relação à média, em unidades do desvio padrão.
Z = 1,5 significa uma observação desviada 1,5 desvios padrão para cima da média.
A variável reduzida é muito útil para comparar distribuições e detectar dados atípicos.
Dados são considerados atípicos quando Z > 3.
Z X XS
=−
O engenheiro está analisando as espessuras de peças fabricadas em duas máquinas de corte. O operador mediu uma peça da máq. A com espessura de 90 mm e outra peça da máq. B com espessura de 100 mm.engenheiro deve considerar esses dados reais ou atípicos?
25,312
5190=
−=
−=
SXXZMMááqq. A. A Como Z > 3
é dado atípico
A máq. A possui média 51mm e desvio-padrão de 12mm.
75,116
72100=
−=
−=
SXXZMMááqq. B. B Como Z < 3
não é dado atípico
A máq. B possui média 72mm e desvio-padrão de 16mm.
Exemplo
ExemploSupondo que 51 fosse a média em uma prova de inglês,
onde o desvio padrão é 12, para um candidato que obtivesse 90 acertos tem-se:
Conclui-se que na prova de inglês este candidatocandidato está 3,25 desvios-padrão acima da média.
25,312
5190=
−=
−=
SXXZ
Medidas de assimetria e curtoseAs características mais importantes são o grau de deformação ou assimetria e o grau de achatamento ou afilamento da curva de freqüências ou do histograma, chamado curtose.
Coeficiente = 0 (SimCoeficiente = 0 (Siméétrica)trica)Coeficiente > 0 (Assimetria positiva)Coeficiente > 0 (Assimetria positiva)Coeficiente < 0 (Assimetria negativa)Coeficiente < 0 (Assimetria negativa)
S1
Assimetria: skewnessskewness
Média=Mediana=Moda Moda < Mediana < Média Moda > Mediana> Média
Cálculo da assimetriaConhecido como primeiro coeficiente de assimetria de PearsonS: desvio padrão amostralMo: moda
: médiaAssimetria assume valores entre -1 e +1
SMoXSk −
=
X
Curtose: kurtosiskurtosis
a4 = m4/s4, onde m4 = Σ(X - )4/nx
aa44 = 3 (= 3 (MesocMesocúúrticartica))aa44 > 3 (> 3 (LeptocLeptocúúrticartica))aa44 < 3 (< 3 (PlatocPlatocúúrticartica))
Coeficiente de curtose de Pearson
A distribuição normal tem curtose igual a 3
Aspectos GeraisA estatística descritiva tem por objetivo resumir ou descrever características importantes de dados populacionais ou amostrais conhecidos;A inferência estatística tem por objetivo fazer generalizações sobre a população em estudo, a partir dos dados amostrais
Estimativa pontual da médiaUm estimador é uma estatística amostral (como a média amostral) utilizada para obter uma aproximação de um parâmetro populacional.Uma estimativa pontual é um valor (ou ponto) único usado para aproximar um parâmetro populacional.A média amostral é a melhor estimativa pontual para a média populacional.No entanto, não devemos esperar que a estimativa pontual coincida com o verdadeiro valor de um parâmetro.
Estimativa pontual da média da população μ
Quão boa é esta estimativa?
é uma estimativa de μ. x
∑=
=n
iix
1n1x
Seja (x1,...,xn) uma amostra de uma variável aleatória X.
Um problemaA maioria crê que a temperatura média do corpo humano é 98,6oF. Uma amostra de dados parece sugerir que a média é 98,2oF. Sabemos que as amostras tendem a variar, de forma que talvez a verdadeira temperatura média seja 98,6oF e a média amostral 98,2oF seja resultado de uma flutuação aleatória.Veremos se a temperatura média do corpo humano é ou não é 98,6oF. Dados do problema: n=106, S = 0,62oF e
20,98=x
Estimativa intervalar (Grandes amostras)
A probabilidade de que uma estimativa pontual coincida com o verdadeiro valor de um parâmetro populacional é pequena.A estimativa intervalar complementa a estimação pontual.Procuramos um intervalo em torno da estimativa pontual, que acompanhado de uma medida de variabilidade, tenha uma alta probabilidade de conter o verdadeiro valor do parâmetro.
Estimativa intervalar (Grandes amostras)
Assim, um intervalo de confiança (estimativa intervalar) representa uma amplitude de valores que tem probabilidade de conter o verdadeiro valor da população.Todo intervalo de confiança está associado a um grau de confiança. O grau de confiança (ou nível de confiança) é uma medida que representa a probabilidade do intervalo conter o parâmetro populacional. Tal probabilidade é chamada de 1- α.
Estimativa intervalar (Grandes amostras)
A construção do intervalo para μ é baseada na distribuição amostral da média amostral e no grau de confiança (1- α).Não é necessário que a suposição de normalidade para os dados seja adequada.
Estimativa intervalar: variância conhecida
Usando o teorema central do limite a média amostral éuma variável aleatória que tem distribuição normal com
Transformando em uma variável aleatória (VA) normal padrão temos:
As médias amostrais apresentam uma chance relativamente pequena de estar em uma das caudas da distribuição normal. α. é a probabilidade da média estar em uma das caudas.
nσMédia μ e Desvio padrão
X
X
)1,0(~/
Nn
XZσ
μ−=
Estimativa intervalar: variância conhecida
-zα/2 e zα/2 são os valores críticos em cada cauda.Um valor crítico é um número na fronteira em que o valor da estatística amostral tem pouca chance de ocorrer.
f(x)
zα/2
α/2α/2
-zα/2
1 - α
0
onde zα/2 é um valor tal que a área dacurva normal padronizada à sua direita é α/2
Nível de confiança
Estimativa intervalar: variância conhecida
Com os valores críticos -zα/2 e zα/2 e podemos definir os valores do intervalo de confiança para μ, tal que
Assim
o que equivale a:
2//2 n-Xz- αα ≤
σ
μ≤ z nXnz- 2//2 σμσ αα z+≤≤X
nσ
ασ
μαα −=⎟⎟
⎠
⎞⎜⎜⎝
⎛≤
−≤− 1
/ 2/2/ zn
XzP
Estimativa intervalar: variância conhecida
A margem de erro E é a diferença máxima provável (com probabilidade 1- α) entre a média observada (a média amostral) e a verdadeira média (média populacional).O erro máximo pode ser obtido da seguinte maneira
nzE σα 2/=
Estima-se a variância populacional σ2
através da variância amostral.
Usa-se para calcular o intervalo de confiança para μ (n > 30).
Estimativa intervalar: variância desconhecida
( )1n
xx=S
2i2
−−∑
nXnz- 2//2 SμS αα z+≤≤X
2SS =
Resposta do problema
Como o intervalo acima não contém 98,6oF, parece muito pouco provável que o valor correto de μ seja 98,6oF.Devemos rejeitar a hipótese comum de que a temperatura média do corpo é 98,6oF
12,010662,096,1961 ==
nS,E=
32,9808,9812,020,9812,020,98
≤≤−≤≤−
+≤≤−
μμ
μ ExEx
ExercíciosRegistram-se os valores 0,27; 0,26; 0,27; 0,33; e 0,32 em segundos, obtidos em cinco medições do tempo de fabricação de certo produto. Seja σ = 0,03. Determine intervalos de confiança com níveis de 95% e 99%, para o tempo real médio que se requer para fabricar o produtoUm prefeito de certa cidade turística deseja estimar a média de gastos para os turistas que visitam a cidade. Com este propósito, uma amostra aleatória de 120 turistas foi selecionada para a investigação e encontrou-se que a média foi igual a 800 u.m.(unidades de medidas) com desvio padrão de 200 u.m.
Achar o intervalo de confiança, a 99% para a média de gastos dos turistas com a cidade.Qual deve ser o tamanho mínimo da amostra para que, ao nível de confiança de 95%, o erro de estimação seja 20 u.m.
Um problemaUm fabricante de latas deseja diminuir a espessura das latas a fim de reduzir o custo delas.Usualmente a espessura é de 0,0282 cm mas o fabricante está testando latas de 0,0278 cm. A carga axial de uma lata é o peso máximo suportado por seus lados. Isto é medido através de uma placa seus lados.É importante temos uma carga axial suficientemente grande a fim de a lata não ceder quando se coloca a tampa.
As latas de alumínio podem ter menor espessura para reduzir o custo?
Testes de Hipóteses para Grandes Amostrasσ1 e σ2 conhecidos.
H0: μ1 - μ2 ≥ 0
Ha: μ1 - μ2 < 0
H0: μ1 - μ2 ≤ 0
Ha: μ1 - μ2 > 0
Testes Unilaterais
Testes BilateralH0: μ1 - μ2 = 0
Ha: μ1 - μ2 ≠ 0
Se são σ1 e σ2 desconhecidos use s1 e s2 (desvio padrãoamostral) no lugar de σ1 e σ2
Teste de hipóteses (unilateral)
⎟⎟⎠
⎞⎜⎜⎝
⎛+−=−
2
22
1
21
2121 ,nn
NXXd σσμμ
μ1 - μ2 = 0
2
22
1
21
nnσσ
+
H0: μ1 - μ2 ≥ 0
Ha: μ1 - μ2 < 0
Teste de hipóteses (unilateral)
(1- α) = 0,95
α = 0,05
Rejeitar H0 Não rejeitar H0
H0: μ1 - μ2 ≥ 0
Ha: μ1 - μ2 < 0
2
22
1
21
2/ nnz σσα +
μ1 - μ2 =0
Teste de hipótese unilateral
2
22
1
21
21 )(
nn
xxzσσ
+
−=
0
(1- α) = 0,95
α = 0,05P(Z≤z)=0,05
-1,64
Rejeitar H0 Não rejeitar H0
Rejeitar H0 se
Convertendo para normal padrão21 XX −
Estatísticado teste
H0: μ1 - μ2 ≥ 0
Ha: μ1 - μ2 < 0
64,1)(
2
22
1
21
21 −≤
+
−=
nn
xxzσσ
Teste de hipóteses (unilateral)H0: μ1 - μ2 ≤ 0
Ha: μ1 - μ2 > 0
⎟⎟⎠
⎞⎜⎜⎝
⎛+−=−
2
22
1
21
2121 ,nn
NXXd σσμμ
μ1 - μ2 =0
2
22
1
21
nnσσ
+
Teste de hipóteses (unilateral)
(1- α) = 0,95
RejeitarH0
Não rejeitar H0
α = 005
H0: μ1 - μ2 ≤ 0
Ha: μ1 - μ2 > 0
μ1 - μ2=0
2
22
1
21
2/ nnz σσα +
Teste de hipóteses (unilateral)
P(Z≤z)=0,05
Rejeitar H0 se
Convertendo para normal padrãoX
0
(1- α) = 0,95
RejeitarH0
Não rejeitar H0
α = 0,05
Estatísticado teste
H0: μ1 - μ2 ≤ 0
Ha: μ1 - μ2 > 0
2
22
1
21
nnσσ
+
21 )( xxz −=
64,1)(
2
22
1
21
21 ≥
+
−=
nn
xxzσσ
1,64
Teste de hipóteses (bilateral)H0: μ1 - μ2 = 0
Ha: μ1 - μ2 ≠ 0
⎟⎟⎠
⎞⎜⎜⎝
⎛+−=−
2
22
1
21
2121 ,nn
NXXd σσμμ
μ1 - μ2 =0
Teste de hipóteses (bilateral)
α /2 = 0,025 α/2 = 0,0,25
0,4521- α = 0,95
RejeitarH0
Não rejeitar H0RejeitarH0
H0: μ1 - μ2 = 0
Ha: μ1 - μ2 ≠ 0
μ1 - μ2=0
2
22
1
21
2/ nnz σσα +
P(Z≤z)=0,05
Convertendo para normal padrão
Teste de hipóteses (bilateral)
X
α /2 = 0,025 α /2 = 0,0,25
0,452
0
1-α = 0,95
96,196,1−RejeitarH0
Não rejeitarH0
RejeitarH0
Rejeitar H0 se ou
Estatísticado teste
H0: μ1 - μ2 = 0
Ha: μ1 - μ2 ≠ 0
2
22
1
21
21 )(
nn
xxzσσ
+
−=
96.1)(
2
22
1
21
21 −≤
+
−=
nn
xxzσσ
96.1)(
2
22
1
21
21 ≥
+
−=
nn
xxzσσ
Estatística do teste
Usar a tabela t-Student e o número de graus de liberdade é o menor dentre valor entre n1-1 ou n2 -1.
Testes de Hipóteses para Grandes Amostrasσ1 e σ2 desconhecidos e desiguais.
2
22
1
21
21 )(
ns
ns
xxz+
−=
Teste de hipóteses: procedimento geral
1. Identifique o parâmetro de interesse no problema. Neste caso é μ.2. Formule a hipótese nula (H0)3. Formule uma hipótese alternativa apropriada (Ha)4. Defina o nível de significância5. Estabeleça a estatística usando
a distribuição normal quando as variâncias populacionais são conhecidasoua distribuição t-Student quando as variâncias são estimadas.
6. Estabeleça a região de rejeição usando o nível de significância7. Coletar os dados amostrais e calcular a estatística do teste8. Decida se H0 deve ou não ser rejeitada e transponha esta conclusão para o
contexto do problema
Resposta do problema
2
22
1
21
21 )(
ns
ns
xxt
+
−=
H0: μ1 - μ2 ≥ 0
Ha: μ1 - μ2 < 0
μ1 - carga axial média das latas com espessura 0,0278 μ2 - carga axial média das latas com espessura 0,0282
Estatísticado teste
α = 0,05Nível de significância do teste
0-1,64
Rejeitar H0 Não rejeitar H0
Região de rejeição
Hipóteses
Resposta do problemaDados da amostra 1 (carga das lata com espessura
0,0278):
Dados da amostra 2 (carga das lata com espessura 0,0282):
Estatística do teste
Como tα/2 = -1,64 (174 graus de liberdade) existe uma forte evidência para apoiar a afirmação que as latas de 0,0278 cm têm carga axial média inferior à das latas de 0,0282 cm
48,5
1758,27
1751,22
)8,2811,267()(
2
22
1
21
21 −=+
−=
+
−=
ns
ns
xxt
1,221751,267 111 === snx
8,2717580,281 111 === snx
Introdução
Estudar a relação entre duas variáveis quantitativas
Exemplos
Idade e altura das criançasTempo de prática de esportes e ritmo cardíacoTempo de estudo e nota na provaTaxa de desemprego e taxa de criminalidadeExpectativa de vida e taxa de analfabetismo
Estudo da relação entre variáveis
Investigar a presença ou ausência de relação linear sob dois pontos de vista:
a) Quantificando a força dessa relação: correlaçãob) Explicitando a forma dessa relação: regressão
Diagrama de dispersão: representação gráfica das duas variáveis quantitativas
Exemplo 1: nota na prova etempo de estudo
X : tempo de estudo (em horas)Y : nota na prova
Pares de observações (Xi , Yi)Tempo Nota
3,0 4,57,0 6,52,0 3,71,5 4,0
12,0 9,3
Diagrama de dispersão: forte associação positiva
Diagrama de dispersão: forte associação negativa
Coeficiente de correlação linear
O coeficiente de correlação linear é definido como:
Correlação LinearCorrelação entre duas variáveis quando uma delas está, de alguma forma, relacionada coma a outra.Suposições para medir a correlação:
Dados emparelhadosPares de dados terem distribuição normal bivariada .
Correlação linear mede o grua de relacionamento linear entre os valores emparelhados x e y em uma amostra.
Propriedades do coeficientede correlação linear
Propriedade:-1 ≤ r ≤ 1
Classificação da correlação:r = 1, correlação linear positiva e perfeitar = -1, correlação linear negativa e perfeitar = 0, inexistência de correlação linear
Os valores de r não varia se todos os valores de qualaquer uma das variáveis são convertidos para uma escala diferente.
O valor de r não é afetado pela escolha de x e y. Permutando todos valores de x e y o valor de r permanece o mesmo.
Diagrama de dispersão
Exemplo para r = 1
Diagrama de dispersão
Exemplo para r = -1
Diagrama de dispersão
Exemplo para 0 < r < 1
Diagrama de dispersão
Exemplo para -1 < r < 0
Diagrama de dispersão
Exemplo para r = 0
Diagrama de dispersão
Correlação não linear
Exemplo 2: criminalidadee analfabetismo
Considere as duas variáveis abaixo observadas em 50 estados norte-americanos. (vide dados)
Y: taxa de criminalidadeX: taxa de analfabetismo
Na figura a seguir, temos o diagrama de dispersão de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a taxa de criminalidade tende a aumentar. Nota-se também uma tendência linear.
Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-751 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 52 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.93 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.54 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.35 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.26 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.77 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.98 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.19 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4
10 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.411 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.412 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.213 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.114 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.415 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.616 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.717 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 1118 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.219 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.520 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.521 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.522 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.323 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.724 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 325 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9
Exemplo 2: diagrama de dispersão
28
Exemplo 2: cálculo da correlaçãomédia de Y = 7,38 e SY = 3,692média de X = 1,17 e SX = 0,609somatório de XiYi = 509,12Cálculo da correlação entre X e Y:
Exemplo 3: expectativa devida e analfabetismo
Considere as duas variáveis abaixo observadas em 50 estados norte-americanos. (vide dados)
Y: expectativa de vidaX: taxa de analfabetismo
Na figura a seguir, temos o diagrama de dispersão de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a expectativa de vida tende a diminuir. Nota-se também uma tendência linear.
Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-751 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 52 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.93 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.54 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.35 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.26 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.77 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.98 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.19 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4
10 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.411 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.412 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.213 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.114 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.415 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.616 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.717 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 1118 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.219 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.520 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.521 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.522 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.323 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.724 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 325 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9
Exemplo 3: diagrama de dispersão
11
28
Exemplo 3: cálculo da correlaçãomédia de Y = 70,88 e SY = 1,342média de X = 1,17 e SX = 0,609somatório de XiYi = 4122,8Cálculo da correlação entre X e Y:
Exercício: Calcular a correlação
Temperatura Consumo16 29031 37438 39339 42537 40636 37036 36522 32010 269
Modelo de RegressãoEstima ou prevê uma variável aleatória como uma função de outras variáveis aleatórias
Y, variável resposta, variável dependente
X, variável preditores, variáveis independentes
Y= f(X)
Equação de Regressão Linear
xbby 10ˆ +=
b0 e b1: parâmetros de regressão determinados a partir dos dados, (x1, y1), ..., (xn, yn).
Regressão Linear
SuposiçõesEstamos investigando apenas relações lineares.Para cada par (x,y) é uma variável com distribuição normal. Todas as distribuições de y tem a mesma variância.
Interpretação de b1
Para cada aumento de uma unidade em X, temos um aumento de b unidades em Y.
b0
θ
x x+1
∆x=1
∆y b0 : interceptob1 : inclinação da reta
Significado dos parametros b0 e b1
ii xbby 10ˆ +=
Determinando os parâmetros
yye iii−= Erro
y Valor observado da variável aleatória dependente
y Valor estimado da variável aleatória dependente
ii xy 10 ββ += ii xbby 10ˆ +=
Método dos Minímos Quadrados
−==
==n
1i
2n
1i
2i )iyiy(eSSE min
Minimização da soma dos quadrados devido ao erro
Resíduos
Os parâmetros b0 e b1
−
−=
−=
221
10
)(xnx
yxnyxb
xbyb
i
ii
Os parâmetros b0 e b1
Onde
xi = é o valor da variável independente para a i-ésima observação
yi = é o valor da variável dependente para a i-ésima observação
=x é a média da variável independente
=y é a média da variável independente
n = número de observaçãoes
Exemplo 4: dados amostrais
Temperatura Consumo16 29031 37438 39339 42537 40636 37036 36522 32010 269
Coeficiente de correlação e a reta ajustada
A correlação entre X e Y é r = 0,962.
A reta ajustada para este exemplo é:
ExercícioQual o consumo previsto para uma temperatura de 25ºC?