gabarito introdução quimiometria 2012 2 caps 7-10
DESCRIPTION
QuimiometriaTRANSCRIPT
Universidade do Estado do Rio de Janeiro
Dept. de Química Analítica – Introdução à Quimiometria – Prof. M.Sc. Igor Lima – 2012/1
Gabarito das listas de exercícios referentes aos caps. 7-10 do livro do Levine.
7.4) Uma amostra aleatória simples seria menos prático para entrevistas pessoais por causa de
custos de viagem (a menos que os entrevistados sejam pagos para assistir a uma entrevista
localização central).
7.5) Esta é uma amostra aleatória, pois a seleção é baseada no acaso. Não é uma amostra
aleatória simples porque A é mais provável de ser selecionado do que B ou C.
7.11)
a) Possível erro de cobertura: somente funcionários em uma divisão específica da empresa
foram amostrados.
b) Possível erro por falta de resposta: Nenhuma tentativa é feita para entrar em contato com
os entevistados para completar a avaliação da satisfação no trabalho.
c) Possível erro de amostragem possível: as estatísticas obtidas a partir da amostra não serão
iguais às dos parâmetros de interesse na população.
d) Possível erro de medição: formulação ambígua em questões colocadas no questionário.
7.18)
√
a) ( ) ( ) virtualmente zero
b) P(47 < < 49,5) = P(-6,00 < Z < -1,00) = 0,1587 – 0,00 = 0,1587
c) P( > 51,1) = P(Z> 2,20) = 1,0 – 0,9861 = 0,0139
d) P( > A) = P(Z > 0,39) = 0,35 =50 + 0,39(0,5) = 50,195
7.23)
√ = 2/ raiz(25)=0,4
a) P(7,8 < <8,2) = P(-,50 < Z < 0,50) = 0,6915 – 0,3085 = 0,3830
b) P(7,5 < <8,0) = P(-,50 < Z < 0,50) =0.5 – 0,1056 = 0,3944
c) P(7,8 < < ) = P(-1,00 < < 1,00) = 0,8413 – 0,1587 = 0,6826
d) Com o aumento do tamanho da amostra (de n = 25 para n = 100), a distribuição tende a se
apoximar da normal. O erro padrão da distribuição de tamanho de amostragem de 100 é
muito menor do que a do tamanho 25, de modo que a probabilidade de que a média da
amostra irá cair dentro de 0,2 minutos do meio é muito mais elevada para as amostras de
tamanho 100 (probabilidade = 0, 6826) do que para as amostras de tamanho 25 (probabilidade
= 0,3830).
7.31) z=(p-π)/raiz(π(1- π)/n) z =(0,6-0,5)/RAIZ((0,5*(1-0,5))/200)
a) P(0,50 < p < 0,60) = P(0<Z<2,83) = 0,4977
b) P(-1,645<Z<1,645)=0,90
p=0,50 – 1,645(0,0354)=0,4418 p=0,50 + 1,645(0,0354)=0,5582
c) P(p>0,65)=P(Z>4,24)= zero
d) Se n=200, P(p>0,60) = P(Z> 2,83)=1,0-0,9977=0,0023
Se n=1000, P(p>0,55)=P(Z>3,16)=1,0 – 0,99921=0,000799
Mais de 60% certo em uma amostra de 200 é mais provável do que que 55% certo em uma
amostra de 1000.
8.8)
a)
√ = 350±1,96*(100/raiz(64))= 350±24,5
b) Não. O fabricante não pode apoiar uma afirmação de que as lâmpadas durarão uma média
de 400 horas. Com base em dados a partir da amostra, uma média de 400 horas, representaria
uma distância de 4 desvios padrão acima da média da amostra de 350 horas.
c) Não. Uma vez que é conhecido e n=64, de acordo com o TLC, nós podemos assumir que a
distribuição da amostragem é aproximadamente normal.
d) Um desvio de 0,2 unidades na média das amostras desloca o intervalo de confiança pela
mesma distância sem afetar a largura do intervalo final:
a) 350±1,96*(80/raiz(64))= 350±19,6
b) Uma média de 400 horas deveria representar uma distância de 5 dp acima da média
de 350 horas. Não, o fabricante não pode apoiar uma afirmação de que as lâmpadas têm uma
vida média de 400 horas.
8.22)
a)
√ = 226,6667 ± 2,2010*(133,2519/raiz(12)) = 226,6667 ± 84,66479
b) A distribuição da população precisa seguir os moldes da distribuição normal.
c) O gráfico tem que converter em escore z.
8.27)
a)
= 330/500 = 0,66 ou 66% ------- intervalo de confiança: √
( )
= 0,66 ±
1,96*(raiz(0,66*(1-0,66)/500)) = 0,66 ± 0,041522
b) Você pode ter 95% de certeza de que a proporção da população de mulheres altamente
qualificadas que abandonaram carreiras por razões familiares que querem voltar a trabalhar
está entre 0,62 e 0,70.
8.45) ( )
a) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,06)^2=141,74 n=142
b) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,04)^2=318,91 n=319
c) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,02)^2=1275,66 n=1276
8.52) √ ( )
√
a) 0,04 + 1,2816*RAIZ((0,04*(1-0,04))/300)* RAIZ((5000-300)/(5000-1))
b) 0,04 + 1,645*...
c) 0,04 + 2,3263*...
8.76)
a)
√ = 38,54 ± 2,0010 * 7,26/raiz(60) = [36,66 – 40,42] t=n-1=60-1=59, logo
𝛼=0,025 e gl=59: t=2,0010
b) √ ( )
= 18/60±1,645*raiz((0,30*(1-0,30))/60) = 0,30 ±0,09732
c)
= ((1,96)^2*(8)^2/(1,5)^2) = 109,27 110
d) ( )
= (((1,645)^2)*(0,5)*(0,5))/(0,04)^2) = 422,82 423
e) Se uma única amostra venha a ser selecionada ambos os propósito, utilize o maior dos dois
tamanhos de amostras (n=423).
9.15)
a) Um erro de I Tipo é o erro de aprovar uma droga insegura. Um erro Tipo II seria não aprovar
uma droga segura.
b) Os grupos de consumidores estão tentando evitar um erro do Tipo I.
c) Os lobistas da indústria estão tentando evitar um erro do Tipo II.
d) Para reduzir tanto os erros do tipo I e do tipo II, a FDA pode exigir mais informações e
provas sob a forma de testes mais rigorosos. Isso pode facilmente traduzir-se em mais tempo
para aprovar uma nova droga.
9.31)
a) H0: 2,00 L. A quantidade média de refrigerante colocado em garrafas de 2 litros na unidade
local de engarrafamento é igual a 2 litros.
H1: 2,00 L. A quantidade média de refrigerante colocado em garrafas de 2 litros na unidade
local de engarrafamento é diferente de 2 litros.
Regra de decisão: rejeitar H0 se Z<-1,96 ou Z>1,96.
√ ⁄
= (1,99 – 2,00)/(0,05/raiz(100)) = -2,00
Como Zcalc=-2,00 e o limite crítico é -1,96; há evidência de que a quantidade média é diferente
de 2L.
b) p-valor = 2*(0,228) = 0,0456 0,0228 (vem da tabela E.2, no z=-2,00)
A probabilidade de obter uma amostra de 100 garrafas que irão produzir uma quantidade
média que está mais longe da média da população hipotética é de 0,0456.
c)
√ = 1,99 ± 1,96* 0,05/raiz(100) = [1,9802; 1,9998]
d) Os resultados aqui são os mesmos. O IC formado não inclui 2,00.
9.45) H0: ≥ 25 min e H1: < 25 min.
a) Regra de decisão: se z < -1,645, rejeitar H0
√ ⁄
= (22,4 – 25)/(6/raiz(36)) = -2,60
Decisão: sendo z=-2,6 e menor do que -1,645, rejeitar H0. há evidências suficientes para
concluir a média da população o tempo de entrega foi reduzido abaixo do valor anterior de 25
minutos.
b) regra de decisão: se p-valor < 0,05, rejeitar H0.
p-valor = 0,0047 (ver tabela E.2 em z=-2,60)
Decisão: sendo p-valor menor que alfa, rejeitar H0. há evidências suficientes para concluir a
média da população o tempo de entrega foi reduzido abaixo do valor anterior de 25 minutos.
c) A probabilidade de obter uma amostra cuja média é 22,4 minutos ou menos quando a
hipótese nula é verdadeira é 0,0047.
d) As conclusões são as mesmas.
9.58) H0: =35 e H1: 35
(OBS: para encontrar o p-valor usando a tabela t, cruzar o número de graus de liberdade nas
linhas contra a significância nas colunas. Entretanto, isso dará um intervalo onde o p-valor
cairá. Logo, usar o Excel pra ter o valor exato)
a) regra de decisão: rejeitar hipótese nula se |t| >2,5706 g.l. = 5, =0,025 (corresponde à
cauda superior)
√ ⁄
=36,53 – 35 / 4,3896/raiz(6) = 0,8556
Decisão: sendo tcalc<tcrit, não rejeitar H0.
b) O p-valor é 0,4313. =distt(abs(tcalc;gl;bicaudal) =distt(abs(0,8556;5;2))
c) a distribuição dos preços é normalmente distribuída.
d) como n é pequeno, é difícil avaliar a normalidade. Mas se a média e a mediana estão
próximas, a distribuição pode ser simétrica.
9.71)
a) H0: π≤35 e H1: π> 35
regra de decisão: se z> 1,645, rejeitar H0:
√ ( ) ⁄
= 0,82 – 0,78/raiz ((0,78*(1-0,78))/50) = 0,6829
Logo, como zcalc < zcrit, não rejeitar H0:
b)
√ ( ) ⁄
= 0,82 – 0,78/raiz ((0,78*(1-0,78))/50) = 0,6829
p-valor: 0,2474
como p-valor é maior que 𝛼 = 0,05, não rejeitar H0.
c)
√ ( ) ⁄
= 0,82 – 0,78/raiz ((0,78*(1-0,78))/1000) = 3,0535
como zcalc está acima de zcrit, rejeitar H0.
Já utilizando o p-valor:
P=valor de z=3,0535 = 0,0011. Como ele é menor que alfa, rejeitar H0.
d) uma amostra de tamanho maior reduz o erro padrão da proporção da amostra e assim,
reduz o p-valor e torna mais fácil rejeitar H0 mantendo todo o resto constante.
10.28) (OBS: no excel: Análise de dados/teste t pareado para duas amostras)
H0: D≤0 e H1: πD> 0
Teste-t: duas amostras em par para médias
Antes Depois
Média 312,1428571 226
Variância 15513,14286 4971
Observações 7 7
Correlação de Pearson 0,29506899 Hipótese da diferença de média 0 gl 6 Stat t 1,842455029 P(T<=t) uni-caudal 0,057493133 t crítico uni-caudal 1,943180274 P(T<=t) bi-caudal 0,114986267 t crítico bi-caudal 2,446911846
Teste t:
√ ⁄
= 1,8425
a) como tcalc < tcrit (1,943), não rejeitar H0.
b) P-valor = 0,0575 - =distt(abs(1,8425;6;1)) a probabilidade de que a estatística t para a
diferença seja 1,8425 ou maior é de 5,75%, caso média da densidade não seja maior antes do
transplante do que depois.
c)
√ = 86,1429 ± 2,4469*(123,7005)/raiz(7) = [-28,26; 200,55]
10.35)
a) H0: π1=π2 e H1: π1π2
regra de decisão: se z<-19,6 ou >1,96, rejeitar H0.
( ) ( )
√ ( )(
)
= (0,0419 – 0,3103) – 0 / raiz(0,111*(1-0,111)*(1/34+1/116) = -7,9254
Como zcalc < zcrit, rejeitar H0.
b) p-valor é zero, quando a hipótese nula é verdadeira.
c) (p1-p2)±z*(raiz((p1*(1-p1))/n1 + p2*(1-p2)/n2) = -
0,2684±1,96*raiz(((0,0419*0,9581)/334)+(0,3103*0,6897)/116)) = -0,3553 ≤ π1 - π2 ≤ -0,1815
d) há uma diferença significativa na proporção de placas boas e ruins que contém partículas.
10.50)
a) H0: =
as variâncias das populações são iguais
H1:
as variâncias das populações são diferentes
Regra de decisão: Se F<0,653 ou > 1,556, rejeitar H0.
= ((13,35)^2) /((9,42)^2) = 2,008
Como Fcalc é maior que Fcrit, rejeitar H0.
b) p-valor = 0,002207 =SE(2,008>1;2*(DISTF(2,008;99;71));2*(1-(2*(DISTF(2,008;99;71)))))
c) O teste assume que as duas populações estão distribuídas de acordo com a gaussiana
d) baseado em a e b, um teste t separado de variância deve ser usado.