gabarito introdução quimiometria 2012 2 caps 7-10

Universidade do Estado do Rio de Janeiro

Dept. de Química Analítica – Introdução à Quimiometria – Prof. M.Sc. Igor Lima – 2012/1

Gabarito das listas de exercícios referentes aos caps. 7-10 do livro do Levine.

7.4) Uma amostra aleatória simples seria menos prático para entrevistas pessoais por causa de

custos de viagem (a menos que os entrevistados sejam pagos para assistir a uma entrevista

localização central).

7.5) Esta é uma amostra aleatória, pois a seleção é baseada no acaso. Não é uma amostra

aleatória simples porque A é mais provável de ser selecionado do que B ou C.

7.11)

a) Possível erro de cobertura: somente funcionários em uma divisão específica da empresa

foram amostrados.

b) Possível erro por falta de resposta: Nenhuma tentativa é feita para entrar em contato com

os entevistados para completar a avaliação da satisfação no trabalho.

c) Possível erro de amostragem possível: as estatísticas obtidas a partir da amostra não serão

iguais às dos parâmetros de interesse na população.

d) Possível erro de medição: formulação ambígua em questões colocadas no questionário.

7.18)

√

a) ( ) ( ) virtualmente zero

b) P(47 < < 49,5) = P(-6,00 < Z < -1,00) = 0,1587 – 0,00 = 0,1587

c) P( > 51,1) = P(Z> 2,20) = 1,0 – 0,9861 = 0,0139

d) P( > A) = P(Z > 0,39) = 0,35 =50 + 0,39(0,5) = 50,195

7.23)

√ = 2/ raiz(25)=0,4

a) P(7,8 < <8,2) = P(-,50 < Z < 0,50) = 0,6915 – 0,3085 = 0,3830

b) P(7,5 < <8,0) = P(-,50 < Z < 0,50) =0.5 – 0,1056 = 0,3944

c) P(7,8 < < ) = P(-1,00 < < 1,00) = 0,8413 – 0,1587 = 0,6826

d) Com o aumento do tamanho da amostra (de n = 25 para n = 100), a distribuição tende a se

apoximar da normal. O erro padrão da distribuição de tamanho de amostragem de 100 é

muito menor do que a do tamanho 25, de modo que a probabilidade de que a média da

amostra irá cair dentro de 0,2 minutos do meio é muito mais elevada para as amostras de

tamanho 100 (probabilidade = 0, 6826) do que para as amostras de tamanho 25 (probabilidade

= 0,3830).

7.31) z=(p-π)/raiz(π(1- π)/n) z =(0,6-0,5)/RAIZ((0,5*(1-0,5))/200)

a) P(0,50 < p < 0,60) = P(0<Z<2,83) = 0,4977

b) P(-1,645<Z<1,645)=0,90

p=0,50 – 1,645(0,0354)=0,4418 p=0,50 + 1,645(0,0354)=0,5582

c) P(p>0,65)=P(Z>4,24)= zero

d) Se n=200, P(p>0,60) = P(Z> 2,83)=1,0-0,9977=0,0023

Se n=1000, P(p>0,55)=P(Z>3,16)=1,0 – 0,99921=0,000799

Mais de 60% certo em uma amostra de 200 é mais provável do que que 55% certo em uma

amostra de 1000.

8.8)

a)

√ = 350±1,96*(100/raiz(64))= 350±24,5

b) Não. O fabricante não pode apoiar uma afirmação de que as lâmpadas durarão uma média

de 400 horas. Com base em dados a partir da amostra, uma média de 400 horas, representaria

uma distância de 4 desvios padrão acima da média da amostra de 350 horas.

c) Não. Uma vez que é conhecido e n=64, de acordo com o TLC, nós podemos assumir que a

distribuição da amostragem é aproximadamente normal.

d) Um desvio de 0,2 unidades na média das amostras desloca o intervalo de confiança pela

mesma distância sem afetar a largura do intervalo final:

a) 350±1,96*(80/raiz(64))= 350±19,6

b) Uma média de 400 horas deveria representar uma distância de 5 dp acima da média

de 350 horas. Não, o fabricante não pode apoiar uma afirmação de que as lâmpadas têm uma

vida média de 400 horas.

8.22)

a)

√ = 226,6667 ± 2,2010*(133,2519/raiz(12)) = 226,6667 ± 84,66479

b) A distribuição da população precisa seguir os moldes da distribuição normal.

c) O gráfico tem que converter em escore z.

8.27)

a)

= 330/500 = 0,66 ou 66% ------- intervalo de confiança: √

( )

= 0,66 ±

1,96*(raiz(0,66*(1-0,66)/500)) = 0,66 ± 0,041522

b) Você pode ter 95% de certeza de que a proporção da população de mulheres altamente

qualificadas que abandonaram carreiras por razões familiares que querem voltar a trabalhar

está entre 0,62 e 0,70.

8.45) ( )

a) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,06)^2=141,74 n=142

b) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,04)^2=318,91 n=319

c) n=((1,96)^2*(0,1577)*(1-0,1577))/(0,02)^2=1275,66 n=1276

8.52) √ ( )

√

a) 0,04 + 1,2816*RAIZ((0,04*(1-0,04))/300)* RAIZ((5000-300)/(5000-1))

b) 0,04 + 1,645*...

c) 0,04 + 2,3263*...

8.76)

a)

√ = 38,54 ± 2,0010 * 7,26/raiz(60) = [36,66 – 40,42] t=n-1=60-1=59, logo

𝛼=0,025 e gl=59: t=2,0010

b) √ ( )

= 18/60±1,645*raiz((0,30*(1-0,30))/60) = 0,30 ±0,09732

c)

= ((1,96)^2*(8)^2/(1,5)^2) = 109,27 110

d) ( )

= (((1,645)^2)*(0,5)*(0,5))/(0,04)^2) = 422,82 423

e) Se uma única amostra venha a ser selecionada ambos os propósito, utilize o maior dos dois

tamanhos de amostras (n=423).

9.15)

a) Um erro de I Tipo é o erro de aprovar uma droga insegura. Um erro Tipo II seria não aprovar

uma droga segura.

b) Os grupos de consumidores estão tentando evitar um erro do Tipo I.

c) Os lobistas da indústria estão tentando evitar um erro do Tipo II.

d) Para reduzir tanto os erros do tipo I e do tipo II, a FDA pode exigir mais informações e

provas sob a forma de testes mais rigorosos. Isso pode facilmente traduzir-se em mais tempo

para aprovar uma nova droga.

9.31)

a) H0: 2,00 L. A quantidade média de refrigerante colocado em garrafas de 2 litros na unidade

local de engarrafamento é igual a 2 litros.

H1: 2,00 L. A quantidade média de refrigerante colocado em garrafas de 2 litros na unidade

local de engarrafamento é diferente de 2 litros.

Regra de decisão: rejeitar H0 se Z<-1,96 ou Z>1,96.

√ ⁄

= (1,99 – 2,00)/(0,05/raiz(100)) = -2,00

Como Zcalc=-2,00 e o limite crítico é -1,96; há evidência de que a quantidade média é diferente

de 2L.

b) p-valor = 2*(0,228) = 0,0456 0,0228 (vem da tabela E.2, no z=-2,00)

A probabilidade de obter uma amostra de 100 garrafas que irão produzir uma quantidade

média que está mais longe da média da população hipotética é de 0,0456.

c)

√ = 1,99 ± 1,96* 0,05/raiz(100) = [1,9802; 1,9998]

d) Os resultados aqui são os mesmos. O IC formado não inclui 2,00.

9.45) H0: ≥ 25 min e H1: < 25 min.

a) Regra de decisão: se z < -1,645, rejeitar H0

√ ⁄

= (22,4 – 25)/(6/raiz(36)) = -2,60

Decisão: sendo z=-2,6 e menor do que -1,645, rejeitar H0. há evidências suficientes para

concluir a média da população o tempo de entrega foi reduzido abaixo do valor anterior de 25

minutos.

b) regra de decisão: se p-valor < 0,05, rejeitar H0.

p-valor = 0,0047 (ver tabela E.2 em z=-2,60)

Decisão: sendo p-valor menor que alfa, rejeitar H0. há evidências suficientes para concluir a

média da população o tempo de entrega foi reduzido abaixo do valor anterior de 25 minutos.

c) A probabilidade de obter uma amostra cuja média é 22,4 minutos ou menos quando a

hipótese nula é verdadeira é 0,0047.

d) As conclusões são as mesmas.

9.58) H0: =35 e H1: 35

(OBS: para encontrar o p-valor usando a tabela t, cruzar o número de graus de liberdade nas

linhas contra a significância nas colunas. Entretanto, isso dará um intervalo onde o p-valor

cairá. Logo, usar o Excel pra ter o valor exato)

a) regra de decisão: rejeitar hipótese nula se |t| >2,5706 g.l. = 5, =0,025 (corresponde à

cauda superior)

√ ⁄

=36,53 – 35 / 4,3896/raiz(6) = 0,8556

Decisão: sendo tcalc<tcrit, não rejeitar H0.

b) O p-valor é 0,4313. =distt(abs(tcalc;gl;bicaudal) =distt(abs(0,8556;5;2))

c) a distribuição dos preços é normalmente distribuída.

d) como n é pequeno, é difícil avaliar a normalidade. Mas se a média e a mediana estão

próximas, a distribuição pode ser simétrica.

9.71)

a) H0: π≤35 e H1: π> 35

regra de decisão: se z> 1,645, rejeitar H0:

√ ( ) ⁄

= 0,82 – 0,78/raiz ((0,78*(1-0,78))/50) = 0,6829

Logo, como zcalc < zcrit, não rejeitar H0:

b)

√ ( ) ⁄

= 0,82 – 0,78/raiz ((0,78*(1-0,78))/50) = 0,6829

p-valor: 0,2474

como p-valor é maior que 𝛼 = 0,05, não rejeitar H0.

c)

√ ( ) ⁄

= 0,82 – 0,78/raiz ((0,78*(1-0,78))/1000) = 3,0535

como zcalc está acima de zcrit, rejeitar H0.

Já utilizando o p-valor:

P=valor de z=3,0535 = 0,0011. Como ele é menor que alfa, rejeitar H0.

d) uma amostra de tamanho maior reduz o erro padrão da proporção da amostra e assim,

reduz o p-valor e torna mais fácil rejeitar H0 mantendo todo o resto constante.

10.28) (OBS: no excel: Análise de dados/teste t pareado para duas amostras)

H0: D≤0 e H1: πD> 0

Teste-t: duas amostras em par para médias

Antes Depois

Média 312,1428571 226

Variância 15513,14286 4971

Observações 7 7

Correlação de Pearson 0,29506899 Hipótese da diferença de média 0 gl 6 Stat t 1,842455029 P(T<=t) uni-caudal 0,057493133 t crítico uni-caudal 1,943180274 P(T<=t) bi-caudal 0,114986267 t crítico bi-caudal 2,446911846

Teste t:

√ ⁄

= 1,8425

a) como tcalc < tcrit (1,943), não rejeitar H0.

b) P-valor = 0,0575 - =distt(abs(1,8425;6;1)) a probabilidade de que a estatística t para a

diferença seja 1,8425 ou maior é de 5,75%, caso média da densidade não seja maior antes do

transplante do que depois.

c)

√ = 86,1429 ± 2,4469*(123,7005)/raiz(7) = [-28,26; 200,55]

10.35)

a) H0: π1=π2 e H1: π1π2

regra de decisão: se z<-19,6 ou >1,96, rejeitar H0.

( ) ( )

√ ( )(

)

= (0,0419 – 0,3103) – 0 / raiz(0,111*(1-0,111)*(1/34+1/116) = -7,9254

Como zcalc < zcrit, rejeitar H0.

b) p-valor é zero, quando a hipótese nula é verdadeira.

c) (p1-p2)±z*(raiz((p1*(1-p1))/n1 + p2*(1-p2)/n2) = -

0,2684±1,96*raiz(((0,0419*0,9581)/334)+(0,3103*0,6897)/116)) = -0,3553 ≤ π1 - π2 ≤ -0,1815

d) há uma diferença significativa na proporção de placas boas e ruins que contém partículas.

10.50)

a) H0: =

as variâncias das populações são iguais

H1:

as variâncias das populações são diferentes

Regra de decisão: Se F<0,653 ou > 1,556, rejeitar H0.

= ((13,35)^2) /((9,42)^2) = 2,008

Como Fcalc é maior que Fcrit, rejeitar H0.

b) p-valor = 0,002207 =SE(2,008>1;2*(DISTF(2,008;99;71));2*(1-(2*(DISTF(2,008;99;71)))))

c) O teste assume que as duas populações estão distribuídas de acordo com a gaussiana

d) baseado em a e b, um teste t separado de variância deve ser usado.

gabarito introdução quimiometria 2012 2 caps 7-10

Documents