9-1 estatistica teste de hipóteses de uma amostra prof. helcio rocha
TRANSCRIPT
9-1
Estatistica
Teste de Hipóteses de uma amostra
Prof. Helcio Rocha
9-29-29-2
TH – um caso
Uma indústria fabrica carcaças de motores elétricos. O diâmetro interno DI é uma variável crítica.
Valores diferentes de 150,00 mm inviabilizam seu uso A cada hora retira-se amostra de n = 9 carcaças e
mede-se os respectivos DIs Cada amostra retirada dá origem a um TH:
H0 ► μ = 150 mm ► o processo está sob controle H1 ► μ ≠ 150 mm ► o processo está fora de
controle, produzindo diâmetros elevados
Erros no TH
E se formos levados a rejeitar H0, estando o processo na verdade sob controle?
► ERRO TIPO I (alarme falso) Estaremos rejeitando produtos cuja
variabilidade está sob controle Quais são os custos decorrentes deste erro? A probabilidade do erro tipo I é denominada
alfa
9-3
Erros no TH
E se formos levados a não rejeitar H0, estando o processo na verdade fora de controle?
► ERRO TIPO II (falso positivo) Estaremos aceitando produtos cuja
variabilidade está fora de controle Quais são os custos decorrentes deste erro? A probabilidade do erro tipo II é denominada
beta
9-4
Cenários no TH
9-5
Possíveis consequências do TH
Situação real
Decisão H0 Verdadeira H0 Falsa
Não rejeitar H0
OK Erro Tipo II(falso positivo)
Rejeitar H0 Erro Tipo I(alarme falso)
OK
Erros no TH
Alfa, beta e o tamanho da amostra n estão todos relacionados
A prática usual na indústria e na pesquisa é estabelecer os valores de alfa e de n, de modo que beta fica determinado
Para erros tipo I com consequências mais sérias, selecione menores valores de α.
Escolha, então, um n com base em considerações de tempo, custo e outros fatores. (Triola)
9-6
Distribuição das médias amostrais
Supondo H0 verdadeira, esta é a curva de distribuição das médias amostrais com n = 9.
9-79-79-7
µ = 150
H0: μ = 150
H1: μ ≠ 150
O desvio-padrão (erro padrão) desta curva é
n
s
TH e estatística t
Para realizarmos o TH, convertemos as médias amostrais na estatística t
9-89-89-8
Rejeita H0
Não rejeita H0
a
tc
Valores críticos
t
n
SμX
tSTAT
A distância entre a média amostral e µ é convertida em No. de erros-padrão
Rejeita H0
tc
Alfa e t crítico
Suponha que a fábrica de carcaças tenha estabelecido a meta de alfa igual a 1% = 0,01
A partir de alfa e do No. de graus de liberdade (n-1), encontramos o valor crítico da estatística t (tc);
Podemos usar a tabela t Podemos usar no Excel a função INVT:
= INVT (alfa;g.l.) = INVT (0,01;8) = 3,36
9-9
Obs: se for usar INVT em TH unicaudal, duplique alfa
Tabela t
9-10
α Bicaudal0,20 0,10 0,05 0,02 0,01
Unicaudalαg.l. 0,100 0,050 0,025 0,010 0,005(n-1) (n-1)
1 3,078 6,314 12,706 31,821 63,657 12 1,886 2,920 4,303 6,965 9,925 23 1,638 2,353 3,182 4,541 5,841 34 1,533 2,132 2,776 3,747 4,604 45 1,476 2,015 2,571 3,365 4,032 56 1,440 1,943 2,447 3,143 3,707 67 1,415 1,895 2,365 2,998 3,499 78 1,397 1,860 2,306 2,896 3,355 89 1,383 1,833 2,262 2,821 3,250 9
10 1,372 1,812 2,228 2,764 3,169 1011 1,363 1,796 2,201 2,718 3,106 1112 1,356 1,782 2,179 2,681 3,055 1213 1,350 1,771 2,160 2,650 3,012 1314 1,345 1,761 2,145 2,624 2,977 1415 1,341 1,753 2,131 2,602 2,947 15
Estatística t versus t crítico
A próxima etapa é converter a média amostral em t (estatística t)
Caso a estatística t ultrapasse tc, rejeitaremos H0
Caso a estatística t não ultrapasse tc, não rejeitaremos H0
9-11
X
Média amostral ► estatística t
Considere que a última amostra tenha tido média = 150,20 mm e s = 0,15 mm.
Podemos confirmar que o processo está sob controle? Podemos interpretar que a diferença entre 150,20 e 150,00 é resultante do comportamento aleatório das variáveis do processo?
9-12
Para a análise, esta diferença será transformada em estatística t
X
9-13
Como t ultrapassa o valor crítico (tc = 3,36), consideramos que a distância entre 150,20 e 150,00 é significativa
Assim, é pouco provável que se possa extrair uma amostra com média de 150,20 a partir de uma população de µ = 150,00.
Então, µ ≠ 150,00.
0,4
9
0,1500,15020,150
n
SμX
t
Estatística t
9-14
Análise do TH
9-149-149-14
= a0,01
tc t
3,4 4,0
t cai numa região de rejeição de H0
Há evidência suficiente para garantir que a média populacional de DIs é diferente de 150,00 mm
9-15
Passos do TH usando t
1. Construa as hipóteses H0 e H1
2. Defina e o tamanho da amostra, n
3. Determine o valor crítico tc
4. Colete os dados e calcule a média amostral
5. Calcule a estatística t
6. Se o módulo de t for maior do que o módulo do tc, rejeite H0; caso contrário, não rejeite H0.
Trabalhando com outro valor de tc
Use a tabela t para responder às questões abaixo:
E se no caso dos DIs das carcaças, tentando minimizar o erro tipo I... trabalhássemos com alfa igual a 0,05?
Além disso, e se aumentássemos n para 15? Observe.
Como estas decisões impactariam no valor crítico tc?
9-16
Monitorando um processo com menor variabilidade
Recalcule a estatística t para responder à questão abaixo:
E se no caso dos DIs das carcaças o desvio-padrão amostral fosse menor? Suponha s = 0,14 mm. A média amostral de 150,20 mm acarretaria numa rejeição mais clara de H0?
9-17
p-value no TH
Com a difusão de pacotes de Estatística, tem crescido a realização de TH mediante a análise do chamado p-value.
O que é o p-value? Voltemos ao caso da fabricação de carcaças de
motores elétricos...onde a média amostral (150,20 mm) está 4,0 desvios-padrão acima do valor afirmado como média (máx.) populacional (150,00 mm)
9-18
9-19
p-value
0
t = 4,0
p-value
Suponha que H0 seja verdadeira. p-value é a probabilidade de se obter uma
estatística t mais extrema do que a resultante da amostra
Quanto maior é a estatística t, menor é o p-value
O p-value corresponde a área colorida na figura
9-20
p-value e alfa
Alfa e p-value são medidas da probabilidade de se cometer o erro tipo-I
Alfa é o risco (máximo) que se está disposto a correr; também é conhecida como significância
p-value é o risco efetivo de se cometer o erro tipo-I (de acordo com a amostra)
Se o p-value é inferior ao alfa, rejeitamos H0; caso contrário, não rejeitamos H0
Ou, simplesmente, rejeita-se H0 sempre que o p-value for reduzido, não necessitando a comparação com alfa
p-value é o nível de significância observado
Calculando o p-value
O p-value pode ser calculado mediante a função DISTT do Excel:
= DISTT(x; graus de liberdade; caudas) = DISTT (4,0; 8; 2) = 0,0039 = 0,39%
Como o p-value é muito pequeno, somos levados a rejeitar H0 e a confirmar H1 ► μ ≠150 mm
9-21
gl 8 0,0039caudas 2
p-value e alfa
9-22
Teste de Hipótesis com p-value adaptado de Lapponi
CAUDAS2
H 0 150,00 Z crítico 1,96Média da Amostra 150,20 Z observado 2,26
ALFA 0,050 P( Z > Zo ) 2,37%s 0,25n 8
Dados Resultados com Alfa = 5%
Rejeitar Hipótese Nula
-03 -03 -02 -02 -01 -01 00 00 01 01 02 02 03
Distribuição Z Alfa = 5,0% Z observado = 2,26 - P( Z > Zo ) = 2,37%
Distribuição da população
Normal Não é normal
Estimativa com a
Dist. Normal Dist. t
Alfa IC
Este modelo de planilha permite simular um TH, tanto unicaudal quanto bicaudal; tanto para distribuição t quanto para normal.
No gráfico:Em verde escuro, região do P-VALUE; em vermelho, região do ALFA
9-239-23
Passos do TH com p-value
1. Construa as hipóteses H0 e H1
2. Defina e o tamanho da amostra, n
3. Colete os dados e calcule a média amostral
4. Calcule a estatística t
5. A partir de t e do gl, encontre o p-value usando soft estatístico
6. Se o p-value for menor do que o , rejeite H0; caso contrário, não rejeite H0