aula 1 –planejamento e análise de experimentos€¦ · revisão da aula anterior condições de...

110
Aula 3 –Planejamento e Análise de Experimentos Professores Miguel Antonio Sovierzoski, Dr. [email protected]; Vicente Machado Neto, Dr. [email protected];

Upload: dothuan

Post on 14-Oct-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Aula 3 –Planejamento e Análise de Experimentos

Professores Miguel Antonio Sovierzoski, Dr. [email protected]; Vicente Machado Neto, Dr. [email protected];

Page 2: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Revisão da aula anterior Fatores – níveis - tratamentos

Discussão sobre os trabalhos a serem desenvolvidos na disciplina, fatores, níveis, tratamentos

Passos para a construção de um histograma;

Histograma de uma distribuição Normal 1s e 2s;

Tipos de variáveis (categóricas, numéricas discretas, contínuas);

Medidas descritivas de uma amostra (localização, separatrizes, variação, formato);

Cinco valores: a mediana (Md), os quartis, primeiro (Q1) e terceiro (Q3), e os extremos, inferior (Ei) e superior (Es).

𝑎𝑎𝑞𝑞 = 𝑄𝑄3 −𝑄𝑄1

𝐷𝐷𝐼𝐼 = 𝑀𝑀𝑑𝑑 − 𝐸𝐸𝐼𝐼

𝐷𝐷𝑆𝑆 = 𝐸𝐸𝑠𝑠 − 𝑀𝑀𝑑𝑑

Page 3: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Revisão da aula anterior Condições de simetria

Identificação de valores discrepantes

Box plot

(𝑄𝑄1 − 𝐸𝐸𝐼𝐼 ≅ 𝐸𝐸𝑆𝑆 − 𝑄𝑄3) (𝑀𝑀𝑑𝑑 − 𝑄𝑄1 ≅ 𝑄𝑄3 −𝑀𝑀𝑑𝑑 )

𝐶𝐶𝐼𝐼 = 𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 𝑒𝑒 𝐶𝐶𝑆𝑆 = 𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞 �𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 ;𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞�

Page 4: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Fatores - níveis - tratamentos Fator: É uma das variáveis cujos efeitos estão sendo estudados no experimento. Pode ser: • Quantitativo – Ex temperatura em °C, tempo em minutos, etc... • Qualitativo – Ex. diferentes operadores, diferentes máquinas, ligado

ou desligado etc...

Nível do Fator – É o valor do fator examinado no experimento. • Fator quantitativo – cada valor escolhido constitui um nível. (por exemplo, se o experimento for realizado com 3 tempos diferentes, cada tempo é um nível e o fator tempo tem 3 níveis); • Fator qualitativo – cada condição diferente escolhida para cada fator

constitui um nível. (por exemplo, se o experimento for realizado com 2 máquinas operadoras por 3 operadores, o fator máquina tem 2 níveis, e o fator operador, 3 níveis.)

Page 5: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Fatores - níveis - tratamentos Tratamento - É um nível único assinalado para um fator durante um experimento. Exemplo: Temperatura a 450°C. Combinação do tratamento – É um conjunto de níveis para todos os fatores num determinado experimento. Exemplo: Experimento usando operador João, máquina A, temperatura de 450°C. Exemplo – Experimento com 2 fatores (operador e máquina), com os seguintes níveis e tratamentos: Operador (4 níveis) – tratamentos: 1) Operador João; 2) Operador Tiago; 3) Operador Márcio; 4) Operador Odete; Máquina (2 níveis) – tratamentos: 1) Máquina marca PXTO; 2) Máquina marca LAMP

Page 6: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias Para facilitar a compreensão do conceito de variável aleatória, vamos tomar como exemplo o seguinte experimento aleatório. Exemplo: lançamento de uma moeda honesta três vezes e observação das faces que ocorrem.

O espaço amostral do experimento é

S = { ccc, cck, ckc, kcc, kkc, kck, ckk, kkk}

Como a moeda é honesta, a probabilidade de ocorrer cara é igual a probabilidade de ocorrer coroa: P(c) = P(k) = 1/2.

A probabilidade de ocorrerem 3 caras:

De forma análoga a probabilidade de ocorrência dos demais resultados são todos 1/8:

𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) =18

𝑃𝑃 𝑐𝑐𝑐𝑐𝑐𝑐 = 𝑃𝑃 𝑐𝑐 𝑥𝑥𝑃𝑃 𝑐𝑐 𝑥𝑥𝑃𝑃 𝑐𝑐 =12 𝑥𝑥

12 𝑥𝑥

12 =

18

Page 7: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias Observamos que o espaço amostral é formado pela união dos eventos:

Sendo assim, a probabilidade do espaço amostral, P(S), é dada pela soma das probabilidades de cada evento:

Temos as variáveis aleatórias discretas e contínuas.

𝑃𝑃(𝑆𝑆) = 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) + 𝑃𝑃(𝑐𝑐𝑐𝑐𝑐𝑐) = 1

(𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐), (𝑐𝑐𝑐𝑐𝑐𝑐)

Page 8: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias discretas Definição: São discretas todas as variáveis cuja espaço amostral Sx é enumerável finito ou infinito. Assim se X é uma variável aleatória discreta, então Sx é um subconjunto dos inteiros.

Tomemos como exemplo o seguinte experimento:

Lançamento de uma moeda até que ocorra face cara.

O espaço amostral básico deste experimento será: 𝑆𝑆 = 𝑐𝑐, 𝑐𝑐𝑐𝑐, 𝑐𝑐𝑐𝑐𝑐𝑐, 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐, 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐, …

Se definirmos a variável aleatória X como o número de lançamentos até que ocorra cara, então, temos 𝑆𝑆

𝑋𝑋→𝑆𝑆𝑋𝑋 = 1,2,3,4,5, …

Page 9: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias contínuas Definição: São contínuas todas as variáveis cujo espaço amostral Sx é infinito não enumerável. Assim, se X é uma variável aleatória contínua, então X pode assumir qualquer valor num intervalo [a;b] ou no intervalo (-∞; +∞) e o conjunto Sx será sempre definido como um intervalo.

São exemplos de variáveis aleatórias contínuas: o tempo de vida de um animal, a vida útil de um componente eletrônico, o peso de uma pessoa, a produção de leite de uma vaca, a quantidade de chuva que ocorre numa região.

Page 10: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias contínuas – Função densidade de probabilidade

Definição: Seja X uma variável aleatória contínua e 𝑆𝑆𝑋𝑋 o seu espaço amostral. Uma função f associada à variável X é denominada função densidade de probabilidade se satisfizer duas condições:

1. 𝑓𝑓 𝑋𝑋 ≥ 0, 𝑡𝑡𝑎𝑎𝑡𝑡 𝑞𝑞𝑞𝑞𝑒𝑒 𝑋𝑋 ∈ 𝑆𝑆𝑋𝑋

2.� 𝑓𝑓 𝑋𝑋 𝑑𝑑𝑋𝑋 = 1 = 𝑃𝑃(𝑋𝑋 ∈ 𝑆𝑆𝑋𝑋)𝑆𝑆𝑋𝑋

A área sob a função f(x) no intervalo Sx é um, pois corresponde à probabilidade de a variável X pertencer ao espaço amostral Sx.

Page 11: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variáveis aleatórias contínuas – Função probabilidade acumulada

Definição: Seja X uma variável aleatória contínua e 𝑆𝑆𝑋𝑋 o seu espaço amostral. A função de distribuição, definida por F(x) ou P(X≤x), é a função que associa a cada valor de 𝑋𝑋 ∈ 𝑆𝑆𝑋𝑋 a sua probabilidade acumulada 𝑃𝑃 𝑋𝑋 ≤ 𝑥𝑥 . Desta forma, temos

𝐹𝐹 𝑋𝑋 = 𝑃𝑃 𝑋𝑋 ≤ 𝑥𝑥 = � 𝑓𝑓 𝑡𝑡 𝑑𝑑𝑡𝑡, 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑆𝑆𝑋𝑋 = 𝑎𝑎, 𝑏𝑏 𝑥𝑥

𝑎𝑎

Page 12: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuições de probabilidade Uma distribuição de probabilidade é essencialmente um modelo de descrição probabilística de uma população, entendendo por população o conjunto de todos os valores de uma variável aleatória.

As ideias de população e distribuição de probabilidade são, deste modo, indissociáveis e serão, a partir de agora, tratadas como sinônimos.

As distribuições de probabilidade formam a espinha dorsal da metodologia estatística, uma vez, que pela sua natureza, a estatística somente trabalha com variáveis cujos valores não ocorrem de modo determinístico.

Page 13: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuições de probabilidade No estudo de uma variável aleatória é importante saber:

• o tipo de distribuição de probabilidade da variável;

• a função de probabilidade da variável;

• os parâmetros da distribuição;

• as medidas descritivas da distribuição (média, variância, assimetria).

Existem inúmeros modelos descrevendo o comportamento probabilístico de variáveis discretas e contínuas.

Vamos tratar aqui simplificadamente, somente das distribuições de variáveis aleatórias contínuas, mais especificamente da distribuição normal N, distribuição t de student, distribuição qui-quadrado e distribuição F.

Page 14: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal É uma distribuição teórica de frequências, onde a maioria das observações se situa em torno da média (centro da distribuição) e diminui gradualmente e simetricamente no sentido dos extremos. A distribuição normal é representada graficamente pela curva normal (também chamada de Gauss) que tem a forma de sino e é simétrica em relação ao centro, onde se localiza a média µ.

Page 15: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal – densidade de probabilidade

De modo geral, se X é uma variável aleatória contínua, X possui distribuição normal se sua função densidade de probabilidade for:

𝑓𝑓 𝑥𝑥 =1

𝜎𝜎 2𝜋𝜋𝑒𝑒−

𝑋𝑋−𝜇𝜇 2

2𝜎𝜎2 , −∞ < 𝑋𝑋 < +∞

A distribuição normal tem dois parâmetros:

µ = média (determina o centro da distribuição)

𝜎𝜎2 = variância (determina a dispersão da distribuição)

Dizemos, então, que 𝑋𝑋~𝑁𝑁(𝜇𝜇,𝜎𝜎2)

Page 16: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal Medidas descritivas

Page 17: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal

Propriedades da distribuição normal

1. O máximo da função densidade de probabilidade se dá no ponto x=µ;

2. A distribuição é simétrica em relação ao centro onde coincidem a média, a moda e a mediana. µ=Mo=Md;

3. Os pontos de inflexão (onde a curva passa de convexa para côncava) são exatamente 𝜇𝜇 − 𝜎𝜎 𝑒𝑒 𝜇𝜇 + 𝜎𝜎.

4. Verifica-se na distribuição normal que: 𝑃𝑃 𝜇𝜇 − 𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 𝜎𝜎 = 0,6825 𝑃𝑃 𝜇𝜇 − 2𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 2𝜎𝜎 = 0,9544 𝑃𝑃 𝜇𝜇 − 3𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 3𝜎𝜎 = 0,9974

Page 18: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal

Propriedades da distribuição normal 𝑃𝑃 𝜇𝜇 − 𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 𝜎𝜎 = 0,6825 𝑃𝑃 𝜇𝜇 − 2𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 2𝜎𝜎 = 0,9544 𝑃𝑃 𝜇𝜇 − 3𝜎𝜎 < 𝑋𝑋 < 𝜇𝜇 + 3𝜎𝜎 = 0,9974

Page 19: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão

Para evitar a trabalhosa tarefa de calcular as áreas todas as vezes que desejamos obter as probabilidades associadas a uma certa variável X, foi determinada uma distribuição normal padrão ou reduzida. Através da distribuição normal padrão é possível estudar qualquer variável que tenha distribuição normal, com quaisquer valores para 𝜇𝜇 e 𝜎𝜎.

Definição: é a distribuição normal de uma variável Z que tem média igual a zero (µ=0) e desvio padrão igual a um (𝜎𝜎 = 1). Para a variável Z, a função densidade de probabilidade resulta

𝑓𝑓 𝑍𝑍 =12𝜋𝜋

𝑒𝑒−𝑍𝑍22 , −∞ < 𝑍𝑍 < +∞

Page 20: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão

A função densidade de probabilidade mais simplificada da distribuição normal padrão, facilitou o cálculo das áreas sob a sua curva. Assim, a curva normal padrão foi dividida em pequenas tiras, cujas áreas foram calculadas e apresentadas numa tabela. Na tabela da distribuição normal padrão, podemos encontrar as áreas correspondentes aos intervalos de 0 a z. Os valores negativos não são apresentados por serem simétricos.

Outras tabelas apresentam os valores acumulados da esquerda para a direita.

Page 21: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão

Com a distribuição normal padrão e sua tabela podemos obter a probabilidade de qualquer variável X que tenha distribuição normal.

Para utilizar os valores da tabela, devemos transformar X em Z.

𝑋𝑋~𝑁𝑁 𝜇𝜇,𝜎𝜎2 transformar

𝑍𝑍~𝑁𝑁 0,1 𝑍𝑍 =𝑋𝑋 − 𝜇𝜇𝜎𝜎

Page 22: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Exercício: Sabemos que as notas de 450 alunos estão normalmente distribuídas, com média µ = 3,9 e desvio padrão σ = 0,28, determine: a) a probabilidade de um aluno ter nota maior que 4,27; b) o número de alunos que têm nota superior a 4,27.

Resolução: a) Sabemos que a probabilidade de ocorrer um valor dentro de um intervalo corresponde à área sob a função densidade dentro deste intervalo. Sendo assim, para determinar a probabilidade de ocorrer uma nota maior do que 4,27, devemos encontrar a área localizada à direita de 4,27 na curva normal.

Page 23: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Exercício: Inicialmente fazemos a transformação da variável X para a variável Z, através da expressão 𝑍𝑍 = 4,27 −3,9

0,28= 1,32

Desta forma o valor Z que corresponde ao valor X=4,27 vai ser igual a 1,32.

Page 24: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Exercício: Algumas tabelas nos dão a área acumulada de - ∞ para a direita, outras nos dão a área a partir do centro para a direita.

O livro do Montgomery nos dá a tabela de -∞ para a direita. A referência bibliográfica Apostila_EB nos dá a área a partir do centro.

Pegando-se pela tabela do livro do Montgmery teremos para 1,32 o valor 0,90658. Esta é a área acumulada de -∞ até 1,32, estamos interessados nos valores superiores a 1,32, assim fazemos 1-0,90658= 0,09342. Ou seja somente 9,34 % das notas são superiores a 4,27.

Pela tabela da Apostila_EB encontramos o valor 0,4066, subtraindo-se 0,5 encontramos a área a direita de 1,32 que é o que nos interessa 0,5 - 0,4066= 0,0934. Ou seja somente 9,34% das notas são superiores a 4,27, como encontrado com a tabela anterior.

Page 25: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Exercício: b) Para determinar quantos alunos tem nota superior a 4,27 basta multiplicar o percentual de 9,34% pelo tamanho da população de 450 alunos, encontramos assim 450 x 0,0934 =42,03. Concluímos assim que dos 450 alunos, 42 têm nota superior a 4,27.

Page 26: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Resolvendo o exercício pelo Minitab.

Page 27: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Resolvendo o exercício pelo Minitab.

Page 28: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição normal padrão exercício

Resolvendo o exercício pelo Minitab.

1,6

1,4

1,2

1,0

0,8

0,6

0,4

0,2

0,0

X

Den

sity

4,27

0,09318

3,9

Distribution PlotNormal; Mean=3,9; StDev=0,28

Page 29: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

A média da amostra (𝑋𝑋�) é a estatística mais utilizada porque apresenta propriedades interessantes. Vamos utilizar o exemplo a seguir para demostrar as propriedades da distribuição amostral da média.

Supondo que o mecânico de uma oficina de regulagem para carros de 4, 6 e 8 cilindros, cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variável X = valor cobrado pelo mecânico, com a seguinte distribuição de probabilidade:

X=x 40 45 50 Σ

P(X=x) 0,2 0,3 0,5 1

a) Determine a média e a variância da população;

b) Suponha a retirada de uma amostra aleatória de tamanho n, determine a distribuição de probabilidade, a média e a variância de cada elemento da amostra 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 ;

Page 30: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

c) Supondo a retirada de uma amostra de tamanho n=2, com reposição, quantas e quais são as possíveis amostras retiradas da população e qual a probabilidade associada a cada uma? Determinar a média e a variância da distribuição amostral de média 𝑋𝑋�.

Resolução: a) Média e a variância da população:

𝐸𝐸 𝑋𝑋 = 𝜇𝜇 = � 𝑥𝑥 𝑝𝑝 𝑥𝑥 = 40𝑥𝑥0,2 + 45𝑥𝑥0,3 + 50𝑥𝑥0,5 = 46,5𝑋𝑋𝜖𝜖𝑆𝑆𝑋𝑋

𝑉𝑉 𝑋𝑋 = 𝜎𝜎2 = 𝐸𝐸 𝑋𝑋2 − 𝜇𝜇2 = 402𝑥𝑥0,2 + 452𝑥𝑥0,3 + 502𝑥𝑥0,5 − 46,52= 15,25

b) Verificamos que se 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 é uma amostra aleatória, o valor esperado de cada elemento da amostra é igual à média da população e a variância de cada elemento da amostra é igual a variância da população, ou seja, 𝐸𝐸 𝑋𝑋𝑖𝑖 = 𝜇𝜇 𝑒𝑒 𝑉𝑉 𝑋𝑋𝑖𝑖 = 𝜎𝜎2

Page 31: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

c) O número de amostras aleatórias possíveis é obtido por meio da expressão 𝑐𝑐 = 𝑁𝑁𝑛𝑛 onde: k= número de amostras possíveis de um mesmo tamanho; N = tamanho da população; n = tamanho da amostra.

Assim, supondo uma amostra de tamanho dois, temos 𝑐𝑐 = 𝑁𝑁𝑛𝑛 = 32 = 9.

Amostras

possíveis:

Page 32: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

Para construir a distribuição amostral da média, tomamos todos os diferentes valores que a estatística 𝑋𝑋� assume e calculamos a probabilidade de ocorrência de cada um. A probabilidade associada a cada valor de 𝑋𝑋� é obtida da seguinte maneira:

Assim temos a distribuição amostral da média das amostras de tamanho dois.

Page 33: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

Como todos os possíveis valores de 𝑋𝑋� constituem uma população, também podemos obter o valor esperado da média 𝐸𝐸 𝑋𝑋� e a variância 𝑉𝑉 𝑋𝑋� desta população:

Page 34: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

d) Supondo uma amostra de tamanho três, temos:

𝑐𝑐 = 𝑁𝑁𝑛𝑛 = 33 = 27 amostras possíveis. Teremos assim:

Page 35: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição amostral da média

d) A partir desses dados, construímos a distribuição amostral da média das amostras de tamanho três, apresentadas na tabela abaixo.

Assim, obtemos também o valor esperado e a variância da média das amostras de tamanho três:

Page 36: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Conclusões da distribuição amostral da média

Relacionando as medidas da distribuição amostral da média 𝑋𝑋� com as medidas da distribuição populacional (X), podemos verificar que algumas propriedades importantes:

- A média das médias de todas as k amostras aleatórias possíveis, de mesmo tamanho n, extraídas de uma população, é igual à média da população, ou seja: 𝐸𝐸 𝑋𝑋� = 𝜇𝜇

- A variância das médias de todas as k amostras aleatórias possíveis, de mesmo tamanho n, extraídas de uma população, é igual à variância da população dividida pelo tamanho da amostra, ou seja:

𝑉𝑉 𝑋𝑋� = 𝜎𝜎2

𝑛𝑛

assim o desvio padrão da média é igual: 𝜎𝜎𝑋𝑋� = 𝑉𝑉 𝑋𝑋� = 𝜎𝜎2

𝑛𝑛= 𝜎𝜎2

𝑛𝑛= 𝜎𝜎

𝑛𝑛

Page 37: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Conclusões da distribuição amostral da média

Comparando o histograma da população X com os histogramas da média 𝑋𝑋� para as amostras de tamanhos n=2 e n=3, observamos que, mesmo a distribuição da população não sendo simétrica, a distribuição amostral da média se aproxima da simétrica à medida que o tamanho da amostra cresce. Observa-se a concentração dos valores em torno da média.

Page 38: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Conclusões da distribuição amostral da média

A tendência para a simetria e consequente aproximação para a normal pode ser verificada nos gráficos que mostram o comportamento do histograma para várias formas de distribuição da população e vários tamanhos da amostra.

Page 39: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Conclusões da distribuição amostral da média

Conclusões:

1) Se a população (X) de onde foi extraída a amostra aleatória tiver distribuição normal, a distribuição amostral da média 𝑋𝑋� será normal.

Page 40: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Conclusões da distribuição amostral da média

Conclusões:

2) Se a população (X) de onde foi extraída a amostra aleatória não tiver distribuição normal, a distribuição amostral da média 𝑋𝑋� se aproximará da normal à medida que o tamanho da amostra (n) cresce.

Este resultado pode ser derivado do teorema fundamental da estatística paramétrica, denominado Teorema Central do Limite (TCL) ou Teorema do Limite Central.

Page 41: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Teorema Central do Limite TCL Se 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 é uma amostra aleatória de X, então a distribuição da soma de 𝑋𝑋(𝑋𝑋+ = ∑𝑋𝑋𝑖𝑖) se aproxima da distribuição normal com média nµ e variância n𝜎𝜎2. Assim, para n suficientemente grande, temos:

𝑋𝑋+ − 𝑛𝑛𝜇𝜇𝑛𝑛𝜎𝜎𝑥𝑥2

= 𝑍𝑍~𝑁𝑁 0,1

Como consequência, a distribuição da média (𝑋𝑋�) se aproxima da normal com média µ e variância 𝜎𝜎2 𝑛𝑛⁄ . Assim, temos:

𝑋𝑋+ − 𝑛𝑛𝜇𝜇𝑛𝑛𝜎𝜎𝑥𝑥2

=𝑋𝑋� − 𝜇𝜇𝜎𝜎𝑥𝑥𝑛𝑛

=𝑛𝑛(𝑋𝑋� − 𝜇𝜇)𝜎𝜎𝑥𝑥

= 𝑍𝑍~𝑁𝑁 0,1

A demonstração completa desse teorema não é objeto do nosso estudo.

Page 42: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Teorema Central do Limite TCL A importância da distribuição normal na estatística se deve em grande parte a este teorema. Observemos que se a população tem distribuição normal, 𝑋𝑋� poderá ter distribuição normal aproximada ou assintótica.

O TCL afirma que 𝑋𝑋� aproxima-se de uma normal quando n tende para o infinito e a rapidez dessa convergência depende da distribuição da população da qual a amostra é retirada. Se a população tem distribuição próxima da normal, a convergência é rápida, mas se esta população se afasta muito da normal, a convergência é mais lenta, implicando numa amostra maior para que 𝑋𝑋� tenha uma distribuição aproximadamente normal. Para a ordem de 30 a 50 elementos a aproximação pode ser considerada satisfatória.

Page 43: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição gama Γ Densidades de probabilidade importantes são casos especiais de distribuição gama. A distribuição gama tem função densidade de probabilidade dado por:

𝑓𝑓 𝑥𝑥 = �1

𝛽𝛽𝛼𝛼Γ 𝛼𝛼𝑥𝑥𝛼𝛼−1𝑒𝑒−𝑥𝑥 𝛽𝛽⁄ 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑥𝑥 > 0,∝> 0,𝛽𝛽 > 0

0 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑑𝑑𝑒𝑒𝑑𝑑𝑎𝑎𝑑𝑑𝑠𝑠 𝑐𝑐𝑎𝑎𝑠𝑠𝑐𝑐𝑠𝑠

Onde Γ 𝛼𝛼 é o valor da função gama, definida por:

Γ 𝛼𝛼 = ∫ 𝑥𝑥∝−1𝑒𝑒−𝑥𝑥𝑑𝑑𝑥𝑥∞0 integrando por partes

Γ 𝛼𝛼 = 𝛼𝛼 − 1 Γ 𝛼𝛼 − 1

A média da distribuição

gama é obtida: 𝜇𝜇 = 𝛼𝛼𝛽𝛽

A variância: 𝜎𝜎2 = 𝛼𝛼𝛽𝛽2

Page 44: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição gama Γ Um caso especial quando α=1 temos a distribuição exponencial, que tem função densidade de probabilidade:

𝑓𝑓 𝑥𝑥 = � 1𝛽𝛽𝑒𝑒−𝑥𝑥 𝛽𝛽⁄ 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑥𝑥 > 0,𝛽𝛽 > 0

0 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑑𝑑𝑒𝑒𝑑𝑑𝑎𝑎𝑑𝑑𝑠𝑠 𝑐𝑐𝑎𝑎𝑠𝑠𝑐𝑐𝑠𝑠

Para a distribuição exponencial temos: 𝜇𝜇 = 𝛽𝛽 𝑒𝑒 𝜎𝜎2 = 𝛽𝛽2

Page 45: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição gama Γ

Page 46: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição qui-quadrado 𝜒𝜒2 Seja uma variável aleatória 𝑋𝑋~𝑁𝑁 𝜇𝜇,𝜎𝜎2 𝑒𝑒 𝑋𝑋1,𝑋𝑋2, … ,𝑋𝑋𝑛𝑛 uma amostra aleatória dela proveniente. 𝑋𝑋𝑖𝑖~𝑁𝑁 𝜇𝜇,𝜎𝜎2 .

Padronizando, ou seja transformando 𝑋𝑋𝑖𝑖 𝑒𝑒𝑑𝑑 𝑍𝑍𝑖𝑖, temos:

𝑍𝑍𝑖𝑖 =𝑋𝑋𝑖𝑖 − 𝜇𝜇𝜎𝜎

~𝑁𝑁 0,1 , 𝑠𝑠𝑒𝑒𝑛𝑛𝑑𝑑𝑐𝑐 −∞ < 𝑍𝑍𝑖𝑖 < +∞

Seja Q uma nova variável definida como a soma dos quadrados de 𝜈𝜈 variáveis Z independentes. Então, dizemos que a variável Q tem distribuição qui-quadrado, denotada por 𝜒𝜒2 com parâmetro 𝜈𝜈, ou seja,

𝑄𝑄 = �𝑍𝑍𝑖𝑖2𝜈𝜈

𝑖𝑖=1

= 𝑍𝑍12 + 𝑍𝑍22 + ⋯+ 𝑍𝑍𝜈𝜈2~𝜒𝜒2(𝜈𝜈)

Onde: 𝜈𝜈=número de graus de liberdade ou variáveis independentes somadas. A função densidade de probabilidade de distribuição 𝜒𝜒2 é dada por: 𝑓𝑓 𝑞𝑞 = 1

2𝜈𝜈2Γ

𝜈𝜈2𝑒𝑒−

𝑞𝑞2𝑞𝑞

𝜈𝜈2−1, 𝑐𝑐𝑐𝑐𝑑𝑑 0 ≤ 𝑞𝑞 ≤ +∞

Page 47: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição qui-quadrado 𝜒𝜒2 Sendo a variável Q definida como uma soma de quadrados, seus valores nunca serão negativos. A curva da distribuição 𝜒𝜒2, representação gráfica da função densidade de probabilidade, muda o seu formato à medida que varia o número de graus de liberdade.

A distribuição 𝜒𝜒2tem média µ = 𝜈𝜈 e variância 𝜎𝜎2 = 2𝜈𝜈

Page 48: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição qui-quadrado 𝜒𝜒2 Uma variável importante na determinação de intervalos de confiança e testes de hipóteses a respeito da variância da população 𝜎𝜎2 tem distribuição 𝜒𝜒2 e assim definida:

𝑄𝑄 =𝑛𝑛 − 1 𝑆𝑆2

𝜎𝜎2~𝜒𝜒2 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈

= 𝑛𝑛 − 1

Page 49: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição t de student Seja uma variável Z, com distribuição normal padrão, e uma variável Q, com distribuição 𝜒𝜒2 independentes, então, dizemos que uma variável T definida como: 𝑇𝑇 = 𝑍𝑍

𝑄𝑄𝜈𝜈

tem distribuição t de Student com

parâmetro 𝜈𝜈.

Como: 𝑍𝑍 = 𝑋𝑋�−𝜇𝜇𝜎𝜎 𝑛𝑛⁄ ~𝑁𝑁 0,1 e 𝑄𝑄 = 𝑛𝑛−1 𝑆𝑆2

𝜎𝜎2~𝜒𝜒2 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈 = 𝑛𝑛 − 1

Então, 𝑄𝑄𝜈𝜈

= 𝑄𝑄𝑛𝑛−1

=𝑛𝑛−1 𝑆𝑆2

𝜎𝜎2

𝑛𝑛−1= 𝑆𝑆2

𝜎𝜎2

Donde resulta 𝑇𝑇 = 𝑍𝑍𝑄𝑄𝜈𝜈

=𝑋𝑋�−𝜇𝜇𝜎𝜎 𝑛𝑛⁄

𝑆𝑆2

𝜎𝜎2

=𝑋𝑋�−𝜇𝜇𝜎𝜎 𝑛𝑛⁄𝑆𝑆𝜎𝜎

= 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄

Assim, temos 𝑇𝑇 = 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄ ~𝑡𝑡 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈 = 𝑛𝑛 − 1

Page 50: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição t de student

Assim, temos 𝑇𝑇 = 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄ ~𝑡𝑡 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈 = 𝑛𝑛 − 1

De uma maneira geral, uma variável com distribuição t é muito parecida com uma normal padrão, exceto que o desvio padrão que aparece no denominador, é o desvio padrão amostral e não o populacional.

A função densidade de probabilidade da distribuição t de Student com 𝜈𝜈 graus de liberdade é dada por:

𝑓𝑓 𝑡𝑡 =1

𝜈𝜈Β 12 , 𝜈𝜈2 1 + 𝑡𝑡2

𝜈𝜈𝜈𝜈+12

, 𝑐𝑐𝑐𝑐𝑑𝑑 −∞ < 𝑡𝑡 < +∞

• A função Beta é definida como a seguinte combinação de funções

Gammas: Β 𝑎𝑎, 𝑏𝑏 = Γ 𝑎𝑎 Γ 𝑏𝑏Γ 𝑎𝑎 + 𝑏𝑏

Page 51: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição t de student Podemos observar, nos exemplos a seguir, que a curva da distribuição t de Student, representação gráfica da função densidade de probabilidade, muda o seu formato à medida que varia o valor de 𝜈𝜈.

A distribuição de Student tem média µ=0 e variância 𝜎𝜎2 = 𝜈𝜈

𝜈𝜈−2

Page 52: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição t de student

A variável 𝑇𝑇 = 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄ ~𝑡𝑡 𝜈𝜈 é importante na determinação de intervalos

de confiança e teste de hipóteses a respeito da média da população (µ).

A distribuição t se aproxima da normal padrão à medida que o n cresce. Isto ocorre porque quanto o tamanho da amostra se aproxima do tamanho da população (𝑛𝑛 → 𝑁𝑁), o estimador S se aproxima do parâmetro 𝜎𝜎 𝑆𝑆 → 𝜎𝜎 e, consequentemente, a estatística T se aproxima da variável 𝑍𝑍 𝑇𝑇 → 𝑍𝑍 .

Page 53: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição t de student Na prática, com 30 graus de liberdade a distribuição t é aproximadamente igual à distribuição normal padrão e com 120 graus de liberdade é exatamente igual, ou seja, as curvas de sobrepõem. Por esta razão, o tamanho 30 é adotado como referência para considerar uma amostra grande ou pequena. Quando n é menor ou igual a 30, a amostra é considerada pequena para utilizar a variável Z, devemos, portanto utilizar a distribuição t.

Page 54: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor Sejam duas variáveis 𝑄𝑄1 𝑒𝑒 𝑄𝑄2 com distribuição 𝜒𝜒2 independentes, então, dizemos que uma variável F definida como:

𝐹𝐹 =

𝑄𝑄1𝜈𝜈1𝑄𝑄2𝜈𝜈2

Tem distribuição F, com parâmetros 𝜈𝜈1 𝑒𝑒 𝜈𝜈2.

A variável F é definida como a razão entre duas variáveis que têm distribuição 𝜒𝜒2. Vimos que uma variável com esta distribuição nunca assume valores negativos, portanto, os valores da variável F também não poderão ser negativos.

Page 55: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor A função densidade de probabilidade da distribuição F é dada por:

𝑔𝑔 𝑓𝑓 =1

Β 𝜈𝜈12 , 𝜈𝜈22

𝜈𝜈1𝜈𝜈2

𝜈𝜈12 𝑓𝑓

𝜈𝜈12 −1

1 + 𝜈𝜈1𝜈𝜈2𝑓𝑓

𝜈𝜈1+𝜈𝜈22

, com 0 ≤ 𝑓𝑓 ≤ +∞

Page 56: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor O gráfico desta função muda o seu formato à medida que os valores de 𝜈𝜈1 𝑒𝑒 𝜈𝜈2 se alteram.

Page 57: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor Outra variável comumente utilizada na determinação de intervalos de confiança e testes de hipóteses a respeito da variância da população 𝜎𝜎2 tem distribuição F e surge da seguinte situação: sejam as

variáveis aleatórias 𝑋𝑋1~ 𝜇𝜇1,𝜎𝜎12 𝑒𝑒 𝑋𝑋2~ 𝜇𝜇1,𝜎𝜎22 𝑒𝑒 𝑋𝑋11,𝑋𝑋12, … ,𝑋𝑋1𝑛𝑛1 𝑒𝑒

𝑋𝑋21,𝑋𝑋22, … ,𝑋𝑋2𝑛𝑛2 amostras aleatórias delas provenientes. As respectivas variâncias dessas amostras serão:

Podemos reescrever as expressões da seguinte forma: 𝑆𝑆12 𝑛𝑛1 − 1

𝜎𝜎12=∑ 𝑋𝑋1𝑖𝑖 − 𝑋𝑋�1 2

𝜎𝜎12= 𝑄𝑄1~𝜒𝜒2 𝑛𝑛1 − 1

𝑆𝑆22 𝑛𝑛2 − 1𝜎𝜎22

=∑ 𝑋𝑋2𝑖𝑖 − 𝑋𝑋�2 2

𝜎𝜎22= 𝑄𝑄2~𝜒𝜒2 𝑛𝑛2 − 1

𝑆𝑆12 = ∑ 𝑋𝑋1𝑖𝑖−𝑋𝑋�1 2

𝑛𝑛1−1 e 𝑆𝑆22 = ∑ 𝑋𝑋2𝑖𝑖−𝑋𝑋�2 2

𝑛𝑛2−1

Page 58: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor Se

𝐹𝐹 =𝑄𝑄1𝜈𝜈1𝑄𝑄2𝜈𝜈2

~𝐹𝐹 𝜈𝜈1, 𝜈𝜈2 onde

𝑄𝑄1𝜈𝜈1

=

𝑛𝑛1 − 1 𝑆𝑆12𝜎𝜎12

𝑛𝑛1 − 1=𝑆𝑆12

𝜎𝜎12

𝑄𝑄2𝜈𝜈2

=

𝑛𝑛2 − 1 𝑆𝑆22𝜎𝜎22

𝑛𝑛2 − 1=𝑆𝑆22

𝜎𝜎22

𝐹𝐹 =

𝑄𝑄1𝜈𝜈1𝑄𝑄2𝜈𝜈2

=

𝑆𝑆12𝜎𝜎12

𝑆𝑆22𝜎𝜎22

~𝐹𝐹 𝜈𝜈1, 𝜈𝜈2

Page 59: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Distribuição F de Snedecor

𝐹𝐹 =

𝑄𝑄1𝜈𝜈1𝑄𝑄2𝜈𝜈2

=

𝑆𝑆12𝜎𝜎12

𝑆𝑆22𝜎𝜎22

~𝐹𝐹 𝜈𝜈1, 𝜈𝜈2

No caso de variâncias populacionais iguais, ou seja 𝜎𝜎12 = 𝜎𝜎22 = 𝜎𝜎2, temos:

𝐹𝐹 =

𝑄𝑄1𝜈𝜈1𝑄𝑄2𝜈𝜈2

=𝑆𝑆12

𝑆𝑆22~𝐹𝐹 𝜈𝜈1, 𝜈𝜈2

Onde: 𝜈𝜈1 = 𝑛𝑛1 − 1 𝑒𝑒 𝜈𝜈2 = 𝑛𝑛2 − 1

Page 60: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança Intervalo de confiança para a média de uma população (µ): Para a construção do intervalo de confiança devemos levar em conta se conhecemos a variância populacional. Sendo assim, duas situações serão consideradas:

Situação 1: Quando a variância da população 𝝈𝝈𝟐𝟐 é conhecida

Considere que desejamos estimar a média µ de uma população X. Para determinar o intervalo de confiança (IC) para µ,utilizamos o estimador 𝑋𝑋� que, é o melhor estimador de µ.

De acordo com o Teorema do Limite Central (TCL), se 𝑋𝑋~𝑁𝑁 𝜇𝜇,𝜎𝜎2 ,𝑒𝑒𝑛𝑛𝑡𝑡𝑒𝑐𝑐, 𝑋𝑋�~𝑁𝑁 𝜇𝜇, 𝜎𝜎

2

𝑛𝑛

Padronizando a variável 𝑋𝑋�, 𝑡𝑡𝑒𝑒𝑑𝑑𝑐𝑐𝑠𝑠 𝑍𝑍 = 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑋𝑋�

= 𝑋𝑋�−𝜇𝜇𝑉𝑉 𝑋𝑋�

= 𝑋𝑋�−𝜇𝜇𝜎𝜎2𝑛𝑛

= 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

Page 61: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança 𝜎𝜎2 conhecida

Padronizando a variável 𝑋𝑋�, 𝑡𝑡𝑒𝑒𝑑𝑑𝑐𝑐𝑠𝑠 𝑍𝑍 = 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑋𝑋�

= 𝑋𝑋�−𝜇𝜇𝑉𝑉 𝑋𝑋�

= 𝑋𝑋�−𝜇𝜇𝜎𝜎2𝑛𝑛

= 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

Sendo que Z tem distribuição normal com média igual a zero e variância igual a um, ou seja,

Z = 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

~𝑁𝑁 0,1

De acordo com a figura, vemos que 1-α é a probabilidade que a variável Z assuma um valor entre −𝑍𝑍∝ 2⁄ 𝑒𝑒 𝑍𝑍∝ 2⁄ 𝑒𝑒 ∝ é a probabilidade de Z não estar entre −𝑍𝑍∝ 2⁄ 𝑒𝑒 𝑍𝑍∝ 2⁄ . Assim, temos 𝑃𝑃 −𝑍𝑍∝ 2⁄ < 𝑍𝑍 < 𝑍𝑍∝ 2⁄ = 1 − α

Page 62: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

O valor de α é denominado nível de significância ou taxa de erro (usualmente com valor 0,05 ou 0,01), enquanto o valor 1-α representa o nível de confiança do intervalo.

Z = 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

~𝑁𝑁 0,1

Intervalo de confiança 𝜎𝜎2 conhecida

0,4

0,3

0,2

0,1

0,0

X

Den

sity

-2,576

0,005

2,576

0,005

0

Distribution PlotNormal; Mean=0; StDev=1

95 % de Confiança

99% de Confiança

Page 63: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Para obtenção dos valores de Z = 1,96 correspondentes à 95% de confiança e Z = 2,576 correspondente à 99% de confiança podemos utilizar também tabelas de distribuição Z, disponíveis em livros.

Intervalo de confiança 𝜎𝜎2 conhecida

Page 64: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Para obtenção dos valores de Z = 1,96 correspondentes à 95% de confiança e Z = 2,576 correspondente à 99% de confiança podemos utilizar também tabelas de distribuição Z, disponíveis em livros.

Intervalo de confiança 𝜎𝜎2 conhecida

Page 65: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Sabendo que Z = 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

em 𝑃𝑃 −𝑍𝑍∝ 2⁄ < 𝑍𝑍 < 𝑍𝑍∝ 2⁄ = 1 − α

Temos 𝑃𝑃 −𝑍𝑍∝ 2⁄ < 𝑋𝑋�−𝜇𝜇𝜎𝜎𝑛𝑛

< 𝑍𝑍∝ 2⁄ = 1 − α

Com o objetivo de construir um intervalo de confiança para a média da população, devemos isolar µ na expressão. Podemos alcançar este objetivo conforme é mostrado na expressão ao lado:

Intervalo de confiança 𝜎𝜎2 conhecida

Page 66: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Dai resulta a expressão do intervalo de confiança para a média de uma população:

𝑃𝑃 𝑋𝑋� − 𝑍𝑍∝ 2⁄𝜎𝜎𝑛𝑛

< 𝜇𝜇 < 𝑋𝑋� + 𝑍𝑍∝ 2⁄𝜎𝜎𝑛𝑛

= 1 − α

Este intervalo de confiança também pode ser expresso da seguinte forma: 𝐼𝐼𝐶𝐶 𝜇𝜇; 1 − 𝛼𝛼 : 𝑋𝑋� ± 𝑍𝑍∝ 2⁄

𝜎𝜎𝑛𝑛

Onde: 𝑋𝑋� : é o estimador de µ;

𝑍𝑍∝ 2⁄ : é o valor da variável Z que delimita a área ∝ 2⁄ ;

n ; é o tamanho da amostra;

σ : é o desvio padrão da população (parâmetro conhecido).

Intervalo de confiança 𝜎𝜎2 conhecida

Page 67: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança 𝜎𝜎2 conhecida

Page 68: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

É importante salientar que µ é um parâmetro (constante) e os limites do intervalo é que são aleatórios. Assim, a interpretação do intervalo ao nível 95% de confiança, por exemplo, deve ser da seguinte maneira: se pudéssemos construir uma quantidade grande de intervalos, todos baseados em amostras de tamanho n, 95% deles conteriam o parâmetro µ, como ilustra a figura.

Intervalo de confiança 𝜎𝜎2 conhecida

Page 69: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Observamos que, escolhida uma amostra e encontrada sua média 𝑋𝑋�0, podemos construir o intervalo 𝑋𝑋�0 − 𝑍𝑍∝ 2⁄

𝜎𝜎𝑛𝑛

< 𝜇𝜇 < 𝑋𝑋�0 + 𝑍𝑍∝ 2⁄𝜎𝜎𝑛𝑛

, mas este intervalo pode ou não conter o parâmetro µ. A probabilidade de que contenha o parâmetro µ é 1-α. Podemos verificar também que todos os intervalos com mesmo nível de confiança têm a mesma amplitude: 2𝑍𝑍∝ 2⁄

𝜎𝜎𝑛𝑛.

Na maioria dos casos não conhecemos, de fato, o parâmetro σ, pois não estudamos a população inteira. Entretanto, com base na propriedade de consistência dos estimadores, quando a amostra tem tamanho grande, a estimativa de um parâmetro é considerada suficientemente próxima do parâmetro. Assim, quando trabalhamos com grandes amostras a estimativa de σ, que é S (desvio padrão da amostra), pode ser usada no lugar do parâmetro.

Intervalo de confiança 𝜎𝜎2 conhecida

Page 70: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Consideramos a amostra suficientemente grande para utilizar a variável Z quando n é maior que 30. Duas pressuposições devem ser atendidas para a utilização desta metodologia: 1. A variável em estudo tem distribuição normal, 𝑋𝑋~𝑁𝑁 𝜇𝜇,𝜎𝜎2 . 2. A variância populacional é conhecida ou o tamanho da amostra é

suficientemente grande para obtenção de uma estimativa aproximada da variação populacional (σ).

Intervalo de confiança 𝜎𝜎2 conhecida

Page 71: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança - Exemplo Uma amostra de 100 terneiros de dois meses de idade da raça Ibagé apresentou peso médio de 65,5 kg e desvio padrão de 4,8 kg. Obtenha o intervalo de confiança, ao nível de 95%, para o verdadeiro peso médio de terneiros e redija a conclusão. Variável em estudo: X= peso de terneiros (kg) Pressuposições: 1) A variável em estudo tem distribuição normal; 2) A amostra tem tamanho suficiente para estimar σ. Estimativas: 𝑋𝑋�=65,5 kg S=4,8 kg ≅ 𝜎𝜎 n = 100 terneiros 𝑍𝑍∝ 2⁄ = 𝑍𝑍0,025 = 1,96

𝐼𝐼𝐶𝐶 𝜇𝜇; 1 − 𝛼𝛼 : 𝑋𝑋� ± 𝑍𝑍∝ 2⁄𝜎𝜎𝑛𝑛

𝐼𝐼𝐶𝐶 𝜇𝜇; 0,95 : 65,5 ± 1,964,8100

𝐼𝐼𝐶𝐶 𝜇𝜇; 0,95 : 65,5 ± 0,941 = 64,56 − 66,44 𝑃𝑃 64,56 < 𝜇𝜇 < 66,44 = 0,95

Page 72: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança - Exemplo

Para nível de confiança de 95% tem-se 𝑍𝑍∝ 2⁄ = 𝑍𝑍0,025 = 1,96 O valor 1,96 da distribuição padrão normal pode ser obtido pegando-se a probabilidade de 0,975 correspondente ao limite superior do intervalo de confiança, para este valor na tabela obtemos o valor de Z= 1,96. Verifique explicação mais detalhada em slide anterior. Para nível de confiança de 99% tem-se α=0,01 ∴ α/2 = 0,005 𝑍𝑍∝ 2⁄ = 𝑍𝑍0,005≅ 2,58 O valor 2,58 da distribuição padrão normal pode ser obtido pegando-se a probabilidade de 0,99506 (valor mais próximo de 0,995) correspondente ao limite superior do intervalo de confiança, para este valor na tabela obtemos o valor de Z= 2,58.

Page 73: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança - Exemplo 𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹 𝑹𝑹 𝑹𝑹𝒆𝒆𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝑹𝑹 𝒖𝒖𝑹𝑹𝒖𝒖𝑹𝑹𝑹𝑹𝑹𝑹 𝑹𝑹 𝑴𝑴𝒆𝒆𝑹𝑹𝒆𝒆𝑴𝑴𝒖𝒖𝑴𝑴, 𝒆𝒆𝑹𝑹𝒄𝒄 𝒖𝒖 𝒇𝒇𝑹𝑹𝒆𝒆𝒆𝒆𝒖𝒖𝒄𝒄𝑹𝑹𝑹𝑹𝒇𝒇𝒖𝒖 𝑹𝑹𝑹𝑹 𝒇𝒇𝑹𝑹𝑹𝑹𝒇𝒇𝑹𝑹 𝑹𝑹𝑹𝑹 𝒉𝒉𝒆𝒆𝒉𝒉𝒉𝒇𝒇𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹:

Page 74: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança - Exemplo 𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹 𝑹𝑹 𝑹𝑹𝒆𝒆𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝑹𝑹 𝒖𝒖𝑹𝑹𝒖𝒖𝑹𝑹𝑹𝑹𝑹𝑹 𝑹𝑹 𝑴𝑴𝒆𝒆𝑹𝑹𝒆𝒆𝑴𝑴𝒖𝒖𝑴𝑴, 𝒆𝒆𝑹𝑹𝒄𝒄 𝒖𝒖 𝒇𝒇𝑹𝑹𝒆𝒆𝒆𝒆𝒖𝒖𝒄𝒄𝑹𝑹𝑹𝑹𝒇𝒇𝒖𝒖 𝑹𝑹𝑹𝑹 𝒇𝒇𝑹𝑹𝑹𝑹𝒇𝒇𝑹𝑹 𝑹𝑹𝑹𝑹 𝒉𝒉𝒆𝒆𝒉𝒉𝒉𝒇𝒇𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹:

St Dev/ Raiz (n) = 4,8 / 10

Page 75: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança – Tamanho de Amostra

𝑶𝑶𝑴𝑴𝑹𝑹𝑹𝑹𝒆𝒆𝑹𝑹𝒖𝒖− 𝑹𝑹𝑹𝑹 𝒒𝒒𝒖𝒖𝑹𝑹 𝒖𝒖 𝒖𝒖𝒄𝒄𝒉𝒉𝑹𝑹𝒆𝒆𝒇𝒇𝒖𝒖𝑹𝑹𝑹𝑹 𝑹𝑹𝑹𝑹 𝑰𝑰𝑹𝑹𝒇𝒇𝑹𝑹𝒆𝒆𝑹𝑹𝒖𝒖𝑹𝑹𝑹𝑹 𝑹𝑹𝑹𝑹 𝑪𝑪𝑹𝑹𝑹𝑹𝒇𝒇𝒆𝒆𝒖𝒖𝑹𝑹𝑪𝒖𝒖 é 𝒉𝒉𝒆𝒆𝑹𝑹𝒉𝒉𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝑹𝑹𝑹𝑹𝒖𝒖𝑹𝑹 𝒖𝒖𝑹𝑹 𝑹𝑹𝒖𝒖𝑹𝑹𝑹𝑹𝒆𝒆 𝑹𝑹𝑹𝑹 𝑹𝑹 (𝑹𝑹𝒏𝒄𝒄𝑹𝑹𝒆𝒆𝑹𝑹 𝑹𝑹𝑹𝑹 𝒖𝒖𝒄𝒄𝑹𝑹𝑹𝑹𝒇𝒇𝒆𝒆𝒖𝒖𝑹𝑹). 𝑷𝑷𝑹𝑹𝒆𝒆𝒇𝒇𝒖𝒖𝑹𝑹𝒇𝒇𝑹𝑹 𝒉𝒉𝒖𝒖𝒆𝒆𝒖𝒖 determinar-se o número de amostras pode-se partir de uma amplitude de intervalo de confiança desejado.

Page 76: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança – Tamanho de Amostra – Nível de confiança

Page 77: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança 𝜎𝜎2 desconhecida Situação 2: Quando a variância da população 𝝈𝝈𝟐𝟐 é desconhecida

Quando a amostra é pequena, não podemos supor que o desvio padrão da amostra (S) seja uma estimativa suficientemente aproximada do parâmetro σ. Como não conhecemos a variância populacional, não podemos utilizar a variável Z, que tem distribuição normal padrão, para construir o intervalo de confiança para µ.

Nesse caso, em vez de Z, utilizamos a estatística “t” que não tem distribuição normal e sim distribuição t de Student, com parâmetro ν:

t = 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄ ~𝑡𝑡 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈 = 𝑛𝑛 − 1

Page 78: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança 𝜎𝜎2 desconhecida Situação 2: Quando a variância da população 𝝈𝝈𝟐𝟐 é desconhecida

Nesse caso, em vez de Z, utilizamos a estatística “t” que não tem distribuição normal e sim distribuição t de Student, com parâmetro ν:

t= 𝑋𝑋�−𝜇𝜇𝑆𝑆 𝑛𝑛⁄ ~𝑡𝑡 𝜈𝜈 , 𝑐𝑐𝑛𝑛𝑑𝑑𝑒𝑒 𝜈𝜈 = 𝑛𝑛 − 1

Onde: 𝑋𝑋�: é a média da amostra (estimador de µ);

S: é o desvio padrão da amostra (estimador de σ);

n: tamanho da amostra;

ν=n-1: é o número de graus de liberdade associados à variância da amostra 𝑆𝑆2.

Page 79: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Como já foi visto para a variável Z, podemos observar que 1-α é a probabilidade de que a variável t assuma um valor entre −𝑡𝑡∝ 2⁄ 𝑒𝑒 𝑡𝑡∝ 2⁄ 𝑒𝑒 ∝ é a probabilidade de t não estar entre −𝑡𝑡∝ 2⁄ 𝑒𝑒 𝑡𝑡∝ 2⁄ .

T = 𝑋𝑋�−𝜇𝜇𝑆𝑆𝑛𝑛

em 𝑃𝑃 −𝑡𝑡∝ 2⁄ < 𝑇𝑇 < 𝑡𝑡∝ 2⁄ = 1 − α

𝑃𝑃 −𝑡𝑡∝ 2⁄ <𝑋𝑋� − 𝜇𝜇𝑆𝑆𝑛𝑛

< 𝑡𝑡∝ 2⁄ = 1 − α

Intervalo de confiança 𝜎𝜎2 desconhecida

Page 80: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

T = 𝑋𝑋�−𝜇𝜇𝑆𝑆𝑛𝑛

em 𝑃𝑃 −𝑡𝑡∝ 2⁄ < 𝑇𝑇 < 𝑡𝑡∝ 2⁄ = 1 − α

𝑃𝑃 −𝑡𝑡∝ 2⁄ <𝑋𝑋� − 𝜇𝜇𝑆𝑆𝑛𝑛

< 𝑡𝑡∝ 2⁄ = 1 − α

Isolando o parâmetro µ na expressão, temos:

Intervalo de confiança 𝜎𝜎2 desconhecida

Page 81: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

𝑃𝑃 𝑋𝑋� − 𝑡𝑡∝ 2⁄𝑆𝑆𝑛𝑛

<𝑋𝑋� − 𝜇𝜇𝑆𝑆𝑛𝑛

< 𝑋𝑋� + 𝑡𝑡∝ 2⁄𝑆𝑆𝑛𝑛

= 1 − α

Donde resulta

𝐼𝐼𝐶𝐶 𝜇𝜇; 1 − 𝛼𝛼 :𝑋𝑋� ± 𝑡𝑡∝ 2⁄𝑆𝑆𝑛𝑛

Sendo 𝑡𝑡∝ 2⁄ o valor da estatística t que delimita a área ∝ 2⁄ . Este valor é encontrado na tabela da distribuição t de Student, a partir dos valores de ν e de α. Generalizando a expressão, temos:

𝐼𝐼𝐶𝐶 𝜃𝜃; 1 − 𝛼𝛼 : �̅�𝜃 ± 𝑡𝑡∝ 2⁄ 𝑆𝑆 �̂�𝜃 Assim, para o caso particular de 𝜃𝜃 = 𝜇𝜇, temos: �̂�𝜃 = 𝑋𝑋� e S �̂�𝜃 = 𝑆𝑆 𝑋𝑋� = 𝑆𝑆

𝑛𝑛

Intervalo de confiança 𝜎𝜎2 desconhecida

Page 82: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Generalizando a expressão, temos: 𝐼𝐼𝐶𝐶 𝜃𝜃; 1 − 𝛼𝛼 : �̂�𝜃 ± 𝑡𝑡∝ 2⁄ 𝑆𝑆 �̂�𝜃

Assim, para o caso particular de 𝜃𝜃 =𝜇𝜇, temos: �̂�𝜃 = 𝑋𝑋� e S �̂�𝜃 = 𝑆𝑆 𝑋𝑋� = 𝑆𝑆

𝑛𝑛

Para a utilização desta metodologia a seguinte pressuposição deve ser atendida: A variável em estudo tem distribuição normal: 𝑋𝑋~𝑁𝑁(𝜇𝜇,𝜎𝜎2). Devido à aproximação com a distribuição normal padrão a partir de ν=30, a estatística t, que tem distribuição t de Student, poderá ser utilizada para construir intervalos de confiança para a média, também quando a amostra for grande.

Intervalo de confiança 𝜎𝜎2 desconhecida

Page 83: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Através da amostra de tamanho 15 que segue, procura-se estimar a verdadeira potência média de aparelhos eletrônicos de alta sensibilidade medida em microwatts: 26,7; 25,8; 24,0; 24,9; 26,4; 25,9; 24,4; 21,7; 24,1; 25,9; 27,3; 26,9; 27,3; 24,8; 23,6.

Intervalo de confiança 𝜎𝜎2 desconhecida Exercício

272625242322

Median

Mean

26,526,025,525,024,524,0

1st Q uartile 24,100Median 25,8003rd Q uartile 26,700Maximum 27,300

24,421 26,179

24,137 26,588

1,163 2,504

A -Squared 0,32P-V alue 0,496

Mean 25,300StDev 1,588V ariance 2,521Skewness -0,664606Kurtosis 0,154023N 15

Minimum 21,700

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for Potencia

Page 84: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Variável em estudo: X=potência de aparelhos eletrônicos (µW); Pressuposição: A variável em estudo tem distribuição normal. 𝑋𝑋�=25,31µW Concluímos que a probabilidade de o intervalo de 24,44 µW a 26,18 µW conter a verdadeira potência média de aparelhos eletrônicos de alta sensibilidade é de 0,95. O valor 𝑡𝑡𝛼𝛼 2; 𝜈𝜈⁄ = 2,145 é obtido da tabela t student, 0,025 de probabilidade e 14 graus de liberdade.

Intervalo de confiança 𝜎𝜎2 desconhecida Exercício

S �̂�𝜃 = 𝑆𝑆 𝑋𝑋� =𝑆𝑆𝑛𝑛

=1,579

15= 0,4076

𝑆𝑆2 = 2,493 𝜇𝜇𝑊𝑊2 ⋯𝑆𝑆 = 2,493 = 1,579 𝜇𝜇𝑊𝑊⋯𝜈𝜈 = 𝑛𝑛 − 1= 15 − 1 = 14

𝑡𝑡𝛼𝛼 2; 𝜈𝜈⁄ = 2,145 𝐼𝐼𝐶𝐶 𝜃𝜃; 1 − 𝛼𝛼 : �̂�𝜃 ± 𝑡𝑡∝ 2⁄ 𝑆𝑆 �̂�𝜃

𝐼𝐼𝐶𝐶 µ; 0,95 : 25,31 ± 2,145𝑥𝑥𝑥,4076 𝐼𝐼𝐶𝐶 µ; 0,95 : 25,31 ± 0,874

LI = 25,31-0,874 = 24,44 LS = 25,31+0,874 = 26,18 𝑃𝑃 24,44 < 𝜇𝜇 < 26,18 = 0,95

Page 85: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

O software Minitab fornece uma série de informações sobre os dados que desejamos analisar.

Intervalo de confiança e outros dados no Minitab

Page 86: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança e outros dados no Minitab

Page 87: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança unilaterais

0,4

0,3

0,2

0,1

0,0

X

Den

sity

1,645

0,05

0

Distribution PlotNormal; Mean=0; StDev=1

0,4

0,3

0,2

0,1

0,0

X

Den

sity

-1,645

0,05

0

Distribution PlotNormal; Mean=0; StDev=1

Intervalos de confiança unilaterais podem ser calculados utilizando-se:

𝑋𝑋� ± 𝑍𝑍∝𝜎𝜎𝑛𝑛

𝑋𝑋� ± 𝑡𝑡∝𝑆𝑆𝑛𝑛

Page 88: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança unilaterais Cálculos no MiniTab para variância conhecida

less than e greater than = intervalos de confiança unilatearias not equal = intervalo de confiança bilateral

Page 89: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Intervalo de confiança unilaterais Cálculos no MiniTab para variância desconhecida

less than e greater than = intervalos de confiança unilatearias not equal = intervalo de confiança bilateral

Page 90: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Em muitos experimentos estamos interessados nas possíveis diferenças das médias das respostas de dois ou mais tratamentos.

Intervalo de confiança variância

pooled standard deviation A weighted average of the standard deviations of each true group. The pooled standard deviation provides an overall measure of the average spread of individual data points about their true group mean

Page 91: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Contudo, em alguns experimentos a comparação das variâncias é importante. Assim como para as médias podemos calcular o intervalo de confiança de uma variância, ou mesmo comparar diferentes variâncias. Na maioria das aplicações os valores de σ ou 𝜎𝜎2 são baseados em amostras de desvio padrão ou amostras de variância.

Intervalo de confiança variância

Page 92: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

De acordo com o teorema da variância, se 𝜎𝜎2 é a variância de uma amostra aleatória de tamanho n tomada de uma população normal tendo uma variância 𝜎𝜎2 , então: 𝜒𝜒2 = 𝑛𝑛−1 𝑆𝑆2

𝜎𝜎2= ∑ 𝑥𝑥𝑖𝑖−�̅�𝑥 2𝑛𝑛

𝑖𝑖=1𝜎𝜎2

É uma variável aleatória que possui uma distribuição qui quadrada com ν=n-1 Assim o intervalo de confiança da variância será:

𝜒𝜒21−𝛼𝛼 2⁄ <𝑛𝑛 − 1 𝑆𝑆2

𝜎𝜎2< 𝜒𝜒2𝛼𝛼 2⁄

Isolando 𝜎𝜎2 obtemos: 𝑛𝑛−1 𝑆𝑆2

𝜒𝜒2𝛼𝛼 2⁄ ;𝑛𝑛−1≤ 𝜎𝜎2 ≤ 𝑛𝑛−1 𝑆𝑆2

𝜒𝜒21−(𝛼𝛼 2)⁄ ;𝑛𝑛−1

Intervalo de confiança variância

Page 93: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Suponha que o índice de refração de 20 peças de vidro (selecionadas aleatoriamente de um lote) tem uma variância de 1,20 10−4. Construa o intervalo de confiança de 95% de σ do lote. Para 20-1= 19 graus de liberdade, 𝜒𝜒20,975 = 8,907 𝑒𝑒 𝜒𝜒20,025 = 32,852 , então substituindo na fórmula temos:

𝑛𝑛 − 1 𝑆𝑆2

𝜒𝜒2𝛼𝛼 2⁄ ;𝑛𝑛−1≤ 𝜎𝜎2 ≤

𝑛𝑛 − 1 𝑆𝑆2

𝜒𝜒21−(𝛼𝛼 2)⁄ ;𝑛𝑛−1

19 1,2 10−4

32,852≤ 𝜎𝜎2 ≤

19 1,2 10−4

8,907

0,000069< 𝜎𝜎2 < 0,000256 ou: 0,0083< 𝜎𝜎 < 0,0160

Intervalo de confiança variância - exercício

Page 94: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Suponha que o índice de refração de 20 peças de vidro (selecionadas aleatoriamente de um lote) tem uma variância de 1,20 10−4. Construa o intervalo de confiança de 95% de σ do lote. 0,000069< 𝜎𝜎2 < 0,000256 ou: 0,0083< 𝜎𝜎 < 0,0160 Isto significa que estamos 95% confiantes que o intervalo 0,0083< 𝜎𝜎 <0,0160 contém σ, o desvio padrão verdadeiro do índice de refração. Este método se aplica somente para amostras aleatórias de uma população normal, ou pelo menos a amostras aleatórias de populações próximas da normal.

Intervalo de confiança variância - exercício

Page 95: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Resolvendo o exercício utilizando-se o MiniTab com a variância

Intervalo de confiança variância - exercício

Page 96: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Resolvendo o exercício utilizando-se o MiniTab

Intervalo de confiança variância - exercício

Page 97: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Resolvendo o exercício utilizando-se o MiniTab com o desvio padrão.

Intervalo de confiança variância - exercício

Page 98: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Resolvendo o exercício utilizando-se o MiniTab

Intervalo de confiança variância - exercício

Page 99: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Muitos problemas lidam com proporções, percentagens ou probabilidades. Em um controle de qualidade estamos preocupados com a proporção de peças defeituosas em um lote. Em testes de vida estamos preocupados com o percentual de peças que irão além de um tempo de vida estabelecido. Em uma pesquisa eleitoral estamos interessados no percentual de um determinado candidato. Em muitas pesquisas médicas estamos interessados, muitas vezes, no percentual de eficácia de determinado remédio na população estudada. Podemos achar os intervalos de confiança das proporções de duas formas: 1) Considerando uma distribuição binomial ou 2) Considerando uma distribuição normal.

Intervalo de confiança de proporções

Page 100: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

A informação que temos disponível para avaliar a proporção é o número de vezes, 𝑋𝑋, que um evento ocorre em n tentativas, ocasiões ou observações. Portanto a proporção que um evento ocorre é: 𝑋𝑋

𝑛𝑛.

Caso as 𝑛𝑛 tentativas satisfação as condições de uma distribuição binomial, temos que a média é dado por 𝑛𝑛𝑝𝑝 e o desvio padrão é dado por 𝑛𝑛𝑝𝑝(1 − 𝑝𝑝).

Ou dividindo por 𝑛𝑛: 𝑑𝑑𝑚𝑑𝑑𝑑𝑑𝑎𝑎 = 𝑛𝑛.𝑝𝑝𝑛𝑛

= 𝑝𝑝 𝑑𝑑𝑒𝑒𝑠𝑠𝑑𝑑𝑑𝑑𝑐𝑐 𝑝𝑝𝑎𝑎𝑑𝑑𝑝𝑝𝑒𝑐𝑐 = 𝑛𝑛𝑝𝑝(1−𝑝𝑝)𝑛𝑛

=𝑝𝑝(1−𝑝𝑝)

𝑛𝑛.

A construção de um intervalo de confiança para o parâmetro 𝑝𝑝 , considerando 𝑝𝑝 um parâmetro de um distribuição binomial, envolve algumas aproximações e o uso de tabelas e curvas. Não é objetivo do nosso estudo apresentar como fazemos para obter o intervalo de confiança a partir de uma distribuição binomial.

Intervalo de confiança de proporções Distribuição Binomial

Page 101: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exemplo: Considerando x=4 em n=20, o intervalo de confiança de 95% para a proporção será obtido da seguinte forma no software Minitab:

Intervalo de confiança de proporções Distribuição Binomial

Page 102: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

No entanto para simplificar as coisas podemos assumir que a distribuição normal seja uma boa aproximação para a distribuição binomial, em certas condições, quais sejam:

𝑛𝑛.𝑝𝑝 𝑒𝑒 𝑛𝑛 1 − 𝑝𝑝 > 15 Assim para: 𝑛𝑛 = 50 a distribuição normal pode ser utilizada quando 𝑝𝑝 𝑒𝑒𝑠𝑠𝑡𝑡𝑒 𝑒𝑒𝑛𝑛𝑡𝑡𝑝𝑝𝑒𝑒 0,30 𝑒𝑒 0,70; 𝑛𝑛 = 100 a distribuição normal pode ser utilizada quando 𝑝𝑝 𝑒𝑒𝑠𝑠𝑡𝑡𝑒 𝑒𝑒𝑛𝑛𝑡𝑡𝑝𝑝𝑒𝑒 0,15 𝑒𝑒 0,85; 𝑛𝑛 = 200 a distribuição normal pode ser utilizada quando 𝑝𝑝 𝑒𝑒𝑠𝑠𝑡𝑡𝑒 𝑒𝑒𝑛𝑛𝑡𝑡𝑝𝑝𝑒𝑒 0,075 𝑒𝑒 0,925; Daqui para frente somente diremos que n tem que ser grande.

Intervalo de confiança de proporções Distribuição Normal

Page 103: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Assumindo n como sendo grande, ou seja suposições acima válidas, podemos construir um intervalo de confiança para um parâmetro binomial utilizando a distribuição normal. Assim podemos afirmar que com a probabilidade de 1-α a inequação abaixo será satisfeita.

−𝑧𝑧𝛼𝛼 2⁄ <𝑋𝑋 − 𝑛𝑛𝑝𝑝𝑛𝑛𝑝𝑝(1 − 𝑝𝑝)

< 𝑧𝑧𝛼𝛼 2⁄

Resolvendo a inequação quadrática, determinamos o intervalo de confiança de p, para um nível de confiança de (1-α)100%

𝑥𝑥𝑛𝑛− 𝑧𝑧𝛼𝛼 2⁄

𝑥𝑥𝑛𝑛 1−𝑥𝑥𝑛𝑛

𝑛𝑛< 𝑝𝑝 < 𝑥𝑥

𝑛𝑛+ 𝑧𝑧𝛼𝛼 2⁄

𝑥𝑥𝑛𝑛 1−𝑥𝑥𝑛𝑛

𝑛𝑛

Intervalo de confiança de proporções Distribuição Normal

Page 104: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exercício: Caso x=36 de n=100 pessoas pesquisadas sejam favoráveis a uma taxa de incentivo pela instalação de um dispositivo de economia de energia, determine o intervalo de confiança de 95% da proporção de favoráveis à taxa.

𝑥𝑥𝑛𝑛

=36

100= 0,36 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑧𝑧𝛼𝛼 2⁄ = 1,96

0,36 − 1,960,36 0,64

100< 𝑝𝑝 < 0,36 + 1,96

(0,36)(0,64)100

Ou 0,266 < 𝑝𝑝 < 0,454

Intervalo de confiança de proporções Distribuição Normal

Page 105: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exercício anterior no Minitab: Caso x=36 de n=100 pessoas pesquisadas.

Intervalo de confiança de proporções Distribuição Normal

Page 106: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exercício: Para x=4 em n=20 teremos o seguinte intervalo de confiança, considerando distribuição normal e usando o software Minitab.

Intervalo de confiança de proporções Distribuição Normal

Page 107: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Podemos dizer que o erro que cometemos quando usamos 𝑋𝑋𝑛𝑛 como um

estimador de 𝑝𝑝, ou seja 𝑋𝑋𝑛𝑛− 𝑝𝑝 . Novamente usando a aproximação

para a distribuição normal, temos uma probabilidade de (1-α) para a inequação: 𝑋𝑋𝑛𝑛− 𝑝𝑝 < 𝑧𝑧𝛼𝛼 2⁄

𝑝𝑝 1−𝑝𝑝𝑛𝑛

Assim podemos dizer que o erro será de:

𝐸𝐸 = 𝑧𝑧𝛼𝛼 2⁄𝑝𝑝 1 − 𝑝𝑝

𝑛𝑛

Intervalo de confiança de proporções Distribuição Normal

Page 108: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exercício: Em uma pesquisa feita em uma cidade grande, 136 de 400 pessoas pesquisadas, se mostraram satisfeitas com o transporte público. Com 99% de confiança oque podemos dizer a respeito do máximo erro da pesquisa?

𝑥𝑥𝑛𝑛

=136400

= 0,34 𝑝𝑝𝑎𝑎𝑝𝑝𝑎𝑎 𝑧𝑧𝛼𝛼 2⁄ =2,575

E = 𝑧𝑧𝛼𝛼 2⁄𝑝𝑝 1 − 𝑝𝑝

𝑛𝑛= 2,575

(0,34)(0,66)400

= 0,061

Ou seja teremos (0,34±0,061)% de pesquisados que estão satisfeitas com o transporte público, para um nível de confiança de 99%.

Intervalo de confiança de proporções Distribuição Normal

Page 109: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Podemos utilizar a fórmula do erro E para estimar o tamanho da

amostragem. E = 𝑧𝑧𝛼𝛼 2⁄𝑝𝑝 1−𝑝𝑝

𝑛𝑛 ⋯𝑛𝑛 = 𝑝𝑝(1 − 𝑝𝑝) 𝑧𝑧𝛼𝛼 2⁄

𝐸𝐸

2

Como não conhecemos a priori o valor de p, podemos assumir p=1/2 e

utilizar a fórmula n = 14

𝑧𝑧𝛼𝛼 2⁄

𝐸𝐸

2

Embora a fórmula possa nos levar a valores de n maiores do que o necessário.

Intervalo de confiança de proporções Distribuição Normal

Page 110: Aula 1 –Planejamento e Análise de Experimentos€¦ · Revisão da aula anterior Condições de simetria Identificação de valores discrepantes Box plot (𝑄𝑄 1 −𝐸𝐸

Exercício: Suponha que queremos estimar a proporção de peças defeituosas em uma carregamento de tijolos. Queremos uma confiança de 95% para um erro de 0,04. Qual o tamanho da amostragem?

a) Usando-se a fórmula simplificada n = 14

𝑧𝑧𝛼𝛼 2⁄

𝐸𝐸

2= 1

41,960,04

2= 600,25

ou n=601 arredondando para i inteiro mais próximo. b) Sabendo-se que p não excede 0,12, usando a fórmula completa:

𝑛𝑛 = 𝑝𝑝 1 − 𝑝𝑝𝑧𝑧𝛼𝛼 2⁄

𝐸𝐸

2= 0,12 0,88

1,960,04

2= 253,55

ou n=254. O exemplo serve para demostrar a diminuição do número de amostras quando temos uma informação adicional sobre o valor de p.

Intervalo de confiança de proporções Distribuição Normal