métodos estocásticos da engenharia ii - capítulo 3

76
Métodos Estocásticos da Engenharia II Capítulo 3 - Distribuições Amostrais e Estimação Pontual de Parâmetros Prof. Magno Silvério Campos 2019/2 (UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 1 / 75

Upload: others

Post on 29-Oct-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Métodos Estocásticos da Engenharia IICapítulo 3 - Distribuições Amostrais e Estimação Pontual de

Parâmetros

Prof. Magno Silvério Campos

2019/2

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 1 / 75

Bibliografia

Bibliografia

Essas notas de aulas foram baseadas nas seguintes obras:1 CANCHO, V.G. Notas de Aulas sobre Noções de Estatística e

Probabilidade. São Paulo: USP, 2010.2 HINES, W.W.; et al. Probabilidade e Estatística na Engenharia. 4.

ed. Rio de Janeiro: LTC, 2006.3 MONTGOMERY, D.C.; RUNGER, G.C. Estatística Aplicada e

Probabilidade para Engenheiros. 6. ed. Rio de Janeiro: LTC, 2016.

Aconselha-se pesquisá-las para se obter um maior aprofundamento e ummelhor aproveitamento nos estudos.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 2 / 75

Conteúdo Programático

Conteúdo Programático

1 Seção 1 - Introdução2 Seção 2 - Conceitos gerais de estimação pontual3 Seção 3 - Método da Máxima Verossimilhança4 Seção 4 - Distribuições amostrais

Distribuição da média amostral;Teorema do Limite Central;Distribuição da diferença de duas médias amostrais;Distribuição amostral de uma proporção amostral.

5 Seção 5* - Outras distribuições utilizadas na inferência estatísticaDistribuição Qui-quadrado;Distribuição t-Student;Distribuição F-Snedecor;

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 3 / 75

Seção 1 - Introdução

Introdução

AmostraSe uma população for numerosa, talvez não seja possível estudar cadaum dos seus elementos. Portanto, é muito difícil ter uma informaçãocompleta sobre ela. Nesses casos, recorre-se à informação proporcionadapor uma parte finita da população, denominada amostra.

Uma amostra aleatória tem a propriedade de refletir as característicasda população da qual foi sorteada.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 4 / 75

Seção 1 - Introdução

Esquema geral

θ

Θ

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 5 / 75

Seção 1 - Introdução

Amostra aleatória - [Montgomery e Runger(2016)]As variáveis aleatórias X1, X2, . . . , Xn constituem uma amostra

aleatória de tamanho n de uma população X ∼ f(x, θ), se: (a) cada Xi

é uma variável aleatória independente e (b) cada Xi tem a mesmadistribuição de probabilidade f(x, θ).

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 6 / 75

Seção 1 - Introdução

Amostra aleatória- [Cancho(2010)]A definição de amostra aleatória é satisfeita nos seguintes casos:

1 Quando a amostra provem de uma população infinita e quando aamostra é sorteada ao acaso com reposição de uma populaçãofinita.

2 Quando se sorteia a amostra sem reposição de uma populaçãofinita, evidentemente não se satisfaz a definição de amostraaleatória, pois as variáveis aleatórias X1, . . . , Xn não sãoindependentes. Porém, se o tamanho da amostra é muito pequenoem comparação com o tamanho da população, a definição ésatisfeita aproximadamente.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 7 / 75

Seção 1 - Introdução

Estimadores pontuais - ([Montgomery e Runger(2016)]Em geral, se X for uma variável aleatória com distribuição de proba-bilidades f(x), caracterizada por um parâmetro desconhecido θ, e seX1, X2, . . . , Xn for uma amostra aleatória de tamanho n, então a esta-tística Θ = h(X1, X2, . . . , Xn) é chamada de um estimador pontual deθ.

Note que:

Θ é uma variável aleatória, porque ela é função de variáveis aleatórias.

Exemplo - ([Montgomery e Runger(2016)]Suponha que a variável aleatória X seja normalmente distribuída, comuma média desconhecida µ. A média da amostra é um estimador damédia desconhecida µ da população. Isto é,

µ = X

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 8 / 75

Seção 1 - Introdução

Estimativas pontuais

Depois da amostra ter sido escolhida, Θ assume um valor numérico θ,denominado estimativa pontual de θ.

ExemploNo exemplo anterior, depois da amostra ter sido escolhida, o valor nu-mérico x é a estimativa pontual de µ. Assim, se x1 = 30, x2 = 20, x3 =15, x4 = 40 e X5 = 25, então a estimativa de µ é

x = 30+20+15+40+255 = 26

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 9 / 75

Seção 1 - Introdução

Analogamente, se a variância da população σ2 for também desconhecida,um estimador pontual para σ2 será a variância da amostra S2 e o valornumérico deste, calculado a partir dos dados da amostra, é chamado deestimativa pontual de σ2.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 10 / 75

Seção 1 - Introdução

Problemas de estimação frequentes em engenharia

Geralmente, necessitamos estimar:a média µ de uma população;a variância σ2 de umapopulação;a proporção p de itens emuma população quepertencem a uma classe deinteresse;a diferença nas médias deduas populações, µ1 − µ2;a diferença nas proporções deduas populações, p1 − p2;entre outros.

Estimativas pontuais razoáveis:Para µ, a estimativa é µ = x, amédia da amostra;Para σ2, a estimativa é σ2 = s2,a variância da amostra;Para p, a estimativa é p = x/n,a proporção da amostra;Para µ1 − µ2, a estimativa éµ1 − µ1 = x1 − x2, a diferençaentre as médias de duas AAI;Para p1 − p2, a estimativa ép1 − p2, a diferença entre asproporções de duas AAI.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 11 / 75

Seção 2 - Conceitos gerais de estimação pontual

Conceitos gerais de estimação pontual

[1] - Tendência de um estimador

O estimador Θ é um estimador não-tendencioso para o parâmetro θ, se

E(Θ) = θ

Se o estimador for tendencioso, então a tendência é dada por:

E(Θ)− θ.

Exemplo: mostrar que a média amostral X é um estimador não tenden-cioso da média populacional, µ.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 12 / 75

Seção 2 - Conceitos gerais de estimação pontual

[2] - Variância de um estimador

Embora possam existir muitos estimadores Θ não tendenciosos para oparâmetro θ, deve-se escolher aquele que tiver variância mínima, isto é,o Estimador Não Tendencioso de Variância Mínima (ENTVM) é o maisprovável de produzir uma estimativa mais próxima do valor verdadeirode θ.

θ

Distribuição de Θ1

Distribuição de Θ2

Exemplo: considere dois estimadores para a média populacional, µ: amédia amostral, X, e uma única observação, Xi, proveniente da amostra.Neste caso, qual dos dois é melhor?

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 13 / 75

Seção 2 - Conceitos gerais de estimação pontual

[3] - Erro-padrão de um estimador

O erro-padrão de um estimador Θ é o seu desvio-padrão, isto é,

σΘ =

√V (Θ).

Essa é uma medida de precisão da estimação muito útil. Caso sejamutilizadas estimativas amostrais, a notação muda para σΘ = SE(Θ).

Exemplo: considere uma amostra aleatória proveniente de uma popula-ção normal com média µ e variância σ2. Determine o erro-padrão damédia amostral, X, para os casos de variância σ2 conhecida ou desco-nhecida.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 14 / 75

Seçao 3 - Método da Máxima Verossimilhança

Método da Máxima Verossimilhança

Existem alguns métodos de estimação pontual conhecidos na literaturaestatística. Um dos melhores métodos para obter estimadores pontuaisde parâmetros populacionais é o Método da Máxima Verossimilhança,que veremos a seguir.

Seja X uma variável aleatória que segue uma distribuição de probabili-dades f(x,Θ), onde Θ é um vetor de parâmetros θ desconhecidos.

Sejam x1, x2, . . . , xn os valores observados em uma amostra aleatória detamanho n. A função de verossimilhança da amostra é definida como:

L(Θ) = f(x1,Θ) · f(x2,Θ) · . . . · f(xn,Θ).

A função acima informa sobre a possibilidade (verossimilhança) de avariável X assumir os valores x1, x2, . . . , xn; Para o caso de VAD, a ve-rossimilhança é um valor de probabilidade.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 15 / 75

Seçao 3 - Método da Máxima Verossimilhança

A função de verossimilhança é função apenas do parâmetro desconhecidoΘ. O Estimador de Máxima Verossimilhança (EMV) de Θ é ovalor de Θ que maximiza L(Θ). Tal valor é obtido derivando L(Θ) emrelação a Θ e igualando o resultado a 0.

Fato: L(Θ) e lnL(Θ) apresentam seus máximos no mesmo valor de Θ.Assim,

∂L(Θ)

∂Θ= 0 ⇒ ∂ ln (Θ)

∂Θ= 0

O Estimador de Máxima Verossilmilhança (Θ) apresenta, em geral, pro-priedades assintóticas favoráveis:

Θ é não tendencioso para valores grandes de n;Θ apresenta uma variância tão pequena quanto possível de serobtida com qualquer outro estimador;Θ tem distribuição aproximadamente normal.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 16 / 75

Seçao 3 - Método da Máxima Verossimilhança

Exemplo 1 - [Montgomery e Runger(2016)]Tempos até a falha de certo equipamento eletrônico seguem uma distri-buição exponencial com parâmetro λ e fdp dada por:

f(x, λ) =

{λe−λx, x ≥ 0

0, x < 0(1)

Obtenha o estimador de máxima verossimilhança de λ.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 17 / 75

Seçao 3 - Método da Máxima Verossimilhança

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 18 / 75

Seçao 3 - Método da Máxima Verossimilhança

Exercício - [Montgomery e Runger(2016)]Os tempos até a falha de um certo equipamento eletrônico seguem umadistribuição exponencial. Os tempos até a falha desse equipamento foramanotados de forma contínua, obtendo-se os seguintes valores:

48; 80; 122; 188; 189; 220; 253; 311; 325; 358; 490; 495; 513; 723; 773;879; 1510; 1674; 1809; 2005; 2028; 2038; 2870; 3103; 3205.

Determine a estimativa de λ de acordo com o método da máxima veros-similhança.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 19 / 75

Seçao 3 - Método da Máxima Verossimilhança

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 20 / 75

Seçao 3 - Método da Máxima Verossimilhança

Exemplo 2 - [Montgomery e Runger(2016)]Considere uma variável aleatória normalmente distribuída, com parâme-tros µ e σ2 desconhecidos, com fdp dada por:

f(x, µ, σ2) =1

σ√

2πe−(x−µ)2/(2σ2), −∞ < x <∞. (2)

Obtenha os estimadores de máxima verossimilhança para µ e σ2.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 21 / 75

Seçao 3 - Método da Máxima Verossimilhança

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 22 / 75

Seçao 3 - Método da Máxima Verossimilhança

Observação 1:Para utilizar a estimação pelo Método da Máxima Verossimilhança, é ne-cessário o conhecimento da distribuição de probabilidades da população.

Observação 2:Complicações podem surgir na obtenção do máximo da função de veros-similhança, tornando necessário o emprego de métodos computacionaisavançados.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 23 / 75

Seção 4 - Distribuições amostrais

Distribuição da média amostral

Se de uma população com média µX e variância σ2X se extraem amostras

aleatórias de tamanho n e para cada amostra determina-se a média

X =1

n

n∑i=1

Xi,

então a média e variância da variável X são dadas por:

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 24 / 75

Seção 4 - Distribuições amostrais

a) Se a amostragem é com reposição de uma população finita (ouamostragem com ou sem reposição em uma população infinita).

µX = µX e σ2X =

σ2X

n

b) Se a amostragem é sem reposição de uma população finita com Nelementos.

µX = µX e σ2X =

σ2X

n

[N − nN − 1

]ObservaçãoSe a fração de amostragem f = n

N é pequena (f < 0, 1) e o tamanhoda população (N) é grande, a variância da média amostral em (b) éaproximada com a expressão do caso (a), isto é,

σ2X =

σ2X

n

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 25 / 75

Seção 4 - Distribuições amostrais

ExemploConsidere os seguintes níveis X de estoque para 4 produtos em um de-terminado dia:

Produto A B C DX 0 2 0 1

Obter a média e a variância da média amostral para amostragem comou sem reposição, quando n = 2.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 26 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 27 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 28 / 75

Seção 4 - Distribuições amostrais

Forma da distribuição da média amostral quando apopulação é normal

Seja X uma variável aleatória que tem uma distribuição normal commédia µX e variância σ2

X . Se desta distribuição selecionam-se amostrasaleatórias de tamanho n, a média amostral,

X =1

n

n∑i=1

Xi,

é uma combinação linear de variáveis Xi, todas elas com distribui-ção N(µX , σ

2X) e independentes entre si (o fato da distribuição de X

ser normal presume, em rigor que a população é infinita e que, por-tanto, não há diferença entre escolher uma amostra com e sem reposição[Cancho(2010)].

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 29 / 75

Seção 4 - Distribuições amostrais

Vale relembrar que:

Combinação linear de variáveis aleatórias normaisSejam X1, . . . , Xn, n variáveis aleatórias independentes onde Xi ∼N(µi;σ

2i ) para i = 1, . . . , n e sejam a1, . . . , an constantes reias. Seja

a variável aleatória Y uma combinação linear das variáveis aleatóriasnormais, X1, . . . , Xn. Isto é,

Y = a1X1 + a2X2 + · · ·+ anXn.

Então a variável aleatória Y tem distribuição normal com média

µY = a1µ1 + a2µ2 · · ·+ anµn =

n∑i=1

aiµi

e variância

σ2Y = a2

1σ21 + a2

2σ22 · · ·+ a2

nσ2n =

n∑i=1

a2iσ

2i .

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 30 / 75

Seção 4 - Distribuições amostrais

Ou seja:Uma combinação linear de variáveis normais independentes também énormal!

Portanto,a média amostral segue uma distribuição normal com média µX e vari-ância, σ

2Xn . Isto é,

X ∼ N(µX , σ2X/n).

Embora este resultado seja de extrema importância, ele é relativamentelimitado, já que, somente permite especificar a distribuição da médiaamostral no caso de uma população normal.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 31 / 75

Seção 4 - Distribuições amostrais

Forma da distribuição da média amostral quando apopulação é normal

Exemplo - [Montgomery e Runger(2016)]Uma empresa fabrica resistores que têm uma resistência média de 100ohms e um desvio-padrão de 10 ohms. A distribuição de resistência énormal. Encontre a probabilidade de uma amostra aleatória de n = 25resistores ter uma resistência média menor que 95 ohms.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 32 / 75

Seção 4 - Distribuições amostrais

Forma da distribuição da média amostral quando apopulação não é normal

Observação 1Muitas vezes não temos informação a respeito da distribuição das variá-veis que constituem a amostra, fato que nos impede de utilizar o resultadoapresentado.

Observação 2Felizmente, satisfeitas certas condições, pode ser mostrado que para umaamostra suficientemente grande, a distribuição de probabilidade da médiaamostral pode ser aproximada por uma distribuição normal, com médiae variância iguais àquelas calculadas anteriormente. Este fato é um dosteoremas mais importantes da estatística e probabilidade e é denominadoo Teorema do Limite Central [Montgomery e Runger(2016)].

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 33 / 75

Seção 4 - Distribuições amostrais

Forma da distribuição da média amostral quando apopulação não é normal

Teorema do Limite CentralSe X1, X2, . . . , Xn for uma amostra aleatória de tamanho n, retirada deuma população (finita ou infinita), com média µ e variância σ2, e seX for a média da amostra, então X tem distribuição aproximadamentenormal com média µX e variância σ2

X/n, para n suficientemente grande(n→∞). Isto é,

Z =X − µXσX/√n

n→∞−→ N(0, 1).

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 34 / 75

Seção 4 - Distribuições amostrais

Teorema do Limite CentralA aproximação normal para X depende do tamanho n da amostra. Afigura a seguir mostra a distribuição obtida para 1000 arremessos dedados:

(a) (b) (c)

(d) (e) (f)

as figuras de (a) a (f) mostram, respectivamente, a distribuição das médias obtidaspara o arremesso de 1, 2, 3, 5, 10 e 20 dados.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 35 / 75

Seção 4 - Distribuições amostrais

Observações1 Em muitos casos de interesse prático, se n ≥ 30, a aproximação

normal será satisfatória, independentemente da forma dapopulação;

2 Se n < 30, o teorema do limite central funcionará, se a distribuiçãoda população não for muito diferente da normal.

Quando está presente uma considerável assimetria, de acordo com[Montgomery e Runger(2016)], a aplicação do teorema do limite centralpara a descrição da distribuição amostral deve ser interpretada com cui-dado!

Uma regra empírica que tem sido usada com sucesso em pesquisas poramostragem, onde é comum tal comportamento da variável (β3), é que

n > 25.(β3)2.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 36 / 75

Seção 4 - Distribuições amostrais

Exemplo 1 - [Cancho(2010)]Suponha que na produção em série de um artigo, a massa é uma va-riável aleatória com uma média de 950 g e uma variância de 1600 g2.Selecionam-se aleatoriamente e com reposição 36 artigos. Calcular aprobabilidade da média amostral ser maior que 965 g.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 37 / 75

Seção 4 - Distribuições amostrais

Exemplo 2 - [Montgomery e Runger(2016)]Suponha que uma variável aleatória X tenha uma distribuição contínuauniforme

f(x) =

{1/2, se 4 ≤ x ≤ 60, caso contrário.

Encontre a distribuição da média de uma amostra aleatória de tamanhon = 40.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 38 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 39 / 75

Seção 4 - Distribuições amostrais

Distribuição da diferença de duas médias amostrais

Seja X1, X2, . . . , Xn1 uma amostra aleatória de tamanho n1 de uma po-pulação com característica X que tem distribuição normal com média µ1

e variância σ21.

Seja também, Y1, Y2, . . . , Yn2 outra amostra aleatória de tamanho n2, deuma população com a característica Y que tem distribuição normal commédia µ2 e variância σ2

2.

Se X e Y são independentes, então a diferença amostral X − Y temdistribuição normal com média µ1 − µ2 e variância σ2

1n1

+σ22n2. Isto é,

Z =X − Y − (µ1 − µ2)√

σ21n1

+σ22n2

∼ N(0, 1). (3)

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 40 / 75

Seção 4 - Distribuições amostrais

ObservaçãoSe as populações onde foram retiradas as amostras não tiverem distri-buição normal, pelo teorema do limite central, segue válido o resultadose os tamanhos amostrais n1 e n2 forem suficientemente grandes, isto én1 ≥ 30 e n2 ≥ 30.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 41 / 75

Seção 4 - Distribuições amostrais

Exemplo - [Montgomery e Runger(2016)]A vida de um componente usado em um motor de uma turbina de umavião é uma variável aleatória, com média de 5000 horas e desvio-padrãode 40 horas. A distribuição da vida é aproximada pela distribuição nor-mal.

O fabricante do motor introduz uma melhoria no processo de fabricaçãopara esse componente, que aumenta a vida média para 5050 horas e dimi-nui o desvio-padrão para 30 horas. Considere novamente a normalidadepara essa nova vida.

Suponha que uma amostra aleatória de n = 16 componentes seja selecio-nada do processo antigo e uma amostra aleatória dem = 25 componentesseja selecionada do processo novo.

Qual é a probabilidade de que a diferença nas duas médias amostraisX2− X1 seja no mínimo de 25 horas? Considere que o processo antigo eo melhorado possam ser considerados como populações independentes.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 42 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 43 / 75

Seção 4 - Distribuições amostrais

Distribuição amostral de uma proporção amostral

Considere uma população dicotômica, constituída apenas por elementosde dois tipos, isto é, cada elemento pode ser classificado como sucessoou fracasso. Suponha que a probabilidade de sucesso seja p e de fracassoseja q = 1− p.

Dessa população retira-se uma amostra aleatória de n observações,X1, . . . , Xn, onde

Xi =

{1, se sucesso0, caso contrário.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 44 / 75

Seção 4 - Distribuições amostrais

Seja a variável aleatória Y que conta o no de sucessos na amostra. Então:

1 Y =n∑i=1

Xi tem distribuição Binomial com parâmetros n e p.

2 A proporção amostral de sucessos é: p = Yn =

n∑i=1

Xi/n = X. De

(1), a distribuição de probabilidade de p é:

P (p =y

n) = P (

Y

n=y

n) = P (Y = y) =

(n

y

)py(1− p)n−y.

E para n suficientemente grande ( teorema do limite central), aproporção amostral tem distribuição aproximadamente normal commédia p e variância pq

n . Isto é,

p ∼ N(p,pq

n).

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 45 / 75

Seção 4 - Distribuições amostrais

Exemplo - [Cancho(2010)]Uma empresa tem um número grande de funcionários. A probabilidadede que um empregado selecionado ao acaso, participe de um programade treinamento é 0,40.(a) Se 10 funcionários são escolhidos ao acaso, qual é a probabilidade

que proporção de participantes seja(a1) exatamente 60%?(a2) pelo menos 80%?

(b) suponha que 100 funcionários são escolhidos ao acaso. Qual é aprobabilidade de que a proporção amostral de participantes doprograma seja maior que 50%?

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 46 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 47 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 48 / 75

Seção 4 - Distribuições amostrais

ObservaçãoOs resultados acima são válidos também nos seguintes casos:

1 Para uma população infinita, qualquer que seja o tipo deamostragem.

2 Para população finita, com amostragem com reposição.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 49 / 75

Seção 4 - Distribuições amostrais

Se a amostragem é sem reposição, em uma população finita de N ele-mentos, a distribuição exata de probabilidade p é uma distribuição Hi-pergeométrica. Isto é,

P (p =y

n) =

(My

)(N−Mn−y

)(Nn

) (4)

A variância de p é ajustada através do fator de correção de populaçãofinita, isto é,

V ar(p) =pq

n

(N − nN − 1

).

Se, n é suficientemente grande, pelo teorema central do limite, a variávelaleatória,

Z =p− p√pqn (N−nN−1 )

,

tem distribuição aproximadamente normal padrão.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 50 / 75

Seção 4 - Distribuições amostrais

Exemplo - [Cancho(2010)]

Informações anteriores mostram que 10% do lote de peças para uma má-quina são defeituosas. Suponha que um lote de 5000 peças foi adquirido.Seleciona-se uma amostra de 400 peças, ao acaso e sem reposição. Quala probabilidade da amostra ter:(a) entre 9% e 10% de peças defeituosas?(b) menos de 8% de peças defeituosas?

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 51 / 75

Seção 4 - Distribuições amostrais

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 52 / 75

Seção 5* - Outras distribuições...

Distribuição Qui-quadrado (χ2)

Sejam Z1, Z2, . . . , Zk variáveis aleatórias distribuídas normalmente e in-dependentes com média µ = 0 e variância σ2 = 1. A variável aleatória

W = Z21 + Z2

2 + · · ·+ Z2k (5)

tem distribuição Qui-quadrado com k graus de liberdade e sua função dedensidade é dada por:

f(w) =1

Γ(k/2)2k/2wk2−1e−

w2 , w > 0 (6)

onde Γ(a) é uma função matemática definida

Γ(a) =

∫ ∞0

xa−1e−xdx, para a > 0,

chamada de função gama.(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 53 / 75

Seção 5* - Outras distribuições...

Essa função satisfaz às seguintes propriedades:

Γ(a) = (a− 1)Γ(a− 1)

Γ(a) = (a− 1)!, para a inteiroΓ(1/2) =

√π

Γ(1) = 0! = 1

O gráfico da distribuição Qui-quadrado para k = 2, 3, 5, 10 e 15 graus deliberdade é mostrado na figura a seguir:

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 54 / 75

Seção 5* - Outras distribuições...

Distribuição χ2(k)

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 55 / 75

Seção 5* - Outras distribuições...

A notação W ∼ χ2(k) é usada para indicar que a variável W tem distri-

buição Qui-quadrado com k graus de liberdade.

Propriedades

Se W ∼ χ2(k)

(a) E(W ) = k e V ar(W ) = 2k.

(b) A distribuição é assimétrica direita.(c) A medida que aumentam-se os graus de liberdade, torna-se

simétrica.

Uso da tabela Qui-quadrado

Na tabela χ2(k), tem-se os pontos críticos da distribuição W ∼ χ2

(k), de-notado por χ2

α,k tal que a probabilidade

P (W > χ2α,k) =

∫ ∞χ2α,k

f(w)dw

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 56 / 75

Seção 5* - Outras distribuições...

Pontos críticos χ2α,k das distribuições χ2

(k)

A probabilidade

P (W > χ2α,k) =

∫ ∞χ2α,k

f(w)dw = α

é representada pela área sombreada da figura.(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 57 / 75

Seção 5* - Outras distribuições...

Para ilustrar o uso da tabela χ2(k), observe que as áreas α estão na pri-

meira linha e na primeira coluna estão os graus de liberdade k. Portanto,o valor de χ2 com 10 graus de liberdade e com área (probabilidade) 0,05à direita é χ2

0,05,10 = 18, 31. Isto é,

P (W > χ20,05,10) = P (W > 18, 31) = 0, 05.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 58 / 75

Seção 5* - Outras distribuições...

Exemplo 1 - [Cancho(2010)]

Se X é uma variável aleatória χ2(17), então obtenha:

(a) P (X ≥ 8, 67);

(b) P (X ≤ 8, 67);

(c) P (6, 41 < X < 27, 59);

(d) o valor de a tal que P (X < a) = 0, 025.

Exemplo 2 - [Cancho(2010)]

Se X é uma variável aleatória χ2(4), então obtenha P (X ≥ 7, 932);

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 59 / 75

Seção 5* - Outras distribuições...

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 60 / 75

Seção 5* - Outras distribuições...

Propriedade reprodutivaSe W1,W2, . . . ,Wn são variáveis aleatórias independentes distribuídascada uma com distribuição Qui-quadrado com k1, k2, . . . , kn graus deliberdade respectivamente, então, a variável

W = W1 +W2 + · · ·+Wn

tem distribuição Qui-quadrado com k =n∑i=1

ki graus de liberdade

ExemploSe W1, W2 e W3 são variáveis aleatórias independentes com distribuiçãoQui-quadrado respectivamente com 4, 7 e 9 graus de liberdade respecti-vamente, então W = W1 +W2 +W3 ∼ χ2

(20).

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 61 / 75

Seção 5* - Outras distribuições...

Distribuição t-Student

Sejam Z e W duas variáveis independentes com distribuição normal pa-drão e Qui-quadrado com k graus de liberdade, respectivamente. A va-riável aleatória,

T =Z√Wk

tem distribuição t-Student com k graus de liberdade. A função de den-sidade de probabilidade é dado por:

f(t) =Γ(k+1

2 )

(kπ)1/2Γ(k2 )

(1 +

t2

k

)−(k+1)/2

A notação T ∼ t(k) é usada para indicar que a variável T tem distribuiçãot-Student com k graus de liberdade.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 62 / 75

Seção 5* - Outras distribuições...

Na figura abaixo é apresentado o gráfico da função de densidade de pro-babilidade, para k = 1, 2, 5 e 10 graus de liberdade.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 63 / 75

Seção 5* - Outras distribuições...

Propriedades Se T ∼ t(k).

(a)

E(T ) = 0

V ar(T ) =k

k − 2, k > 2

(b) A distribuição é simétrica em torno de sua média.(c) Se k →∞, T ∼ N(0, 1).

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 64 / 75

Seção 5* - Outras distribuições...

Uso da tabela t-StudentA tabela t-Student proporciona os pontos críticos da distribuição t-Student. Seja tα,k o valor da variável aleatória T com k graus de li-berdade para o qual tem-se uma área (probabilidade) α. Portanto, tα,ké um ponto crítico na cauda superior da distribuição t-Student com kgraus de liberdade. Este ponto crítico aparece na figura abaixo.

A probabilidade

P (T > tα,k) =

∫ ∞tα,k

f(t)dt = α

é representada pela área sombreada da figura.(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 65 / 75

Seção 5* - Outras distribuições...

Na tabela t-Student, os valores de α encontram-se na primeira linha databela, enquanto os graus de liberdade aparecem na primeira coluna daparte esquerda. Para ilustrar o uso da tabela, observe que o valor det-Student com 10 graus de liberdade que tem área de 0,05 à direita ét0,05,10. Isto é,

P (T > t0,05,10) = P (T > 1, 812) = 0, 05

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 66 / 75

Seção 5* - Outras distribuições...

Como, a distribuição t-Student é simétrica em relação a zero (média),tem-se que t1−α,k = −tα,k. Isto é, o valor da variável T que correspondea uma área igual (1−α) à direita (e, portanto, uma área de α à esquerda)é igual ao negativo do valor de T, que tem área α na cauda direita dadistribuição. Em conseqüência, t0,95,10 = −t0,05,10 = −1, 812.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 67 / 75

Seção 5* - Outras distribuições...

Exemplo - [Cancho(2010)]Seja T uma variável aleatória com distribuição t-Student com 12 grausde liberdade. Determine:(a) P (T > −1, 356)

(b) P (0, 695 < T < 2, 179)

(c) P (−2, 179 < T < 2)

(d) P (−1, 782 < T < 1, 782)

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 68 / 75

Seção 5* - Outras distribuições...

Distribuição F-Snedecor

Seja W1 uma variável aleatória com distribuição Qui-quadrado com k1

graus de liberdade e W2 outra variável aleatória com distribuição Qui-quadrado com k2 graus de liberdade. Se W1 e W2 são independentes, avariável aleatória

F =W1k1W2k2

segue uma distribuição F-Snedecor com graus de liberdade: k1 (nume-rador) e k2 (denominador). A função de densidade de probabilidade édada por:

h(f) =Γ(k1+k2

2 )Γ(k1/2)Γ(k2/2)

(k1k2 )k12 f

k12−1

(1 + k1k2f)

k1+k22

, f > 0

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 69 / 75

Seção 5* - Outras distribuições...

A notação F ∼ F (k1, k2) indica que que a variável aleatória F temdistribuição F-Snedecor, com graus de liberdade k1 e k2.

PropriedadesSe F ∼ F (k1, k2) então

1 A distribuição é assimétrica direita.2 A média e variância são respectivamente

µ =k2

k2 − 2, k2 > 2 e σ2 =

2k22(k1 + k2 − 2)

k1(k2 − 2)2(k2 − 4), k2 > 4

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 70 / 75

Seção 5* - Outras distribuições...

Uso da tabela F-SnedecorOs pontos críticos da distribuição F -Snedecor são apresentados na ta-bela F. Seja fα,k1,k2 o ponto crítico da distribuição F com k1 graus deliberdade no numerador e k2 graus de liberdade no denominador ,tal quea probabilidade de que variável aleatória F seja maior que este valor é

P (F > fα,k1,k2) =

∫ ∞fα,k1,k2

h(f)df = α

Isto é ilustrado na figura abaixo.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 71 / 75

Seção 5* - Outras distribuições...

Por exemplo se k1 = 5 e k2 = 10, então da tabela F tem-se:

P (F > f0,05;5;10) = P (F (5, 10) > 3, 33) = 0, 05.

Isso é o ponto crítico do 5% superior de F (5, 10) é f0,05;5;10 = 3, 33.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 72 / 75

Seção 5* - Outras distribuições...

A tabela F contém somente pontos críticos na cauda superior (valores defα,k1,k2 , para α ≤ 0, 25) da distribuição F. Os pontos críticos na caudainferior f1−α,k1,k2 podem ser obtidos da seguinte forma:

f1−α,k1,k2 =1

fα,k2,k1.

Por exemplo, para determinar o ponto crítico na cauda inferior f0,95;5;10

observe que:

f0,95;5;10 =1

f0,05;10;5=

1

4, 74= 0, 211.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 73 / 75

Seção 5* - Outras distribuições...

Seja Y uma variável aleatória que segue uma distribuição F -Snedecor.(a) Se Y ∼ F (8, 12) obtenha:

1 P (Y > 2, 85);

2 P (2, 85 < Y < 4, 50);

3 y1 se P (y1 < Y < 2, 85) = 0, 94

(b) Se Y ∼ F (45, 24), achar y1 tal que, P (Y ≤ y1) = 0, 95

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 74 / 75

Seção 5* - Outras distribuições...

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 75 / 75

Seção 5* - Outras distribuições...

Cancho, V., 2010. Notas de aulas sobre noções de estatística eprobabilidade - São Paulo: USP.

Montgomery, D., Runger, G., 2016. Estatística Aplicada eProbabilidade para Engenheiros. Rio de Janeiro: LTC.

(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 75 / 75