probabilidades e estat´istica isabel natario´ · distribuicao dos dados em classes e pelo no...

238
PROBABILIDADES E ESTAT ´ ISTICA ISABEL NAT ´ ARIO Departmento de Matem´ atica, Faculdade de Ciˆ encias e Tecnologia, Universidade Nova de Lisboa, 2829-516, Caparica, Portugal Especial agradecimento ` a Prof a atima Migu´ ens por contribui¸ oes v´ arias Notas produzidas no ˆ ambito da disciplina de Probabilidades e Estat´ ıstica para os cursos de Engenharia Qualquer gralha ou incorrec¸ ao encontrada agradece-se que seja reportada ` a autora [email protected] 2 de Julho de 2012

Upload: dinhcong

Post on 01-Jan-2019

294 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

PROBABILIDADES E ESTATISTICA

ISABEL NATARIO

Departmento de Matematica, Faculdade de Ciencias e Tecnologia,

Universidade Nova de Lisboa, 2829-516, Caparica, Portugal

Especial agradecimento a Profa Fatima Miguens por contribuicoes varias

Notas produzidas no ambito da disciplina

de Probabilidades e Estatıstica para os cursos de Engenharia

Qualquer gralha ou incorreccao encontrada agradece-se que seja reportada a autora

[email protected]

2 de Julho de 2012

Page 2: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados
Page 3: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Conteudo

1 Estatıstica Descritiva 41.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Distribuicoes de frequencia e representacao grafica de dados . . . . . . . . . . . . . . . 51.3 Medidas descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3.1 Medidas de localizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3.2 Medidas de dispersao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3.3 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4 Diagrama de caixa-e-bigodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.5 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2 Teoria das Probabilidades 162.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Espaco amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.3 Axiomatica das probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.4 Tecnicas de contagem para espacos amostrais finitos . . . . . . . . . . . . . . . . . . . 222.5 Probabilidade condicionada e Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . 232.6 Independencia entre acontecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.7 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3 Variaveis aleatorias 343.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.2 Funcao distribuicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.3 Variaveis aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.4 Variaveis aleatorias contınuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.5 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4 Momentos e outros parametros de uma distribuicao de probabilidade 424.1 Momentos de uma distribuicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.2 Parametros descritivos das distribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . 454.3 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5 Vectores aleatorios 515.1 Par aleatorio discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2 Par aleatorio contınuo‡ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555.3 Independencia entre variaveis aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . 565.4 Momentos de vectores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585.5 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

1

Page 4: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 2

6 Distribuicoes especiais 686.1 Algumas distribuicoes discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.1.1 Distribuicao Uniforme Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . 686.1.2 Distribuicao de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 696.1.3 Distribuicao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706.1.4 Distribuicao Hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736.1.5 Distribuicao Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746.1.6 Distribuicao Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.2 Algumas distribuicoes contınuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 786.2.1 Distribuicao Uniforme Contınua . . . . . . . . . . . . . . . . . . . . . . . . . . 786.2.2 Distribuicao Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 806.2.3 Distribuicao Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826.2.4 Distribuicao Qui-quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 846.2.5 Distribuicao T de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.3 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

7 Teorema Limite Central 967.1 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 967.2 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

8 Inferencia Estatıstica. Estimacao Pontual. Distribuicoes por Amostragem. 1018.1 Populacoes, amostras aleatorias e estatısticas . . . . . . . . . . . . . . . . . . . . . . . 1018.2 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1038.3 Metodos de Obtencao de Estimadores‡ . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

8.3.1 Metodos dos Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1058.3.2 Metodo da Maxima Verosimilhanca . . . . . . . . . . . . . . . . . . . . . . . . 105

8.4 Algumas Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . 1078.5 Distribuicoes por amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

8.5.1 Distribuicoes por amostragem da media amostral, X . . . . . . . . . . . . . . . 1118.5.2 Distribuicao por amostragem para a diferenca de medias amostrais, X1 − X2 . 1128.5.3 Distribuicao por amostragem da proporcao, P . . . . . . . . . . . . . . . . . . 1128.5.4 Distribuicao por amostragem da variancia amostral, S2 . . . . . . . . . . . . . 113

8.6 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

9 Intervalos de Confianca 1179.1 Intervalos de Confianca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1179.2 Intervalos de Confianca para a media populacional, µ . . . . . . . . . . . . . . . . . . . 120

9.2.1 Populacao Normal com variancia conhecida . . . . . . . . . . . . . . . . . . . . 1209.2.2 Populacao Normal com variancia desconhecida . . . . . . . . . . . . . . . . . . 1219.2.3 Populacao Normal com variancia desconhecida e n > 30 . . . . . . . . . . . . . 1219.2.4 Populacao desconhecida com variancia conhecida e n > 30 . . . . . . . . . . . . 1229.2.5 Populacao desconhecida com variancia desconhecida e n > 30 . . . . . . . . . . 123

9.3 Intervalo de Confianca para a diferenca de medias populacionais, µ1 − µ2 . . . . . . . 1239.4 Intervalo de Confianca para proporcao populacional, p . . . . . . . . . . . . . . . . . . 1249.5 Intervalo de Confianca para a variancia populacional, σ2, e para o desvio padrao pop-

ulacional, σ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1259.6 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

Page 5: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 3

10 Testes de Hipoteses 13110.1 Testes de Hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13110.2 Testes de hipoteses para a media populacional, µ . . . . . . . . . . . . . . . . . . . . . 133

10.2.1 Populacao Normal(µ, σ2), σ2 conhecido . . . . . . . . . . . . . . . . . . . . . . 13310.2.2 Populacao Normal(µ, σ2), σ2 desconhecido . . . . . . . . . . . . . . . . . . . . . 13910.2.3 Populacao Normal(µ, σ2), σ2 desconhecido, n > 30 . . . . . . . . . . . . . . . . 14110.2.4 Populacao desconhecida com σ2 conhecido e n > 30 . . . . . . . . . . . . . . . 14410.2.5 Populacao desconhecida com σ2 desconhecido e n > 30 . . . . . . . . . . . . . . 146

10.3 Teste de hipoteses para a igualdade entre medias populacionais, µ1 = µ2, de populacoesNormais com variancias conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

10.4 Testes de hipoteses para a proporcao p de uma populacao . . . . . . . . . . . . . . . . 15110.5 Testes de hipoteses para a variancia σ2 de uma populacao Normal com media desconhecida15510.6 Testes de hipoteses para o pressuposto da normalidade de uma populacao . . . . . . . 15910.7 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

11 Regressao Linear Simples 16911.1 Regressao Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16911.2 Estimadores dos Mınimos Quadrados dos Parametros de Regressao . . . . . . . . . . . 17011.3 Qualidade do Ajuste e Estimacao de σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . 17111.4 Distribuicao dos Estimadores β0 e β1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

11.4.1 Distribuicao de β1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17211.4.2 Distribuicao de β0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

11.5 Intervalos de Confianca e Testes de Hipoteses para os Parametros de Regressao . . . . 17411.5.1 Intervalos de Confianca e Testes de Hipoteses para β1 . . . . . . . . . . . . . . 17511.5.2 Intervalos de Confianca e Testes de Hipoteses para β0 . . . . . . . . . . . . . . 176

11.6 Intervalos de Confianca e Testes de Hipoteses para a Recta de Regressao ou RespostaMedia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

11.7 Predicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17811.8 Um exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17811.9 Exercıcios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

12 Exercıcios variados 186

13 Solucoes dos exercıcios propostos 198

14 Formulario 231

15 Tabelas 233

16 Bibliografia sugerida (ordem alfabetica) 236

Page 6: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 1

Estatıstica Descritiva

1.1 Introducao

Neste capıtulo comecamos por rever conceitos de estatıstica descritiva. A estatıstica descritiva tempor objectivo descrever, resumir e representar a informacao contida num conjunto de dados, atraves daconstrucao de tabelas e graficos ou atraves da determinacao de medidas numericas que adequadamentesintetizem os dados.

A dificuldade do Homem em interpretar grandes conjuntos de dados e aqui ultrapassada peladistribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de formafiel.

A forma de analisar os dados depende, em primeira instancia, da sua natureza. Os dados numericospodem ser discretos, quando se referem a contagens ou numeros inteiros, ou contınuos, quandopodem tomar qualquer valor dentro de um determinado intervalo de numeros.

Para alem disso os dados estatısticos sao ainda classificados de acordo com a sua escala de medicao.Assim temos dados qualitativos e quantitativos. Os primeiros dizem respeito a dados cujos atrib-utos de interesse sao categorias e dividem-se em dados nominais e ordinais.

Os dados nominais nao sao na verdade dados numericos, mas apenas etiquetas ou valores atribuıdosque designam uma classe, nao havendo uma relacao de ordem entre as classes. Por exemplo, a situacaoem que os dados se referem a cor dos olhos de um conjunto de indivıduos (1=preto, 2=castanho,3=azul, 4=verde, 5=cinzento).

Os dados ordinais referem-se a dados do tipo dos nominais, com a diferenca que para estes seestabelece uma relacao de ordem entre as classes. Por exemplo, as classificacoes de cada aluno numdeterminado teste dadas por ”Mau”, ”Suficiente”e ”Muito Bom”.

Os dados quantitativos sao aqueles em que a sua caracterıstica de interesse e intrinsecamentenumerica. Dividem-se em dados com escala intervalar ou com escala absoluta, residindo a distincaono facto de estes ultimos terem a si associado uma origem definida. Para decidir se determinado tipode dados esta em qual das escalas pergunte a si proprio se o dobro do valor do que esta a estudarcorresponde ao dobro de intensidade. Por exemplo, 20oC e duas vezes mais quente que 10oC? Aresposta e nao e, por isso, dados deste tipo sao de escala intervalar. Agora um campo com 4 hectarese o dobro de outro com 2 hectares? Sim, por isso temos agora dados de escala absoluta. Notamos queas tecnicas estatısticas nao fazem distincao entre estes dois tipos de dados.

E exclusivamente sobre esta ultima classe de dados, os quantitativos, que vamos trabalhar.

4

Page 7: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 5

1.2 Distribuicoes de frequencia e representacao grafica de dados

Quando lidamos com grandes conjuntos de dados podemos obter uma boa ideia global dos mesmosse os agruparmos em classes ou intervalos disjuntos. Ao procedermos assim perdemos informacao masesta perda e largamente compensada pelo conhecimento que ganhamos acerca da forma dos dados.

Assuma que estamos a tratar com dados contınuos. No caso discreto os valores observados definemeles proprios as classes a considerar.

Para escolher o numero de classes k a usar e usual aplicar-se a regra de Sturges:

k ≈ 1 + lognlog 2 ,

onde n e a dimensao do conjunto de dados.Sabendo k e a amplitude total do conjunto de dados, L, dada por:

L = maximodados −mınimodados,

obtem-se a amplitude de cada classe, l, como:

l = Lk .

Podemos entao definir os limites de cada classe e contar o numero de observacoes que caiemdentro de cada uma delas, obtendo assim as frequencias absolutas de cada classe - fi para a classei, i = 1, . . . , k. Este procedimento vem facilitado se ordenarmos os dados. Notamos que:

∑ki=1 fi = n

O conjunto das frequencias absolutas de todas as classes, eventualmente colocadas numa tabela,chama-se distribuicao de frequencias.

Para o conjunto das frequencias absolutas obtem-se as chamadas frequencias absolutas acu-muladas de cada classe, Fi, como a soma das frequencias absolutas dessa classe e de todas as outrasque a precedem:

Fi =∑i

j=1 fj

Repare que Fk = n. Ao conjunto das Fi, i = 1, . . . , k chama-se distribuicao de frequenciasabsolutas.

Obervamos que e usual identificar cada classe pelo seu ponto medio, calculado como a metadeda soma dos seus extremos, e denotado aqui como PMi para a classe i, i = 1, . . . , k.

Definem-se ainda as chamadas frequencias relativas de cada classe, aqui designadas por f∗i ,

como:

f∗i = fi

n

Observe-se que estas frequencias se encontram em [0, 1] e que:

∑ki=1 f

∗i = 1

Page 8: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 6

Associadas a f∗i encontram-se as correspondentes frequencias relativas acumuladas:

F ∗i =

∑ij=1 f

∗j

Temos que F ∗k = 1. Ao conjunto das frequencias relativas chama-se distribuicao de frequencias

relativas e ao conjunto das frequencias relativas acumuladas chama-se distribuicao de frequenciasrelativas acumuladas.

Nota: Se depois de seleccionadas as classes se verificar que, por existirem observacoes muito ex-tremas, surgem ”nas pontas”classes com apenas 1 ou 0 observacoes, e usual agrega-las, obtendo asclasses abertas ”menor que”e ”maior que”. Essas observacoes que se destacam por serem muito ex-tremas, muito distantes das restantes, designam-se por outliers.

Uma vez tendo as distribuicoes de frequencias podemos construir varios dispositivos graficos paraas representar, ja que uma imagem vale 1000 palavras... Assim podemos ter histogramas, polıgonosde frequencia, polıgonos de frequencias acumuladas representando graficamente a distribuicaode frequencia dos dados, ou ainda diagramas de caixa-e-bigodes, que apresentaremos mais tardeno texto.

O histograma e um grafico de barras que se constroi escolhendo para abcissas os limites de cadauma das classes e para ordenadas, resultando na altura de cada uma das barras que o constitui, afrequencia (absoluta ou relativa) dos dados na classe correspondente.

O polıgono de frequencias e obtido unindo os pontos de ordenada correspondente a altura decada barra e abcissa dada pelo respectivo ponto medio da classe. Os polıgonos de frequencias saousualmente melhores que os histogramas para comparar a forma de duas ou mais distribuicoes defrequencias.

O polıgono de frequencias acumuladas obtem-se unindo os pontos formados por ordenadasdadas pela altura das barras do histograma e respectivas abcissas que sao um dos limites da classe quelhe corresponde - caso seja o superior fala-se de distribuicao acumulada ”acima de”; se for o inferiortemos distribuicao acumulada ”abaixo de”. A curva aqui resultante toma o nome de ogiva. E umacurva importante quando estamos interessados em determinar que percentagem dos dados esta abaixode um certo valor.

Exemplo 1.1 Seguem-se as percentagens de gordura de manteiga fornecidas por 120 vacas Ayrshire,de 3 anos de idade, seleccionadas ao acaso de um livro de registos de gado canadiano:

4.32 4.24 4.29 4.00 3.96 4.48 3.89 4.02 3.74 4.424.20 3.87 4.10 4.00 4.33 3.81 4.33 4.16 3.88 4.814.23 4.67 3.74 4.25 4.28 4.03 4.42 4.09 4.15 4.294.27 4.38 4.49 4.05 3.97 4.32 4.67 4.11 4.24 5.004.60 4.38 3.72 3.99 4.00 4.46 4.82 3.91 4.71 3.963.66 4.10 4.38 4.16 3.77 4.40 4.06 4.08 3.66 4.703.97 3.97 4.20 4.41 4.31 3.70 3.83 4.24 4.30 4.173.97 4.20 4.51 3.86 4.36 4.18 4.24 4.05 4.05 3.563.94 3.89 4.58 3.99 4.17 3.82 3.70 4.33 4.06 3.894.07 3.58 3.93 4.20 3.89 4.60 4.38 4.14 4.66 3.974.22 3.47 3.92 4.91 3.95 4.38 4.12 4.52 4.35 3.914.10 4.09 4.09 4.34 4.09 4.88 4.28 3.98 3.86 4.58De Sokal & Rohlf (1995).

Page 9: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 7

Olhando para este conjunto de 120 numeros e difıcil retirar algo de util daqui, ao contrario do queacontece se os dispusermos num grafico.

Para tal comecamos por determinar o numero de classes a usar para agrupar os dados, atraves daregra de Sturges:

k ≈ 1 + lognlog 2 = 1 + log 120

log 2 ≈ 1 + 6.907 = 7.907 ≈ 8 classes.

Notando agora que o maximo do conjunto de dados e 5.00 e o mınimo e 3.47, temos que a amplitudedos dados vale L = 5.00 − 3.47 = 1.53 e, portanto, a amplitude de cada classe deve ser de l = L

k =1.538 = 0.19125 ≈ 0.2. Obtemos entao as seguintes distribuicoes de frequencias (absoluta, absoluta

acumulada, relativa e relativa acumulada):

Frequencia Freq. absoluta Frequencia Freq. relativaClasse absoluta, acumulada relativa, acumulada

i i fi Fi f∗

i F ∗

i

1 ]3.4 ; 3.6] 3 3 0.025 0.0252 ]3.6 ; 3.8] 8 11 0.067 0.0923 ]3.8 ; 4.0] 30 41 0.250 0.3424 ]4.0 ; 4.2] 29 70 0.242 0.5835 ]4.2 ; 4.4] 28 98 0.233 0.8176 ]4.4 ; 4.6] 12 110 0.100 0.9177 ]4.6 ; 4.8] 5 115 0.042 0.9588 ]4.8 ; 5.0] 5 120 0.042 1.000

Usando agora as frequencias absolutas, por exemplo, pode construir-se o seu histograma e desenharo correspondente polıgono de frequencias (a vermelho):

Percentagem de manteiga

Frequ

enciaabsoluta,f i

3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0

05

1015

2025

30

Page 10: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 8

Daqui facilmente verificamos que a grande maioria destas vacas produz percentagens de manteigaentre 3.8 e 4.4, havendo aproximadamente o mesmo numero de vacas melhores e piores produtoras emtermos de manteiga - simetria na distribuicao das frequencias.

Repare ainda nos valores das frequencias relativas acumuladas de onde se pode verificar que maisde 50% das observacoes correspondem a uma percentagem de manteiga inferior a 4.2%.

2

1.3 Medidas descritivas

Anteriormente vimos como resumir um conjunto de dados num grafico. Adicionalmente pode serutil reduzir esses mesmos dados a um ou mais numeros que os representem, como por exemplo a umamedia. Estes numeros vao tomar o nome de medidas descritivas.

As medidas descritivas dividem-se em 3 tipos: medidas de localizacao, medidas de dispersao emedidas de forma. Servem, respectivamente, para responder a questoes do tipo:

1. Onde e o ”meio”dos dados? Que dado ocorre mais vezes? Como se posiciona o meu valorcomparado com todos os outros?

2. Quao ”espalhados”se encontram os dados?

3. Sao os meus dados simetricos?

1.3.1 Medidas de localizacao

As medidas de localizacao servem para determinar o ”meio”dos dados ou o seu valor ”mais tıpico”ouainda para determinar como determinado valor se posiciona em relacao aos restantes. As medidas maisusuais sao a media, a mediana, moda, os quartis e os percentis.

Dado um conjunto de dados D = x1, . . . , xn temos as seguintes definicoes:

Media amostral:x = 1

n

∑ni=1 xi

Mediana:

Me =

(

n+12

)esimovalor do conjunto D ordenado, n e ımpar

Media dos 2 valores centrais do conjunto D ordenado, n e par

Moda:

Mo = Valor em D que ocorre mais vezes

Percentil de ordem p:

qp =⌈

n× p100

⌉esimovalor do conjunto D ordenado, p ∈ [0, 100]

Page 11: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 9

1o Quartil:

Q1 = d0.25neesimo valor do conjunto D ordenado

3o Quartil:

Q3 = d0.75neesimo valor do conjunto D ordenado

Note-se que os quartis nao sao mais do que percentis - o 1o quartil e o percentil 25 e o 3o quartile o percentil 75. O 2o quartil nao e mais do que o percentil 50, que por sua vez nao e mais do que amediana.

Quando os dados se encontram agrupados, as medidas anteriores nao podem assim ser determi-nadas, tendo de se recorrer a uma interpolacao linear. Notamos que a moda devera encontrar-secontida na classe com maior frequencia absoluta - dita classe modal - e a mediana devera estar con-tida na primeira classe cuja correspondente frequencia relativa acumulada ultrapasse 0.5 - dita classemediana.

Denotando Li e Ls os limites inferior e superior, respectivamente, das classes onde se encontramas medidas de localizacao a serem determinadas, PMi o ponto medio da classe i, me o numero daclasse mediana, mo o numero da classe modal, mq1 o numero da classe do 1o quartil, mq3 o numeroda classe do 3o quartil, mpp o numero da classe do percentil p e l a amplitude das classes, temos que:

Media amostral:

x = 1n

∑ki=1 fiPMi

Mediana:

Me = Li+n+12

− Fme−1

Fme+1−Fme−1× l

Moda:

Mo = Li+ fmo+1

fmo−1 + fmo+1× l

1o Quartil:

Q1 = Li+n+14

− Fmq1−1

Fmq1+1−Fmq1−1× l

3o Quartil:

Q3 = Li+3(n+1)

4− Fmq3−1

Fmq3+1−Fmq3−1× l

Percentil de ordem p:

qp = Li+p(n+1)

100− Fmpp−1

Fmpp+1−Fmpp−1× l

Page 12: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 10

Notas: Quando tratamos com dados susceptıveis de conter outliers a mediana verifica-se ser umamedida de localizacao melhor que a media, uma vez que e menos sensıvel a esse tipo de valoresextremos. Notamos ainda que a moda nao tem de ser unica.

1.3.2 Medidas de dispersao

A dispersao e a tendencia dos dados se espalharem em torno da media. As medidas mais habituaissao a amplitude dos dados, a variancia, o desvio padrao e o coeficiente de variacao, que se passam adefinir, relativamente ao conjunto de dados D = x1, . . . , xn.

Amplitude:L = maxD −minD

Variancia amostral:

s2 = 1n−1

∑ni=1(xi − x)2 = 1

n−1

(∑n

i=1x2i − nx2

)

Desvio padrao amostral:

s =√s2 =

1n−1

∑ni=1(xi − x)2

Coeficiente de variacao:

cv = sx × 100

Note-se que o coeficiente de variacao representa a percentagem da media amostral a que corres-ponde o desvio padrao amostral.

No caso de dados agrupados devemos reformular as nossas definicoes. Sendo PMi o ponto medioda classe i e fi a correspondente frequencia absoluta:

Variancia amostral:

s2 = 1n−1

∑ki=1fi(PMi − x)2

Desvio padrao amostral:

s =√s2 =

1n−1

∑ki=1 fi(PMi − x)2

1.3.3 Medidas de forma

Servem para estudar a simetria dos dados. Vamos aqui apenas considerar o coeficiente de enviesa-mento de Pearson:

Coeficiente de enviesamento de Pearson:

Sk = 3(x−Me)s

Page 13: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 11

Os valores de Sk variam entre −3 e 3. Se os dados forem perfeitamente simetricos entao Sk = 0,ja que a mediana e a media dos dados coincidem. Se Sk > 0 (respectivamente, Sk < 0) tal significaque a media e maior (respectivamente menor) que a mediana, sendo os dados enviesados para adireita (respectivamente, enviesados para a esquerda).

Exemplo 1.2 Retomemos o exemplo 1.1. Uma vez que dispomos dos dados desagregados podemoscalcular:

Media amostral: x = 1n

∑ni=1 xi =

1120

∑ni=1 xi = 4.166;

Mediana: como n=120 e par, Me=Media dos 2 valores centrais do conjunto ordenado de dados,

3.47, 3.56, 3.58, 3.66, 3.66, 3.70, 3.70, 3.72, 3.74, 3.74, 3.77, 3.81, 3.82, 3.83, 3.86, 3.86, 3.87, 3.88,3.89, 3.89, 3.89, 3.89, 3.91, 3.91, 3.92, 3.93, 3.94, 3.95, 3.96, 3.96, 3.97, 3.97, 3.97, 3.97, 3.97, 3.98,3.99, 3.99, 4.00, 4.00, 4.00, 4.02, 4.03, 4.05, 4.05, 4.05, 4.06, 4.06, 4.07, 4.08, 4.09, 4.09, 4.09, 4.09,4.10, 4.10, 4.10, 4.11, 4.12, 4.14,4.15, 4.16, 4.16, 4.17, 4.17, 4.18, 4.20, 4.20, 4.20, 4.20, 4.22, 4.23,4.24, 4.24, 4.24, 4.24, 4.25, 4.27, 4.28, 4.28, 4.29, 4.29, 4.30, 4.31, 4.32, 4.32, 4.33, 4.33, 4.33, 4.34,4.35, 4.36, 4.38, 4.38, 4.38, 4.38, 4.38, 4.40, 4.41, 4.42, 4.42, 4.46, 4.48, 4.49, 4.51, 4.52, 4.58, 4.58,4.60, 4.60, 4.66, 4.67, 4.67, 4.70, 4.71, 4.81, 4.82, 4.88, 4.91, 5.00

Logo, Me = 4.14+4.152 = 4.145.

Moda: Mo = Valor que ocorre mais vezes = 3.97 e 4.38 (aparecem ambos 5 vezes, 2 modas).

1o Quartil: Q1 = d0.25ne = d0.25 × 120e = 30esimo valor do conjunto de dados ordenado =3.96

3o Quartil: Q3 = d0.75ne = d0.75 × 120e = 90esimo valor do conjunto dados ordenado =4.34

Amplitude: L=5.00-3.47=1.53

Variancia amostral: s2 = 1n−1

∑ni=1(xi − x)2 = 0.091

Desvio padrao amostral: s =√

1n−1

∑ni=1(xi − x)2 = 0.302

Coeficiente de variacao: cv = sx × 100 = 7.258%

Coeficiente de enviesamento de Pearson: Sk = 3(x−Me)s = 0.209.

Confirma ligeiro enviesamento direito verificado no histograma. A distribuicao e pois apenasligeiramente assimetrica, o que e corroborado pelo facto de a media amostral, a mediana e a modaestarem relativamente proximas.

Apesar de neste exemplo concreto termos os dados desagregados, vamos usar as classes definidasno exemplo 1.1 para calcular algumas das medidas atras e comparar resultados. Assim:

Media amostral: x = 1n

∑ki=1 fiPMi =

3×3.5+8×3.7+...120 = 4.153;

Page 14: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 12

Mediana: A classe 4, ]4.0; 4.2], e a primeira cuja frequencia relativa acumulada ultrapassa os 50%dos dados, pelo que e esta a classe mediana.

Me = Li+n+12

− Fme−1

Fme+1−Fme−1× l = 4.0 +

120+12

− 41

98−41 × 0.2 = 4.068

Moda: A classe modal e a classe 3, ]3.8; 4.0], ja que e aquela a que corresponde maior frequenciaabsoluta. Assim:

Mo = Li+ fmo+1

fmo−1 + fmo+1× l = 3.8 + 29

8 + 29 × 0.2 = 3.957

1o Quartil: A classe 3, ]3.8; 4.0], e a primeira cuja frequencia relativa acumulada ultrapassa os25% dos dados, pelo que e esta a classe do 1o quartil:

Q1 = Li+n+14

− Fmq1−1

Fmq1+1−Fmq1−1× l = 3.8 +

120+14

− 11

70−11 × 0.2 = 3.865

3o Quartil: A classe 5, ]4.2; 4.4], e a primeira cuja frequencia relativa acumulada ultrapassa os75% dos dados, pelo que e esta a classe do 3o quartil:

Q3 = Li+3(n+1)

4− Fmq3−1

Fmq3+1−Fmq3−1× l = 4.2 +

3(120+1)4

− 70

110−70 × 0.2 = 4.304

Naturalmente que tanto a mediana, como os quartis e a moda devem estar contidos nas respectivasclasses, o que constitui uma forma de confirmarmos se os nossos calculos estao correctos.

Variancia amostral: s2 = 1n−1

∑ki=1fi(PMi − x)2 = 3×(3.5−4.153)2+8×(3.7−4.153)2+...

119 = 0.095

Desvio padrao amostral: s =√s2 = 0.308

Coeficiente de variacao: cv = sx × 100 = 7.406%

Vemos pois que as aproximacoes obtidas a partir dos dados agrupados estao proximas dos ver-dadeiros valores. Quanto mais distantes estiverem os verdadeiros valores dos obtidos atraves dosdados agrupados, maior e a perda de informacao devida ao agrupamento.

2

1.4 Diagrama de caixa-e-bigodes

Apresentamos por ultimo um outro dispositivo grafico bastante util, o chamado diagrama de caixa-e-bigodes.

Para construir este diagrama temos de conhecer quanto valem os maximo e mınimo dos dados, asua mediana e os 1o e 3o quartis. Com estes desenha-se uma caixa rectangular em que o topo inferiore dado pelo 1o quartil e o superior pelo 3o quartil. A caixa e dividida em duas partes pelo valor damediana dos dados. Acrescentam-se-lhe entao 2 bigodes que partem, respectivamente, um do extremoinferior da caixa ate ao mınimo dos dados e o outro do extremo superior para o maximo - ver exemplo1.3.

Este diagrama e muito util para identificar assimetrias nos dados, caso a caixa esteja partida emdois pedacos muito diferentes, e para identificar outliers, no caso de os bigodes serem, relativamentea caixa, muito grandes.

Page 15: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 13

Exemplo 1.3 Construamos o diagrama de caixa-e-bigodes para dos dados do exemplo 1.1, lembrandoque Me = 4.145, Q1 = 3.96, Q3 = 4.34, mınimo dos dados e 3.47 e maximo dos dados e 5.00:

3.5 4.0 4.5 5.0

Confirma-se ligeira assimetria direita dos dados.2

1.5 Exercıcios Propostos

1.1 No ambito dos inqueritos que sao efectuados por determinado organismo de obtencao de dados,e importante ter nocao dos erros de digitacao que os entrevistadores cometem ao anotareminformaticamente as respostas dos seus entrevistados. Assim, para um inquerito de 50 questoesregistaram-se, para 90 entrevistas, os seguintes numeros de erros:

No de erros Frequencia0 51 172 293 234 115 5

(a) Determine as frequencias relativas e as frequencias relativas acumuladas. Coloque-as emgrafico.

(b) Que percentagem de entrevistas tiveram menos de 3 erros? Que numero de erros e maiscomum?

(c) Determine a media do numero de erros, o seu desvio padrao e o coeficiente de variacao.

1.2 Suponha que os dados seguintes se referem ao numero de palavras que constituem o vocabulariode criancas de 5 anos:

205, 377, 292, 300, 179, 240, 300, 190, 680, 250, 180, 170, 211, 266, 303, 350, 375, 288, 360, 225

Page 16: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 14

(a) Estes dados sao de natureza discreta ou contınua? Construa uma sua distribuicao defrequencias absoluta, absoluta acumulada, relativa e relativa acumulada. Esboce o his-tograma das frequencias relativas e o correspondente polıgono de frequencias. Construauma ogiva.

(b) Existe algum outlier presente nos dados?

(c) Determine a media, a mediana, a moda, e os 1o e 3o quartis dos dados. Construa o diagramade caixa-e-bigodes dos dados.

(d) Determine o desvio padrao e o coeficiente de variacao dos dados.

(e) O que pode dizer quanto a simetria dos dados? Justifique.

1.3 Os chamados movimentos rapidos dos olhos durante o sono (REM - rapid eye movement) estaoassociados a perıodos de sonho. A duracao da actividade REM foi registada para 18 indivıduos(em segundos):

7.00, 7.75, 9.50, 11.60, 10.55, 7.75, 12.00, 10.75, 12.51, 10.91, 8.30, 9.71, 10.50, 11.60, 6.25, 11.75,9.75, 10.00

(a) Construa uma distribuicao de frequencia dos dados usando uma amplitude de classe l de 1segundo. Represente-a graficamente. Esboce uma ogiva.

(b) Determine a media, a mediana e os 1o e 3o quartis dos dados.

(c) Determine o desvio padrao e o coeficiente de variacao dos dados.

1.4 Segue-se a distribuicao por faixas etarias da populacao de uma certa cidade, com idades entre 5e 40 anos, relativas ao ano de 1987:

Idade Numero[5− 10[ 30116[10− 15[ 14633[15− 20[ 29424[20− 25[ 40146[25− 30[ 29424[30− 35[ 44555[35− 40] 40100

(a) Construa um histograma de frequencias. O que indica a sua forma?

(b) Se o histograma tivesse sido calculado com base nas frequencias relativas a sua formadiferiria do histograma desenhado na alınea anterior? Se nao tiver a certeza construa-opara comparacao.

(c) Determine duas medidas de localizacao dos dados e duas medidas de dispersao.

1.5 Os dados que se seguem dizem respeito aos salarios mensais lıquidos (Euro) de um conjunto de36 pessoas de determinada cidade entrevistadas na rua ao acaso:

1195, 660, 870, 1150, 1225, 2465, 1100, 2480, 1300, 2330, 2020, 1540, 685, 867, 1000, 1470, 1085,1060, 1790, 2690, 1535, 3995, 1615, 1230, 670, 590, 1100, 1040, 4200, 1030, 1165, 3320, 1260,1790, 2740, 1490

Page 17: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 15

(a) Construa uma distribuicao de frequencias relativas e ponha-a em grafico. Construa aindauma ogiva.

(b) Qual a percentagem de pessoas que ganha menos que 1100e lıquidos?

(c) Determine a media, a mediana, a moda, os 1o e 3o quartis e o desvio padrao dos dados.

(d) Comente a simetria da distribuicao com base no coeficiente de enviesamento de Pearson ecom base no diagrama de caixa-e-bigodes.

1.6 Inserido num estudo antropologo procura-se determinar algumas caracterısticas fisiologicas deuma populacao. Os numeros seguintes representam os nıveis de colesterol no sangue encontradoem 25 membros de uma tribo Africana, medido em miligramas de colesterol por decilitro desangue:

200, 241, 232, 177, 207, 181, 195, 182, 181, 233, 176, 170, 217, 164, 188, 164, 211, 204, 160, 172,212, 186, 160, 203, 191

(a) Construa as distribuicoes de frequencias absolutas e relativas correspondentes.

(b) Construa o histograma e o polıgono de frequencias das frequencias relativas. Comente.

(c) Determine a media, a mediana e a moda dos dados. Comente.

(d) Determine o coeficiente de variacao dos dados.

1.7 Um psicologo desenvolveu uma tecnica para ajudar as pessoas a melhorarem a sua memoria.Certo material e dado a 30 pessoas para o memorizarem antes de aprenderem a tecnica e semel-hante material e dado as mesmas pessoas para o memorizarem depois de apreendida a referidatecnica. A diferenca de tempo que as pessoas demoraram a memorizar os materiais antes edepois de aprendida a tecnica seguem-se (minutos):

5, 40, 45, 11, 13, 20, 14, 5, 23, 18, 17, 4, 4, 5, 29, 18, 15, 21, 24, 16, 2, 15, 19, 30, 24, 21, 14, 18,26, 40

(a) Construa uma distribuicao de frequencias, o seu histograma e o seu polıgono de frequencias.

(b) Tome uma classe e escreva por palavras exactamente o que ela lhe diz.

(c) Calcule 3 medidas de localizacao dos dados e discuta a simetria da distribuicao dos dados,construindo um diagrama de caixa-e-bigodes.

1.8 ‡ Prove que a area total dos rectangulos de um histograma e igual a area limitada pelo polıgonode frequencia correspondente e pelo eixo dos XX. Considere, para facilitar, o caso concreto deum histograma constituıdo, por exemplo, por 3 classes da mesma amplitude.

Page 18: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 2

Teoria das Probabilidades

2.1 Introducao

Apesar da estatıstica descritiva ser um ramo importante da estatıstica, muito frequentemente a in-formacao que dispomos existe apenas para um subgrupo de um grande conjunto de items de interesse(uma amostra), significando a necessidade de generalizacoes para alem dos dados. O objectivo dainferencia estatıstica prende-se precisamente com estas generalizacoes.

Neste processo estao sempre presentes incertezas, quer porque a informacao nao e completa ouporque e apenas parte de um todo ou ainda porque e de natureza indirecta. Estas incertezas saoquantificadas atraves da teoria das probabilidades.

A teoria das probabilidades tem assim como objectivo a formulacao de modelos de fenomenosnaturais em que intervem o acaso. As suas origens remontam aos chamados jogos de azar, como sendoa roleta do casino ou os jogos de cartas ou de dados!

Definicao 2.1 Uma experiencia aleatoria e uma experiencia na qual:

- todos os possıveis resultados da experiencia sao conhecidos a partida;

- para qualquer realizacao da experiencia nao se sabe, antes desta ocorrer, qual dos seus possıveisresultados vai acontecer;

- a experiencia pode sempre ser repetida sob identicas condicoes.

Varios sao os exemplos do nosso dia-a-dia de experiencias aleatorias - lancamento de uma moedaao ar (assumindo que nao ”aterra”de lado!), lancamento de um dado, a extraccao do totoloto, o tempode vida de duracao de uma lampada, o tempo que se demora na fila de espera dos correios, o sorteiodos turnos praticos de Probabilidades e Estatıstica!...

O nosso objectivo e entao estudar a incerteza associada a estas experiencias aleatorias, se possıvelquantifica-la. Laplace, em 1812, forneceu a primeira definicao de probabilidade, dita definicaoclassica de probabilidade ou Lei de Laplace:

Definicao 2.2 Se uma experiencia aleatoria tem a si associado um numero finito N de resultadosmutuamente exclusivos e igualmente provaveis e se, desses resultados, NA tem um certo atributo A,entao a probabilidade de A, P (A), e dada por:

16

Page 19: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 17

P (A) =NA

N=

no de resultados favoraveis

no de resultados possıveis

Esta definicao e no entanto restritiva e inadequada em muitas situacoes, por exemplo se os resul-tados da experiencia aleatoria nao forem equiprovaveis. Surge entao o conceito frequencista deprobabilidade:

Definicao 2.3 A probabilidade de um acontecimento A e avaliada atraves de informacao existentesobre A, sendo dada pela proporcao de vezes em que se observou o resultado A, nA, num numero nsuficientemente grande de realizacoes da experiencia aleatoria:

P (A) = limn→∞

nA

n

Este e o conceito de probabilidade que trataremos neste curso. Notamos que esta interpretacao naoe unica. No entanto, a matematica das probabilidades que vamos aprender de seguida e desenvolvidanuma base inteiramente axiomatica, independente da referida interpretacao. Deve-se a Kolmogorov,que a apresentou em 1933.

De acordo com o desenvolvimento de Kolmogorov os acontecimentos aleatorios sao representadospor conjuntos e a probabilidade e uma medida normada definida sobre estes conjuntos.

2.2 Espaco amostral

Definicao 2.4 O espaco amostral de uma experiencia aleatoria e um par (Ω,S) onde:

1. Ω e o conjunto de todos os possıveis resultados da experiencia (espaco de resultados ouuniverso);

2. S e uma σ−algebra, i.e.:

(i) ∅ ∈ S;(ii) Se A ∈ S entao A ∈ S, onde A e o conjunto complementar de A;

(iii) Se A1, A2, . . . , An, . . . ∈ S entao⋃∞

i=1Ai ∈ S.

Observacoes:

1. Os pontos em Ω designam-se por pontos amostrais.

2. Muito frequentemente S e o conjunto de todos os subconjuntos de Ω, S ≡ P(Ω). Este conjuntoe sempre uma σ−algebra.

3. Qualquer conjunto A ∈ S e chamado um acontecimento. A e um conjunto de pontos amostrais.

4. Qualquer acontecimento A diz-se ter ocorrido se algum ponto de A corresponder ao resultadode uma experiencia aleatoria.

5. Cada conjunto formado por apenas um ponto amostral e dito um acontecimento simples ouelementar.

Page 20: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 18

6. Ao conjunto Ω chamamos acontecimento certo.

7. Ao conjunto ∅ chamamos acontecimento impossıvel.

8. A algebra assim construıda, tambem designada por algebra de acontecimentos, e ”pare-cida” com a algebra de conjuntos, ”herdando” propriedades desta. Assim salientamos:

(i) A e subacontecimento de B, e escreve-se A ⊂ B, se e so se a realizacao de A implica arealizacao de B;

(ii) Dado o acontecimento A, chama-se acontecimento complementar de A e escreve-se A,ao acontecimento constituıdo pelos elementos de Ω que nao estao em A;

(iii) Dados os acontecimentos A e B, da-se o nome de uniao de A com B ao acontecimentoque consiste na realizacao de pelo menos um deles e representa-se por A ∪B;

(iv) Interseccao de A com B e o acontecimento que se realiza se e so se realizam em simultaneoos acontecimentos A e B. Representa-se por A ∩B;

(v) A uniao de acontecimentos disjuntos A e B representa-se por A+B.

(vi) Chama-se diferenca dos acontecimentos A e B ao acontecimento A− B = A ∩B, ouseja, ao acontecimento que se realiza se e so se A se realiza mas nao se realiza B.

9. Dois acontecimentos A e B dizem-semutuamente exclusivos se nao tem elementos em comum,ou seja se A ∩B = ∅.

10. Se Ω contiver apenas um numero finito de elementos dizemos que (Ω,S) e um espaco amostralfinito. Se Ω for no maximo um conjunto numeravel de pontos dizemos que (Ω,S) e um espacoamostral discreto. Se os pontos em Ω nao forem contaveis dizemos que (Ω,S) e um espacoamostral nao contavel. Em particular, se Ω = Rk, dizemos que temos um espaco amostralcontınuo.

Exemplo 2.1 Considere-se a experiencia aleatoria simples do lancamento ao ar de uma moeda equi-librada. Representando ”Ca” o resultado ”sair cara” e ”Co” o resultado ”sair coroa”, temos queΩ = Ca,Co. Escolhemos entao a seguinte σ−algebra, S = P(Ω) = ∅, Ca, Co, Ca,Co,formando o espaco amostral (Ω,S).

Consideremos agora a experiencia aleatoria do lancamento ao ar de duas moedas equilibradas. Temosque Ω = (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) e podemos escolher S = P(Ω) = ∅, (Ca,Ca),(Ca,Co), (Co,Ca), (Co,Co), (Ca,Ca), (Ca,Co), (Ca,Ca), (Co,Ca), (Ca,Ca), (Co,Co),(Ca,Co), (Co,Ca), (Ca,Co), (Co,Co), (Co,Ca), (Co,Co), (Ca,Ca), (Ca,Co), (Co,Ca),(Ca,Ca), (Ca,Co), (Co,Co), (Ca,Ca), (Co,Ca), (Co,Co), (Ca,Co), (Co,Ca), (Co,Co),Ω, for-mando o espaco amostral (Ω,S).

2

2.3 Axiomatica das probabilidades

Definicao 2.5 Seja (Ω,S) um espaco amostral. Uma funcao P : S → [0, 1] diz-se uma probabilidadese satisfaz as seguintes condicoes ou axiomas:

1. P (A) ≥ 0, ∀A ∈ S;

Page 21: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 19

2. P (Ω) = 1;

3. Sejam Ai, i = 1, 2, . . ., Ai ∈ S, uma sucessao de conjuntos disjuntos (Aj ∩ Ak = ∅, j 6= k).Entao:

P

( ∞⋃

i=1

Ai

)

=∞∑

i=1

P (Ai) Aditividade contavel

Nota: Como caso particular do 3o axioma temos a chamada aditividade finita, para Ω finito:

Sejam A,B ∈ S : A ∩B = ∅. Entao P (A ∪B) = P (A) + P (B).

Definicao 2.6 Chama-se espaco de probabilidades ao triplo (Ω,S, P ).

Exemplo 2.2 Relativamente ao exemplo 2.1, onde Ω = Ca,Co e S = P(Ω), podemos definir afuncao P em S como P (∅) = 0, P (Ca) = 1

2 , P (Co) = 12 e P (Ω) = 1. Facilmente se verifica que

esta funcao satisfaz os axiomas acima sendo, por isso, uma probabilidade.

Ja se Ω = (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) e S = P(Ω), podemos definir a funcao P por:

P (∅) = 0

P ((Ca,Ca)) = P ((Ca,Co)) = P ((Co,Ca)) = P ((Co,Co) =1

4P ((Ca,Ca), (Ca,Co)) = P ((Ca,Ca), (Co,Ca)) = P ((Ca,Ca), (Co,Co)) =

= P ((Ca,Co), (Co,Ca)) = P ((Ca,Co), (Co,Co)) = P ((Co,Ca), (Co,Co)) = 1

2P ((Ca,Ca), (Ca,Co), (Co,Ca)) = P ((Ca,Ca), (Ca,Co), (Co,Co)) =

= P ((Ca,Ca), (Co,Ca), (Co,Co)) = P ((Ca,Co), (Co,Ca), (Co,Co)) = 3

4P (Ω) = 1

Tambem esta funcao satisfaz os axiomas acima enunciados sendo, por isso, uma probabilidade.

Notemos que em ambas as situacoes anteriores, ao definirmos os valores que a funcao P deve tomarpara os acontecimentos elementares, estes necessariamente implicam os valores que P deve assumirpara os restantes acontecimentos, de forma a que P seja de facto uma probabilidade.

2

Passam-se a enumerar de seguida algumas consequencias da axiomatica das probabilidades acimadefinida, esbocando as suas demonstracoes, sem grande detalhe.

Proposicao 2.1 P (∅) = 0.

Demonstracao: ∅ ∩ Ω = ∅. Logo ∅ e Ω sao conjuntos disjuntos. Entao, pela aditividade e porque∅ ∪ Ω = Ω,

P (∅ ∪ Ω) = P (∅) + P (Ω) ⇔ P (Ω) = P (∅) + P (Ω) ⇔ (pelo 2o axioma)

1 = P (∅) + 1 ⇔ P (∅) = 0

Page 22: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 20

Teorema 2.1 Se A, B ∈ S e A ⊆ B entao:

- P (A) ≤ P (B)

- P (B −A) = P (B)− P (A).

Demonstracao: Se A ⊆ B, B = (A∩B)∪ (B−A) = A∪ (B−A). Assim, sendo A e (B−A) disjuntos,temos pelo axioma da aditividade que:

P (B) = P (A+ (B −A)) = P (A) + P (B −A) ⇔ (2.3.1)

P (B −A) = P (B)− P (A)

Note-se que de (9.5.1), P (B) ≥ P (A), ja que P (B −A) ≥ 0, pelo 1o axioma.

Corolario 2.1.1 ∀A ∈ S, 0 ≤ P (A) ≤ 1.

Demonstracao: Como ∀A ∈ S, A ⊆ Ω e como, pelo axioma 2, P (Ω) = 1, segue o pretendido comoconsequencia do primeiro ponto do teorema anterior.

Corolario 2.1.2 ∀A,B ∈ S, P (A−B) = P (A)− P (A ∩B).

Demonstracao:

P (A−B) = P (A− (A ∩B)) = (Pelo 2o ponto do teorema anterior e porque (A ∩B) ⊆ A)

= P (A) − P (A ∩B)

Teorema 2.2 (Regra da adicao) Para A,B ∈ S, P (A ∪B) = P (A) + P (B)− P (A ∩B).

Demonstracao:

1. A ∪B = (A−B) + (B −A) + (A ∩B);

2. A = (A ∩B) + (A−B) ⇔ (A−B) = A− (A ∩B)

3. B = (A ∩B) + (B −A) ⇔ (B −A) = B − (A ∩B)

Assim, pelo axioma da aditividade:

P (A ∪B) = P (A−B) + P (B −A) + P (A ∩B) =

= P (A− (A ∩B)) + P (B − (A ∩B)) + P (A ∩B) = (Pelo corolario (2.1.2))

= P (A)− P (A ∩B) + P (B)− P (A ∩B)) + P (A ∩B) =

= P (A) + P (B)− P (A ∩B))

Page 23: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 21

Corolario 2.2.1 ∀A ∈ S, P (A) = 1− P (A).

Demonstracao: Tome-se na regra da adicao anteriormente enunciada B = A:

P (A ∪ A) = P (A) + P (A)− P (A ∩ A) ⇔P (Ω) = P (A) + P (A) + P (∅) ⇔ (Pelo 2o axioma e prop. (2.1))

1 = P (A) + P (A) + 0 ⇔P (A) = 1− P (A)

Corolario 2.2.2 Para Ai ∈ S, i = 1, . . . , n,

P

(

n⋃

i=1

Ai

)

=

n∑

i=1

P (Ai)−∑

i 6=j

P (Ai ∩Aj) +∑

i 6=j 6=k

P (Ai ∩Aj ∩Ak)− . . .+ (−1)n−1 P

(

n⋂

i=1

Ai

)

Observacoes:

1. Dois acontecimentos A e B dizem-se incompatıveis se P (A ∩B) = 0.

2. Se temos um acontecimento A 6= Ω mas tal que P (A) = 1 dizemos que A e um acontecimentoquase certo.

3. Se temos um acontecimento B 6= ∅ mas tal que P (B) = 0 dizemos que B e um acontecimentoquase impossıvel.

Exemplo 2.3 Relativamente ao exemplo 2.1, continuado em 2.2, relativamente a experiencia aleatoriado lancamento de 2 moedas equilibradas, definamos os seguintes acontecimentos:

A-”Sair pelo menos uma cara”B-”Sair pelo menos uma coroa”

Temos que:

A = (Ca,Co), (Co,Ca), (Ca,Ca) P (A) =3

4

B = (Ca,Co), (Co,Ca), (Co,Co) P (B) =3

4

A partir daqui consideremos os seguintes acontecimentos:

Ocorrerem os dois acontecimentos simultaneamente:

A ∩B = (Ca,Co), (Co,Ca) P (A ∩B) =1

2

Page 24: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 22

Ocorrer A mas nao B:

A−B = (Ca,Ca) P (A−B) = P (A)− P (A ∩B) =3

4− 1

2=

1

4Ocorrer pelo menos um dos acontecimentos:

A ∪B = Ω P (A ∪B) = P (A) + P (B)− P (A ∩B) =3

4+

3

4− 1

2= 1

Nao ocorrer B:

B = (Ca,Ca) P (B) = 1− P (B) = 1− 3

4=

1

4

2

2.4 Tecnicas de contagem para espacos amostrais finitos

Em espacos amostrais finitos e frequente termos situacoes em que todos os acontecimentos ele-mentares tem igual probabilidade. Nestes casos a determinacao das probabilidades de acontecimentosreduz-se a problemas de contagem combinatoria. Enumeramos seguidamente algumas regras de con-tagem necessarias a essa determinacao.

1. Multiplicacao de escolhas: O numero de formas diferentes em que podemos escolher umelemento de cada um de dois grupos - um com n elementos e outro com m - e dado por:

n×m

2. Consideremos um conjunto de n elementos dos quais estamos interessados em extrair p (p ≤ n)elementos, anotando a ordem pela qual eles saem.

(i) Se a extraccao for efectuada sem reposicao, no caso de extrairmos todos os n elementos(p = n), o numero de formas diferentes de o fazer e permutacoes de n,

Pn = n! = n× (n− 1)× . . .× 2× 1

Recordemos que por convencao 0! = 1.

Caso p < n, o numero de conjuntos diferentes de p elementos que podemos formar a partirdos n elementos a escolha e dado por arranjos de n elementos p a p,

Anp = n!

(n−p)!

(ii) Se a extraccao for efectuada com reposicao, o numero de conjuntos diferentes de pelementos que podemos formar a partir dos n elementos a escolha e np. A este numerochama-se arranjos com repeticao e designa-se por:

An′

p = np

Page 25: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 23

3. Finalmente podemos estar interessados em determinar quantos subconjuntos de p elementosconseguimos formar a partir de um conjunto de n elementos, nao interessando a ordem pelaqual eles saem. Tal numero e dados pelas combinacoes de n elementos p a p:

Cnp = n!

(n−p)!p!

Repare-se que as combinacoes sao obtidas a partir dos arranjos descontando-lhes as diferentesordenacoes do conjunto formado pelos p elementos. Usamos arranjos quando os elementos queescolhemos sao distinguıveis entre si e combinacoes quando nao sao.

Notamos ainda que as combinacoes podem tambem ser denotadas por (np ) =nCp = Cn

p e queCnp = Cn

n−p.

Exemplo 2.4 Consideremos as seguintes situacoes:

X O numero de toilettes possıveis ao combinar 3 gravatas diferentes com 4 camisas sao 3×4 = 12.

X Num teste de escolha multipla de 10 questoes com 3 opcoes cada, o numero de diferentes con-juntos de respostas e 310.

X Num parque de estacionamento com 10 lugares o numero de formas distintas em que se aı podemarrumar 6 carros diferentes e de A10

6 = 151.200.

X No totoloto, onde de 49 numeros se tenta acertar num conjunto de 6 numeros sorteados aoacaso, o numero de possıveis chaves e dado por C49

6 = 13.983.816!

2

2.5 Probabilidade condicionada e Teorema de Bayes

O calculo de probabilidades de acontecimentos associados a uma experiencia aleatoria pode seralterado quando existe informacao disponıvel para alem do espaco amostral da experiencia em questao.Vejamos o seguinte exemplo:

Exemplo 2.5 Em determinada aldeia apareceu um surto de colera, que se pensa estar associadoao consumo de agua de um determinado poco. Sao conhecidas as seguintes proporcoes relativas aquantidade de pessoas que desenvolveram a doenca (representando esse acontecimento pela letra D) eas pessoas que beberam agua do referido poco (representando esse acontecimento pela letra B):

B B Total

D 0.18 0.02 0.20

D 0.01 0.79 0.80

Total 0.19 0.81 1.00

Page 26: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 24

Qual a probabilidade de uma pessoa escolhida ao acaso na populacao da aldeia ter contraıdo colera?

P (D) = 0.2

De entre as pessoas que beberam agua do poco, qual a probabilidade de se escolher ao acaso umapessoa que contraiu colera? Agora so estamos interessados no universo das pessoas que beberam aguado poco, B, pelo que a probabilidade pretendida e:

0.18

0.19' 0.95

Repare-se que por sabermos que a pessoa bebeu agua do poco tal altera o valor da probabilidadedo acontecimento ”contrair colera”de 0.2 para 0.95! O espaco de resultados foi encolhido de todaa populacao da aldeia, Ω, para apenas os que consumiram agua do tal poco, B. Isto reflecte-se naforma como o novo acontecimento ”contrair colera sabendo (ou condicionado a que) que bebeu aguado poco” passa a ser designado: D|B. A sua probabilidade e dada por:

P (D|B) =P (D ∩B)

P (B)

2

Definicao 2.7 Seja (Ω,S,P) um espaco de probabilidades e seja B ∈ S : P (B) > 0. Para ∀A ∈ Sdefinimos a probabilidade condicionada de A dado B por:

P (A|B) =P (A ∩B)

P (B)

Exercıcio 2.1 Provar que se B e um acontecimento tal que P (B) > 0, entao P (· |B ) e uma proba-bilidade sobre Ω.

Teorema 2.3 (Teorema da probabilidade composta) Seja (Ω,S,P) um espaco de probabilidadese sejam A,B ∈ S : P (A) > 0, P (B) > 0. Entao,

P (A ∩B) = P (A |B )P (B) = P (B |A)P (A)

Nota: Este teorema e facilmente generalizavel a mais de dois acontecimentos.

Teorema 2.4 (Teorema da probabilidade total) Seja (Ω,S,P) um espaco de probabilidades eformem E1, . . . , En uma particao do espaco de resultados Ω1, com P (Ei) > 0, ∀i. Dado umqualquer acontecimento A ∈ S, tem-se

P (A) = P (A |E1 )P (E1) + . . .+ P (A |En )P (En)

Demonstracao:Se E1 . . . , En e uma particao de Ω, entao E1 ∪ . . . ∪En = Ω e Ei ∩ Ej = ∅, ∀i 6= j.Por outro lado, A = (A ∩ E1) ∪ . . . ∪ (A ∩ En).

1Ou seja, E1 ∪ . . . ∪ En = Ω e Ei ∩Ej = ∅, ∀i 6= j.

Page 27: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 25

Como os acontecimentos (A ∩ E1) , . . . (A ∩ En) sao disjuntos, pelo axioma da aditividade,

P (A) = P (A ∩ E1) + . . .+ P (A ∩ En)

O que se pretende demonstrar sai finalmente notando que, pelo teorema da probabilidade composta,

P (A ∩ Ei) = P (A |Ei )P (Ei) , ∀i = 1, 2, . . . , n.

Teorema 2.5 (Teorema de Bayes) Seja (Ω,S,P) um espaco de probabilidades e E1, . . . , En umaparticao do espaco de resultados Ω, com P (Ei) > 0, ∀i. Dado um qualquer acontecimento A ∈ S,com P (A) > 0, tem-se

P (Ei |A) =P (A |Ei )P (Ei)

∑ni=1 P (A |Ei )P (Ei)

.

Demonstracao:Pelos teoremas da probabilidade total e da probabilidade composta e pela definicao de probabili-

dade condicional,

P (Ei |A) =P (Ei ∩A)

P (A)=

P (A |Ei )P (Ei)∑n

i=1 P (A |Ei )P (Ei)

Exemplo 2.6 Suponha que existe um teste para diagnosticar uma certa doenca, mas que esse teste efalıvel. Assim sabe-se que, para um indivıduo portador da doenca (D), a probabilidade de o teste darpositivo (T ) e de 0.98 e que, para um indivıduo sao (D), a probabilidade de o teste dar negativo (T )e 0.99. Sabe-se ainda que na populacao 10% sao portadores da doenca. Assim:

P (T |D) = 0.98 P (T |D) = 0.99 P (D) = 0.10

A probabilidade de um indivıduo nao ter a doenca sabendo que o teste deu positivo e de:

P (D|T ) = P (T |D)P (D)

P (T |D)P (D) + P (T |D)P (D)=

0.01 × 0.90

0.98 × 0.10 + (1 − 0.99) × (1 − 0.10)' 0.084

e a probabilidade de um indivıduo ter a doenca se o teste deu negativo e de:

P (D|T ) = P (T |D)P (D)

P (T |D)P (D) + P (T |D)P (D)=

0.02 × 0.10

(1− 0.98) × 0.10 + 0.99 × (1 − 0.10)' 0.002

2

Page 28: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 26

2.6 Independencia entre acontecimentos

Definicao 2.8 Dois acontecimentos A e B dizem-se independentes se e so se

P (A ∩B) = P (A)P (B)

Teorema 2.6 Se A e B sao acontecimentos independentes, entao:

P (A|B) = P (A) se P (B) > 0

eP (B|A) = P (B) se P (A) > 0.

Portanto, se dois acontecimentos sao independentes, o conhecimento de um deles em nada influenciaa probabilidade de ocorrencia do outro.

Teorema 2.7 Se A e B sao acontecimentos independentes, tambem o sao A e B, A e B e ainda Ae B.

Exemplo 2.7 A probabilidade de um atirador acertar no alvo, em cada tiro, e de 0.6, independente-mente do tiro. Qual a probabilidade de:

a) Serem necessarios exactamente 10 tiros para acertar uma vez? 0.49 × 0.6.

b) Em tres tiros acertar uma vez? C31 × 0.42 × 0.6.

c) Acertar pela terceira vez ao quinto tiro? C42 × 0.42 × 0.63.

d) Necessitar de pelo menos 4 tiros para acertar duas vezes? 1− 0.62 − C31 × 0.41 × 0.62.

2

2.7 Exercıcios Propostos

2.1 Considere a experiencia aleatoria de lancar simultaneamente 2 dados equilibrados de 4 facescada, variando estas de 1 a 4 pintas.

(a) Descreva o espaco de resultados e o espaco amostral associados a esta experiencia.

(b) Quais sao os elementos de S que descrevem, respectivamente, os acontecimentos ”sair umunico 4”, ”sair pelo menos um 4”, ”sair no maximo um 4”?

2.2 Num concurso de escultura participam 15 candidatos. De quantas formas diferentes pode o juriatribuir os 1o, 2o e 3o lugares?

2.3 Quatro casais compraram 8 lugares para o teatro na mesma fila de cadeiras. De quantas formasdiferentes se podem sentar se:

(a) Os elementos de cada casal se sentarem junto do respectivo par.

(b) Todos os homens se sentarem juntos e as mulheres tambem.

Page 29: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 27

(c) Todos os homens se sentarem juntos.

(d) Os homens e as mulheres se sentarem alternadamente.

2.4 Seis livros de fısica, quatro de matematica e dois de quımica devem ser arrumados numaprateleira. De quantas formas diferentes se pode fazer tal arrumacao se:

(a) Os livros de cada materia ficarem juntos?

(b) Apenas os livros de matematica ficarem juntos?

2.5 Numa determinada pizzeria o cliente pode escolher para a sua pizza 3 ingredientes de 15 aescolha, nao sendo possıvel repetir ingredientes. Quantas pizzas diferentes se podem fazer?

2.6 Para preencher 6 vagas de trabalho numa determinada firma concorreram 6 homens e 8 mulheres.De quantas formas diferentes podem ser preenchidas as vagas se:

(a) Qualquer dos candidatos puder ser escolhido?

(b) Tiverem de ser contratados exactamente 3 homens e 3 mulheres, podendo qualquer can-didato ser escolhido?

(c) Tiverem de ser contratadas (quaisquer) 3 mulheres e 3 homens, dos quais um homem emparticular deve ser escolhido.

(d) Tiverem se ser contratados 2 homens e 4 mulheres e, destas, 2 em particular nao devem serescolhidas.

2.7 Demonstre que Cnp = Cn

n−p , p ≤ n.

2.8 No lancamento de um dado equilibrado determine a probabilidade de sair:

(a) A face 6.

(b) Um numero par de pontos.

(c) A face 2 ou a face 3.

2.9 Extrai-se ao acaso uma carta de um baralho de 40. Determine a probabilidade de essa carta ser:

(a) Um as.

(b) Um ouro.

(c) O as de ouros.

(d) Um as ou um ouro.

2.10 Num jogo de cartas (sueca) distribuem-se 10 cartas por cada jogador. Determine a probabilidadede sair a um determinado jogador:

(a) Quatro ases e quatro manilhas (7).

(b) Pelo menos um as.

(c) Quatro cartas do naipe trunfo, entre elas o as.

(d) Todas as cartas dos mesmo naipe. E do naipe trunfo?

2.11 Num dado nao equilibrado a probabilidade de sair um numero par de pintas e o dobro de sairum numero ımpar. Determine essas probabilidades.

Page 30: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 28

2.12 Por engano misturaram-se 4 pilhas novas com 3 usadas. Escolhendo-se, ao acaso e sem reposicao,2 destas pilhas determine a probabilidade de:

(a) Ambas serem novas.

(b) Nenhuma ser nova.

(c) Pelo menos uma ser nova.

2.13 Para se conseguir entrar na area de trabalho do computador do Sr. Speck-Trum tem de seintroduzir uma palavra-chave de 4 dıgitos. Qual a probabilidade de se conseguir entrar ao acasose:

(a) Na constituicao da palavra-chave puderem entrar quaisquer das 26 letras do alfabeto;

(b) Na constituicao da palavra-chave puderem entrar quaisquer das 26 letras do alfabeto, semrepeticoes de letras;

(c) A palavra-chave e constituıda por quaisquer duas letras seguidas de quaisquer dois algaris-mos.

2.14 Tres amigos vao ao bar Pentagunus e pedem ao empregado de mesa que lhes sirva tres bebidasdiferentes. Este, na hora de servir as referidas bebidas, esquece-se de quem pediu o que e decidecolocar em frente de cada amigo uma bebida ao acaso. Qual a probabilidade de:

(a) Todos receberem a bebida que efectivamente escolheram;

(b) Ninguem receber a bebida correcta;

(c) Apenas um dos amigos receber a bebida que efectivamente escolheu.

2.15 Sejam A, B e C acontecimentos tais que P (A) = P (B) = P (C) = 14 , P (A∩B) = P (B ∩C) = 0

e P (A ∩C) = 18 . Qual a probabilidade de se verificar pelo menos um dos 3 acontecimentos?

2.16 Sabendo que A e B sao acontecimentos tais que P (A) = 23 , P (B) = 1

2 e P (A∩B) = 13 , determine

P (A−B), P (A ∪B), P (A ∪ B), P (A ∩B) e P (A ∪ B).

2.17 De 100 agricultores, 50 produzem vinho, 30 produzem milho e 10 produzem vinho e milho.Escolhendo um deste agricultores ao acaso qual a probabilidade de:

(a) Ele produza vinho ou milho?

(b) Ele nao produza vinho nem milho?

2.18 A probabilidade de um homem estar vivo daqui a 25 anos e 35 e a probabilidade da sua mulher

ainda viver na mesma ocasiao e de 23 . Determine a probabilidade de daqui a 25 anos:

(a) Ambos estarem vivos.

(b) Apenas o homem estar vivo.

(c) Apenas a mulher estar viva.

(d) Apenas um estar vivo.

2.19 Em determinada gelataria 40% dos clientes escolhem o sabor chocolate, 30% escolhem o saborlimao e 15% escolhem os dois. Seleccionou-se ao acaso um cliente dessa gelataria.

Page 31: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 29

(a) Se escolheu o sabor limao, qual a probabilidade de ter escolhido tambem o sabor chocolate?E vice-versa?

(b) Qual a probabilidade de escolher limao ou chocolate?

2.20 Suponha que 10% da populacao de certo paıs sofre de problemas cardıacos e que, de entreestes, 70% sao fumadores. De entre os que nao sofrem de problemas cardıacos 45% fumam.Seleccionada ao acaso uma pessoa desta populacao:

(a) Qual a probabilidade de ser fumadora?

(b) Se for fumadora, qual a probabilidade de sofrer de problemas cardıacos?

2.21 Admita que existem 3 tipos de vırus diferentes que provocam gripe, sendo as probabilidades deum indivıduo ser atacado por cada um deles de 0.3, 0.5 e 0.2, respectivamente, so podendo seratacado por um unico tipo de vırus. Existe uma vacina para esta doenca, sendo as probabilidadesde imunizacao a cada um dos vırus atras mencionados de 0.8, 0.9 e 0.95, respectivamente.

(a) Qual a probabilidade de um indivıduo vacinado nao contrair a gripe (estar, por isso, imune)?

(b) Se um indivıduo vacinado resistiu ao ataque (um indivıduo imune), qual a probabilidadede ter sido atacado por um vırus do tipo 2?

2.22 Um detector de mentiras tem uma probabilidade de 0.08 de nao detectar um mentiroso e umaprobabilidade de 0.01 de acusar uma pessoa inocente (nao mentirosa). Se 2% das pessoas quepassam por este detector de mentiras mentem, qual a probabilidade de:

(a) Uma pessoa acusada pelo detector de mentiras ter de facto mentido?

(b) Uma pessoa nao acusada pelo detector ser na verdade inocente.

2.23 Dos registos dos correios sabe-se que 60% das cartas enviadas demoram 1 dia a chegar ao seudestino, enquanto que as restantes demoram mais tempo do que isso. Quanto a encomendas, 10%demoram apenas um dia a chegar, 40% dois dias e as restantes mais tempo ainda. O numero decartas enviadas e superior ao numero de encomendas, estando na proporcao de 3 para 2. Calculea probabilidade de:

(a) Um artigo enviado demore pelo menos dois dias a chegar.

(b) Um artigo enviado, que demorou mais de um dia a chegar, seja uma carta.

2.24 Nas suas deslocacoes de casa para o emprego a menina Flora pode usar um de tres meiosde transporte distintos - metro, autocarro ou automovel. Sabe-se que a probabilidade de elachegar atrasada ao emprego e de 0.24 e as probabilidades de chegar atrasada tendo usado,respectivamente, o metro ou o autocarro sao de 0.1 e 0.7. A probabilidade de chegar a horastendo usado o automovel e de 0.8. Sabendo ainda que a probabilidade de ir de metro ou deautocarro e a mesma, determine a probabilidade de a menina Flora ir de automovel.

2.25 Sejam A e B acontecimentos independentes. Mostre que A e B sao tambem acontecimentosindependentes.

2.26 Um aluno conhece bem 60% da materia dada. Num exame com cinco perguntas, sorteadasao acaso, sobre toda a materia, qual a probabilidade de vir a responder correctamente a duasperguntas?

Page 32: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 30

2.27 Numa certa rua existem duas caixas Multibanco - A e B. A probabilidade de as maquinasavariarem e, independentemente uma da outra, de 0.05 para a A e 0.01 para a B. Determine aprobabilidade de, num dia qualquer:

(a) Ambas as maquinas estarem avariadas.

(b) Apenas a maquina A estar avariada.

(c) Pelo menos uma das maquinas estar avariada.

2.28 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

Dados 2 acontecimentos A e B pode acontecer que P (A ∪B) = P (A) + P (B).

2.29 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Dados 3 acontecimentos A, B e C tais que P (A) > 0, P (B) > 0, P (C) > 0 , com A ⊆ B ⊆C, entao P (A ∪B ∪ C) = P (C).

(b) Estamos interessados em formar palavras de 5 letras, a partir das 23 constituintes doalfabeto portugues (sem repeticao de letras), por seleccao aleatoria das letras. Nestascondicoes, a probabilidade de formarmos a palavra ”PROVA” e de 5

23 .

(c) Suponha que A e B sao acontecimentos tais que P (A) = 0.6, P (B) = 0.3 e P (A∩B) = 0.2.Entao P (B|A) = 0.5.

(d) Um estudante sabe que tera 3 exames durante a 1a semana do perıodo de exames (2a a 6a

feira, 5 dias). A probabilidade de que os exames sejam em dias consecutivos e de 310 .

(e) De um conjunto de 25 artigos 8 sao defeituosos, 6 tendo apenas pequenos defeitos e 2 tendodefeitos de consideravel gravidade. Entao a probabilidade de que um artigo escolhido aoacaso tenha um defeito considerado grave, sabendo que tem defeitos, e de 1

4 .

(f) Para um determinado exame de PED, 80% dos alunos estudam e os restantes nao. Se umaluno estudar para o exame, a probabilidade de ele passar e de 0.85. Se o aluno nao estudarcertamente que nao passa. Se determinado aluno nao passou no exame, a probabilidade deele nao ter estudado para o mesmo e de 0.2.

(g) Sendo A e B dois acontecimentos tais que P (A) + P (B) = x e P (A ∩ B) = y entao aprobabilidade de nao se realizar qualquer um dos acontecimentos e x− y.

(h) Dois algarismos distintos entre si sao escolhidos aleatoriamente de entre os inteiros de 0 a5 (inclusivamente). A probabilidade de a sua soma ser menor que 3 e de 0.1.

(i) O Sr. Ze compra um bilhete de lotaria para 20 sorteios distintos, em cada um dos quaistem uma probabilidade de 1

100 de ganhar um premio. Consequentemente, na globalidadedos sorteios, a probabilidade de ele ganhar pelo menos um premio e de 0.182.

(j) Um comerciante tem 3 lojas - L1, L2 e L3 - sendo o volume de vendas de L1 igual ao deL2 e o volume de vendas de L3 o dobro do volume de vendas de cada uma das outras duaslojas. Sabe-se que a percentagem de dıvidas incobraveis nestas lojas e de 6%, 10% e 12%,respectivamente para as lojas L1, L2 e L3. Entao, a probabilidade de nao se conseguircobrar uma qualquer factura e de 0.5.

(k) De uma lista de 25 doadores de de sangue, 12 tem sangue do tipo A. Escolhidas 5 pessoasao acaso desta lista a probabilidade de que todas tenham sangue do tipo A e de 5

12 .

(l) A probabilidade do Joaozinho passar no exame de conducao de trotinetes e de 0.6 se naosubornar o examinador e e de 0.8 se subornar o examinador. Estando indeciso quanto a

Page 33: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 31

cometer ou nao o suborno, a probabilidade de o fazer e igual a de nao o fazer. Entao,sabendo que o Joaozinho conseguiu tirar a carta de trotinetes, a probabilidade de ele tersubornado o examinador e de 0.7.

(m) A joalharia Dourex permite a devolucao de aliancas de casamento dentro de um prazo deum mes apos a compra das mesmas. Sabe-se que 10% dos pares de aliancas comprados saodevolvidos. Entao, a probabilidade de em 10 pares de aliancas vendidos no maximo 1 parser devolvido e de 0.74.

(n) Em certa casa coabitam 3 periquitos - um amarelo, um verde e um malhado (verde eamarelo) - e ainda um gato. Sempre que a dona destes animais sai de casa, o gato tentacomer os periquitos, atacando indiferentemente qualquer um deles. A probabilidade de ogato comer o periquito amarelo e de 0.3, de comer o periquito verde e 0.2 e o malhado e0.1. No dia em que a dona chegue a casa e so ouca cantar 2 periquitos (por um deles tersido comido), a probabilidade de que o periquito em falta seja o amarelo e de 0.5.

(o) Em determinado paıs sabe-se que 70% dos contribuintes sao profissionais liberais e osrestantes sao trabalhadores por conta de outrem. Se um contribuinte e profissional lib-eral, a probabilidade de ele pagar impostos voluntariamente e de 0.6, enquanto que estaprobabilidade aumenta para 0.9 para os trabalhadores por conta de outrem. Se determi-nado contribuinte nao pagou os seus impostos de forma voluntaria, a probabilidade de eleser um profissional liberal e de 0.85.

(p) Imagine que recebe uma caixa com 50 doces. Esta caixa contem 5 caramelos, 5 bombonsrecheados com cerejas, 5 trufas, 5 chocolates de passas e 30 chocolates de leite. Alguemselecciona ao acaso 5 doces da caixa para lhe dar e coloca-os num prato. A probabilidadede que o prato contenha pelo menos um caramelo, pelo menos um bombom recheado comcerejas, pelo menos uma trufa e pelo menos um chocolate de passas e de 0.3.

(q) Tres maquinas A, B e C produzem botoes, respectivamente, 15%, 25% e 60% da producaototal. As percentagens de botoes defeituosos fabricados por estas maquinas sao respec-tivamente 5%, 7% e 4%. Se ao acaso, da producao total de botoes, for encontrado umdefeituoso, a probabilidade de ele ter sido produzido pela maquina B e de cerca de 36%.

(r) A probabilidade do medicamento XOP provocar efeitos secundarios numa crianca (i.e.pessoa com menos de 14 anos) e de 0.2, enquanto que para os adultos (restante populacao)e de 0.1. Sabemos que percentagem de criancas na populacao e de 15%. Uma pessoaqueixou-se de ter sofrido de efeitos secundarios apos a ingestao deste medicamento. Aprobabilidade de que essa pessoa seja um adulto e de 0.3.

(s) Se P (A) = 0.5, P (B) = 0.2 e P (A ∩B) = 0.1 entao os acontecimentos A e B sao indepen-dentes mas nao incompatıveis.

(t) O Jose tem de ir buscar um amigo ao aeroporto. A sua experiencia diz-lhe que o aviaose atrasa 60% das vezes quando chove, mas apenas 20% das vezes quando nao chove. Aprevisao do tempo diz que ha uma probabilidade de 0.4 de chover. Entao a probabilidadede que o aviao nao se atrase e de 0.5.

(u) Num determinado exame, 10 alunos receberam o enunciado A, 15 alunos receberam oenunciado B e 20 alunos receberam o enunciado C. Seleccionando ao acaso 6 do total destesalunos, a probabilidade de um deles ter recebido o enunciado A, dois deles terem recebido oenunciado B e os restantes tres terem recebido o enunciado C e de aproximadamente 0.98.

(v) O exame de PE do Ze decorre em simultaneo com um importante jogo de futebol. Naopodendo ver o jogo em directo o Ze programa os seus dois gravadores de vıdeo para o gravar.

Page 34: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 32

Estes gravadores ja sao velhos, sendo que o seu primeiro gravador grava 70% das vezes quee programado e o seu segundo gravador apenas grava em 60% das vezes. A probabilidadede o Ze chegar a casa e nao ter nenhum registo do jogo que ele tanto deseja ver e de 0.25.

(w) Sabe-se que 20% dos empregados de certa empresa multinacional sao estagiarios recrutadosda FCT e que, destes, 75% acabam por aceder a cargos de chefia. Dos outros trabalhadores,recrutados no ambito de outros programas, 15% ascende a cargos de chefia. Entao a pro-porcao de empregados nesta multinacional sem cargos de chefia e de 0.73 e a probabilidadede uma pessoa com um cargo de chefia ser ex-estagiario da FCT e de 0.5.

(x) A probabilidade de uma mulher ter um filho do sexo masculino e de 0.5 e a probabilidadede ter um filho canhoto e de 0.2, havendo independencia entre o sexo da crianca e o factoda crianca ser canhota. Assim, a probabilidade de um bebe recem nascido ser canhoto,sabendo que ele e um rapaz, e de 0.4.

(Exercıcio de exame)

2.30 (a) O Ze pretende telefonar a um amigo mas nao tem a certeza de quais sao os dois ultimosalgarismos do correspondente numero de telefone. Supondo que escolhe esses algarismos aoacaso, qual a probabilidade de acertar no numero correcto a primeira tentativa?

(b) Suponha que A e B sao acontecimentos tais que P (A) = 0.2, P (B) = 0.6 e P (A∪B) = 0.68.Podemos dizer que os acontecimentos A e B sao independentes? Justifique.

(Exercıcio de exame)

2.31 A industria pirotecnica, de fabrico de foguetes e explosivos, ve todos os anos o seu negocio condi-cionado pelos fogos florestais. Nos anos considerados ”secos” sabe-se que a probabilidade de estaindustria ter um prejuızo significativo e de 0.5 e para um ano ”muito seco” esta probabilidadesobe para 0.9. No caso de o ano ser normal a probabilidade de um prejuızo significativo e de 0.1.Sabe-se ainda que a probabilidade de um ano ser considerado ”seco” e de 0.4 e ”muito seco” de0.2.

(a) Qual a probabilidade da industria pirotecnica ter um prejuızo significativo num ano qual-quer?

(b) Sabendo que em determinado ano a industria pirotecnica teve um prejuızo significativo,qual a probabilidade de esse ano ser um ano normal?

(Exercıcio de exame)

2.32 Num clube de futebol treinam regularmente 30 jogadores, dos quais 8 sao atacantes, 12 saomedios e os restantes sao defesas. Independentemente dos resultados dos restantes jogadores,cada atacante tem uma probabilidade de 3/4 de marcar golo de penalty, cada medio tem umaprobabilidade de 1/2 de marcar golo por penalty e cada defesa consegue-o com probabilidade1/5.

(a) Qual a probabilidade de que um jogador, escolhido ao acaso, marque golo devido a penalty?

(b) Dado que, num jogo, um qualquer jogador marcou um golo de penalty, qual a probabilidadede esse jogador ser medio?

2.33 O Sr. Macieira recebe diariamente um fornecimento de macas que podem ser verdes, amarelasou encarnadas, em proporcoes de 10%, 40% e 50%, respectivamente. As macas verdes verificam-se ser sempre de boa qualidade, enquanto que das macas encarnadas metade costumam vir

Page 35: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 33

ligeiramente danificadas e 20% das macas amarelas tambem. Qual a probabilidade de uma macaescolhida ao acaso do fornecimento diario do Sr. Macieira, que se verificou estar ligeiramentedanificada, ser amarela?

(Exercıcio de exame)

2.34 Em determinada fabrica pretende-se criar um grupo de operacionais para resolver problemasinesperados. Devem fazer parte deste grupo 2 operacionais nao qualificados e um numero, adecidir, de operacionais qualificados. Os problemas que surjam sao atribuıdos ao acaso a umqualquer membro da equipa, para que o resolva.

Sabe-se que a probabilidade deste tipo de problemas ser resolvido por um operacional comqualificacao e de 0.96 enquanto que por um operacional sem qualificacao desce para 0.78.

(a) Considere que a referida equipa e constituıda por 6 operacionais no total. Sabendo queaconteceu um problema que foi prontamente solucionado, qual a probabilidade de ter sidoum operacional com qualificacao a resolve-lo?

(b) Qual deveria ser o numero mınimo de operacionais qualificados a integrar a equipa de formaa que a probabilidade de um problema ser prontamente resolvido seja de 0.9?

(Exercıcio de exame)

2.35 A polıcia de transito coloca por vezes, nas principais arterias da cidade, radares, sendo a proba-bilidade de uma qualquer rua estar equipada com um destes dispositivos, num dia qualquer, de14 .

O Jose, um conhecido acelera, sabe da sua experiencia que a probabilidade de ele usar a rua Cnum dia em que o radar esta colocado e de 1

2 e que essa probabilidade baixa para 18 nos dias em

que nao ha radar. Sabe ainda que quando o radar esta colocado na arteria D a probabilidadede ele usar esse caminho e de 1

4 e quando nao ha e de 18 . Em cada dia o Jose so usa um unico

caminho.

Calcule a probabilidade de num dia qualquer o Jose usar a rua C ou a rua D.

(Exercıcio de exame)

Page 36: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 3

Variaveis aleatorias

3.1 Definicao

Ja vimos antes que os possıveis resultados de uma experiencia aleatoria constituem o espaco de resulta-dos da experiencia. Por vezes apenas se enumeram todos estes resultados mas, muito frequentemente,e de toda a vantagem associar alguma quantidade numerica a cada um deles. A variavel que faz estaatribuicao designa-se por variavel aleatoria - ja que, a partida, nao se sabendo qual dos resultadosda experiencia vai acontecer, tambem nao se sabe qual o numero atribuıdo.

Naturalmente que para o mesmo espaco de resultados se podem definir varias correspondenciasnumericas.

Exemplo 3.1 Recupere-se o exemplo 2.2, relativamente a experiencia aleatoria do lancamento de 2moedas equilibradas, onde Ω = (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co).

Definamos sobre Ω a aplicacao X que da, para cada acontecimento ω em Ω, o numero de caras aque corresponde:

X((Ca,Ca)) = 2 X((Ca,Co)) = 1 X((Co,Ca)) = 1 X((Co,Co)) = 0

Definamos agora sobre Ω a aplicacao Y que da, para cada acontecimento ω em Ω, o numero decoroas a que corresponde:

Y ((Ca,Ca)) = 0 Y ((Ca,Co)) = 1 Y ((Co,Ca)) = 1 Y ((Co,Co)) = 2

Definamos ainda sobre Ω a aplicacao Z que atribui, para cada acontecimento ω em Ω o valor de1 se este corresponde a saıda de pelo menos uma cara e 0 caso contrario.

Z((Ca,Ca)) = 1 Z((Ca,Co)) = 1 Z((Co,Ca)) = 1 Z((Co,Co)) = 0

2

Formalmente, uma variavel aleatoria e uma aplicacao de Ω em R de tal forma que a imagem inversade qualquer intervalo da forma (−∞, x] de R corresponde a um acontecimento:

34

Page 37: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 35

Definicao 3.1 Seja (Ω,S) um espaco amostral. Uma variavel aleatoria X (v.a.) e uma funcaoreal e finita, X : Ω → R, tal que para cada x ∈ R:

Ax = ω ∈ Ω : X (ω) ≤ x ∈ S, i.e. Ax e um acontecimento.

Observacao : Da definicao acima, e por S ser uma σ-algebra, sai que os conjuntos X = x,a < X ≤ b, X < x, a ≤ X < b, a < X < b e a ≤ X ≤ b sao todos acontecimentos.

Exemplo 3.2 Recupere-se o exemplo 3.1, relativamente a experiencia aleatoria do lancamento de 2moedas equilibradas, onde Ω = (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co) e onde definimos a aplicacaoX que faz atribuir a cada acontecimento de Ω o numero de caras a que corresponde.Repare-se que:

X−1(−∞;x] =

∅, x < 0(Co,Co) 0 ≤ x < 1(Co,Co), (Ca,Co), (Co,Ca) 1 ≤ x < 2Ω 2 ≤ x

Como todas as imagens inversas por X dos intervalos da forma (−∞;x] de R sao acontecimentosde Ω entao X e, na verdade, uma variavel aleatoria.

2

Proposicao 3.1 Se X1,X2, . . . ,Xm sao m variaveis aleatorias e h : Rm → R e uma funcao contınua,entao Y = h (X1,X2, . . . ,Xm) e uma v.a..

3.2 Funcao distribuicao

Porque os valores que toma uma variavel aleatoria sao determinados pelos resultado de uma ex-periencia aleatoria, podemos atribuir probabilidades a esses valores.

Definicao 3.2 Seja X uma v.a. definida no espaco de probabilidade (Ω,S, P ). Define-se funcaodistribuicao da v.a. X como:

F (x) = P (ω : X(ω) ≤ x) = P (X ≤ x), ∀x ∈ R.

Proposicao 3.2 A funcao F definida em 3.2 e uma funcao distribuicao pois esta definida em R, enao decrescente, contınua a direita e satisfaz F (−∞) = 0 e F (+∞) = 1.

Teorema 3.1 A qualquer v.a. X corresponde uma funcao distribuicao e vice-versa.

Page 38: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 36

Exemplo 3.3 Continue-se o exemplo 3.2, relativamente a experiencia aleatoria do lancamento de 2moedas equilibradas, onde a v.a. X conta o numero de caras obtidas. Temos que:

P (X = 0) = P ((Co,Co)) = 1

4

P (X = 1) = P ((Ca,Co), (Co,Ca)) = 1

2

P (X = 2) = P ((Ca,Ca)) = 1

4

e

F (x) = P (X ≤ x) =

0, x < 0

14 , 0 ≤ x < 1

34 , 1 ≤ x < 2

1, x ≥ 2

2

3.3 Variaveis aleatorias discretas

Definicao 3.3 Uma v.a. X definida em (Ω,S, P ) diz-se do tipo discreto ou simplesmente discretase existe um conjunto D = a ∈ R : P (X = a) > 0, quanto muito numeravel, tal que P (X ∈ D) = 1.

Definicao 3.4 Seja X uma v.a. discreta. Chama-se funcao de probabilidade ou funcao massaprobabilidade da v.a. X a coleccao de numeros pi tais que:

(i) P (X = xi) = pi ≥ 0;

(ii)∑∞

i=1 pi = 1.

Nota: Uma representacao usual para a funcao de probabilidade de uma v.a. X e:

X

x1 x2 . . . xi . . .P (X = x1) P (X = x2) . . . P (X = xi) . . .

Exemplo 3.4 Continuando o exemplo 3.3, relativamente a experiencia aleatoria do lancamento de 2moedas equilibradas, onde a v.a. X representa o numero de caras obtidas, temos que:

X

0 1 214

12

14

P (X < 2) = P (X = 0) + P (X = 1) = F (1) =3

4

P (0.7 ≤ X < 2.6) = P (X = 1) + P (X = 2) =3

4

Page 39: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 37

2

3.4 Variaveis aleatorias contınuas

Definicao 3.5 Uma v.a. X definida em (Ω,S, P ) diz-se do tipo contınuo ou simplesmente contınuase, sendo F a sua funcao distribuicao, F e absolutamente contınua, i.e. se existe uma funcao nao nega-tiva f tal que, ∀x ∈ R:

F (x) =

∫ x

−∞f(t)dt.

A funcao f chamamos funcao densidade probabilidade ou funcao densidade da v.a. X.

Notas:

1. A funcao f satisfaz as seguintes propriedades:

(i) f (x) ≥ 0, ∀x ∈ R;

(ii)∫ +∞−∞ f (x) dx = 1

2. Dado um qualquer intervalo real I,

P (X ∈ I) =

If (t) dt

Como se trata do integral de uma funcao nao negativa e e sempre convergente, entao a P (X ∈ I)corresponde ao valor da area entre o eixo das abcissas e o grafico da funcao f , no intervalo Iconsiderado.

3. Se o intervalo I for I = [a, b] ou I = ]a, b] ou I = [a, b[ ou ainda I = ]a, b[, com a < b, o valor dasua probabilidade e sempre igual, ou seja,

P (X ∈ I) =

∫ b

af (x) dx

4. No caso discreto, P (X = a) representa a probabilidade de X tomar o valor a. No caso contınuo,contudo, f(a) nao representa a probabilidade de X tomar o valor a. Mais, se X e uma v.a.contınua, entao P (X = a) = 0, ∀a ∈ R.

Exemplo 3.5 Suponhamos que o tempo de vida (em horas) de uma determinada marca de pilhas, X,e uma v.a. com funcao densidade de probabilidade:

f (x) =

0 x ≤ 0c/x2 x > 100

a) c pode ter um valor qualquer?

1. Como f (x) ≥ 0, ∀x ∈ R ⇒ c ≥ 0

Page 40: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 38

2. Como

∫ +∞

−∞f (t) dt = 1, entao

∫ +∞

−∞f (t) dt = c

∫ +∞

100

1

t2dt = c

[

−1

t

]+∞

100

=c

100= 1 ⇒ c = 100

b) Qual a probabilidade de uma destas pilhas durar mais de 500 horas?

P (X > 500) =

∫ +∞

500f(t)dt =

∫ +∞

500

100

t2dx = 100

[

−1

t

]+∞

500

= 0.2

2

3.5 Exercıcios Propostos

3.1 A variavel aleatoria (v.a.) X representa o numero de doentes com gripe que procuram, por dia,o Dr. Remedios. A sua funcao de probabilidade e dada por:

X

0 1 2 3p 0.2 q 0.3

(a) Sabendo que em 50% dos dias pelo menos 2 pacientes procuram o Dr. Remedios com gripe,determine p e q.

(b) Determine a funcao distribuicao da v.a. X e esboce o seu grafico. Comente-o.

3.2 A v.a. X representa o numero de pontos que saem no lancamento de um determinado dado. Asua funcao distribuicao segue-se:

F (x) =

0, x < 11/6, 1 ≤ x < 21/4, 2 ≤ x < 41/2, 4 ≤ x < 57/12, 5 ≤ x < 61, x ≥ 6

(a) Calcule as seguintes probabilidades, usando a funcao distribuicao dada:

i) A probabilidade de o numero de pontos saıdos ser no maximo 3.

ii) P (1 < X ≤ 2).

iii) P (2 ≤ X < 6).

iv) A probabilidade de o numero de pontos saıdos nao distar de 2 pontos por mais de 1ponto.

(b) Determine a funcao de probabilidade de X e confirme os resultados acima obtidos.

(c) Pode afirmar que o dado e equilibrado? Justifique.

Page 41: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 39

(d) Sabendo que o numero de pontos saıdo e pelo menos 4, calcule a probabilidade de saırem6 pontos.

3.3 O Sr. Matias possui um cafe nas vizinhancas de um estadio de futebol. Da sua experiencia, oSr. Matias sabe que, em dias de futebol, costuma vender ou 50, ou 100, ou 150 ou 200 sandes,com probabilidades 0.2, 0.4, 0.3 e 0.1, respectivamente.O Sr. Matias costuma fazer 100 sandes e quando estas se esgotam recorre a um fornecedor daterra que lhe garante o envio atempado de mais sandes.

(a) Qual a probabilidade de as sandes preparadas pelo Sr. Matias serem insuficientes parasatisfazer a procura?

(b) Calcule a probabilidade de vender 200 sandes, num dia em que as sandes por ele feitas naosatisfazem a procura.

3.4 Admita que a v.a. X representa a diferenca entre o numero de dias estimado para a conclusao deum projecto e o numero efectivo de dias de execucao. Sabe-se que esta variavel tem a seguintefuncao de probabilidade:

X

−2 −1 0 1 20.25 0.30 0.25 0.10 0.10

(a) Quando o numero de dias estimado e excedido ha uma penalizacao. Essa penalizacao,digamos Y , custa 10,000 unidades monetarias (u.m.) por cada dia de atraso, transformando-se em bonus quando o tempo estimado for superior ao tempo efectivo. Determine a funcaode probabilidade da penalizacao/bonus.

(b) Determine ainda a funcao de probabilidade da v.a. Z = 5000X + Y .

3.5 O Sr. Speed pretende obter a carta de conducao, mas para isso e necessario que seja aprovadono exame escrito de codigo. Suponha que a probabilidade de ser aprovado em cada exame quevier a realizar e constante e igual a 0.4 e que os resultados de cada tentativa sao independentes.Determine a funcao de probabilidade da v.a. X que indica o numero de exames de codigo arealizar pelo Sr. Speed, ate conseguir a aprovacao (incluindo o exame em que e aprovado).

3.6 Seja X uma v.a. com a seguinte funcao densidade probabilidade:

f(x) =

k + x, −1 ≤ x < 0k − x, 0 ≤ x < 10, c.c.

(a) Determine o valor da constante k.

(b) Determine a funcao distribuicao de X e esboce o seu grafico.

(c) Determine P (X > 0).

(d) Determine P (X > 0.5|X > 0).

3.7 Seja X uma v.a. com a seguinte funcao densidade probabilidade:

f(x) =

4x, 0 < x < k0, c.c.

Page 42: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 40

(a) Esboce o grafico da funcao densidade e determine o valor da constante k.

(b) Determine a funcao distribuicao de X.

(c) Calcule P (1/4 ≤ X ≤ 1/3).

3.8 A quantidade de tempo, em horas, que um computador funciona ate avariar e uma v.a. com aseguinte funcao densidade probabilidade:

f(x) =

k e−x

100 , x ≥ 00, x < 0

(a) Qual a probabilidade de o computador trabalhar entre 50 e 150 horas antes de avariar?

(b) Qual a probabilidade de o computador funcionar menos de 100 horas ate avariar? E exac-tamente 100 horas?

(c) Qual a probabilidade de o computador avariar apos 200 horas de funcionamento, sabendoque ja funcionou mais de 100 horas?

3.9 Seja X uma v.a. com a seguinte funcao densidade:

f(x) =

sen(x)2 , 0 ≤ x ≤ π0, c.c.

(a) Determine a funcao distribuicao de X.

(b) Determine o numero a tal que P (X ≤ a) = P (X ≥ a). Como se designa a?

(c) Calcule P (X ≤ π/4 | π/6 < X < π/3)

3.10 A proporcao de cobre numa liga de ouro e cobre e uma v.a. X com a seguinte funcao densidadeprobabilidade:

f(x) =

6x(1 − x), 0 ≤ x ≤ 10, c.c.

(a) Determine a funcao distribuicao de X.

(b) O preco de venda ao publico, em unidades monetarias por grama (u.m./g), da referida ligadepende do seu conteudo em cobre:

Conteudo em cobre Preco por grama (u.m./g)X ≤ 0.05 12.5

0.05 < X ≤ 0.1 9.50.1 < X ≤ 0.5 5.0

X > 0.5 2.5

Sendo o custo de producao da liga cobre-ouro de 1 u.m./g, independentemente das pro-porcoes de cada metal, determine a distribuicao do lucro por grama.

Page 43: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 41

3.11 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

A funcao distribuicao de uma qualquer variavel aleatoria e uma funcao cujo contradomınio temnecessariamente de ser limitado.

(Exercıcio de exame)

Page 44: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 4

Momentos e outros parametros de umadistribuicao de probabilidade

O estudo de distribuicoes de probabilidade de uma variavel aleatoria (v.a.) resume-se frequentementeapenas ao estudo de algumas caracterısticas numericas que as identificam, designadas por parametrosda distribuicao. Muitos destes parametros, que se dizem populacionais, tem um grande paralelismocom as medidas resumo que aprendemos para analisar conjuntos de dados, no capıtulo 1.

4.1 Momentos de uma distribuicao

Comecamos por estudar uma classe de parametros designados por momentos de uma distribuicaode probabilidade, baseada no conceito de esperanca matematica:

Definicao 4.1 Define-se valor medio ou valor esperado ou media de uma v.a. X como:

(a) µ = E [X] =

∞∑

i=1

xiP (X = xi)1, se X v.a. discreta com f. probabilidade pi = P (X = xi),∀i.

(b) µ = E [X] =

∫ +∞

−∞xf(x)dx 2, se X v.a. contınua com funcao densidade f(.).

Exemplo 4.1 Represente a v.a. X o numero de caras em 4 lancamentos de uma moeda equilibrada.Quantas caras se espera que saiam nos 4 lancamentos? A resposta e imediata e intuitiva - 2 caras.Confirmemos:

X

0 1 2 3 40.0625 0.25 0.375 0.25 0.0625

E [X] = 0× 0.0625 + 1× 0.25 + 2× 0.375 + 3× 0.25 + 4× 0.0625 = 2 caras.

1Caso esta serie seja absolutamente convergente, ficando doravante esta nota subjacente a todas as definicoes deste

tipo.2Caso este integral seja absolutamente convergente, ficando doravante esta nota subjacente a todas as definicoes deste

tipo.

42

Page 45: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 43

2

Exemplo 4.2 Suponha que o seu medico lhe aconselha que faca uma dieta para emagrecimento, du-rante 2 semanas. Considerando a sua estrutura fısica, pressupoe que o peso (em kg) que vai perder sesitua, com igual probabilidade, entre 2 e 4 kg. Quantos quilos espera perder nas duas semanas?

f (x) =

1/2 2 ≤ x ≤ 40 c.c

E (X) =

∫ +∞

−∞xf (x) dx =

∫ 4

2x× 1

2dx =

[

x2

4

]4

2

= 3 kg

2

Teorema 4.1 Seja X uma v.a. e φ uma funcao real de variavel real contınua quase em toda a parte(i.e., se tiver pontos de descontinuidade eles formam quanto muito um conjunto numeravel). Entao ovalor medio ou valor esperado ou media de φ(X) e dado por:

(a) E [φ(X)] =

∞∑

i=1

φ(xi)P (X = xi), se X v.a. discreta com f. probabilidade pi = P (X = xi),∀i.

(b) E [φ(X)] =

∫ +∞

−∞φ(x)f(x)dx, se X v.a. contınua com funcao densidade f(.).

desde que os lados direitos das igualdades anteriores convirjam absolutamente.

Corolario 4.1.1 Seja X uma v.a.. Definem-se momentos de ordem k (em torno da origem)da v.a. X por:

(a) mk = E [Xk] =

∞∑

i=1

xki P (X = xi), se X v.a. discreta com f. probabilidade pi = P (X = xi),∀i.

(b) mk = E [Xk] =

∫ +∞

−∞xkf(x)dx, se X v.a. contınua com funcao densidade f(.).

desde que os lados direitos das igualdades anteriores convirjam absolutamente.

Corolario 4.1.2 Seja X uma v.a., a e b constantes reais. Entao:

X E (b) = b;

X E (aX + b) = aE (X) + b.

Exemplo 4.3 Relativamente ao exemplo 4.2, em que a v.a. X representa o peso que se perde emduas semanas de regime, imagine que voce tinha vontade de continuar por mais 2 semanas a referidadieta. No entanto, a conselho medico, a nova dieta nao deve ser tao rigorosa como a anterior, sendode prever que o que vai abater neste novo perıodo de regime (traduzido numa nova v.a. Y ) seja apenas

Page 46: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 44

metade do que tinha acontecido anteriormente (Y = X2 ). Quanto espera vir a emagrecer nestas outras

duas semanas?Apetece logo responder 1.5Kg. Confirmemos:

E [Y ] = E

[

X

2

]

=

∫ +∞

−∞

x

2f (x) dx =

∫ 4

2

x

2× 1

2dx =

[

x2

8

]4

2

= 1.5 kg

ou

E [Y ] = E

[

X

2

]

=1

2× E [X] =

1

2× 3 = 1.5 kg

2

Definicao 4.2 Seja X uma v.a.. Definem-se momentos centrais de ordem k da v.a. X por:

µk = E [(X − µ)k], desde que o lado direito da igualdade exista.

O caso k = 2 e especialmente importante:

Definicao 4.3 Seja X uma v.a.. Chamamos a µ2 a variancia da v.a. X, e escreve-se σ2 = V (X) =E [(X −µ)2], desde que o lado direito da igualdade exista. A σ =

V (X) chamamos desvio padraoda v.a. X.

Proposicao 4.1 Se X e uma v.a., para a qual existe variancia, entao

V (X) = E(

X2)

− E 2 (X)

Exemplo 4.4 Retomemos o exemplo 4.1 da v.a. X que representa o numero de caras saıdas em 4lancamentos de uma moeda equilibrada. Calculemos a variancia e o desvio padrao de X, relembrando--nos que E [X] = 2:

V (X) = E [X2]− E 2[X] =4∑

x=0

x2P (X = x)− 22 = 5− 4 = 1 caras2

σ =√

V (X) = 1 caras.

2

Exemplo 4.5 Retomemos agora o exemplo 4.2 da v.a. X que representa o peso perdido em 2 semanasde dieta. Calculemos a variancia e o desvio padrao de X (E [X] = 3):

V (X) = E [X2]− E 2[X] =

∫ +∞

−∞x2f(x)dx− 32 =

∫ 4

2x2 × 1

2dx− 9 =

[

x3

6

]4

2

− 9 ' 0.33 Kg2

σ =√

V (X) ' 0.58 Kg.

2

Page 47: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 45

Proposicao 4.2 Seja X uma v.a., a e b constantes reais. Entao:

X V (b) = 0;

X V (aX + b) = a2V (X).

Teorema 4.2 (Desigualdade de Chebychev)Se X e uma v.a. para a qual existe variancia σ2 e k > 0 e uma constante real positiva, entao

P (|X − µ| ≥ kσ) ≤ 1

k2⇔ P (|X − µ| < kσ) ≥ 1− 1

k2

Observacao: Este teorema permite-nos concluir que a probabilidade da v.a. X assumir valores nointervalo [µ− 2σ, µ + 2σ] e superior a 1− 1/4 = 0.75 (caso k = 2). Ja se k = 3, podemos afirmar quea probabilidade da v.a. X assumir valores no intervalo [µ− 3σ, µ + 3σ] e superior a 1 − 1/9 = 0.89.Estas conclusoes sao independentes da forma da distribuicao da v.a.!

4.2 Parametros descritivos das distribuicoes

Como ja se referiu anteriormente muitas distribuicoes de probabilidade sao descritas por modelosmatematicos que dependem de alguns parametros que as identificam.

Considere-se, por exemplo, o caso de duas variaveis aleatorias X e Y contınuas, com funcoesdensidade probabilidade f(x) e g(y), respectivamente, desenhadas na figura abaixo.

f(x),

g(y)

f (x) g(y)

d

x, y

0.0

0.1

0.2

0.3

0.4

0.5

−4 −2 0 2 4

As funcoes densidade apresentam ambas a mesma forma, podendo-se obter uma da outra por umasimples translacao por d. Teria pois interesse termos um coeficiente ou parametro que descrevesse aposicao de cada uma das funcoes, dito parametro de localizacao. Conhecida a forma da curva emquestao estes parametros identificam perfeitamente qual a distribuicao a que se refere.

Os mais comuns parametros de localizacao de uma distribuicao de probabilidade sao:

X Media ou valor esperado da v.a. X, µ, definido anteriormente. Existe quase sempre.

Page 48: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 46

X Mediana da v.a. X, designada por me, e definida como o valor que satisfaz as condicoesP (X ≤ me) ≥ 0.5 e P (X ≥ me) ≥ 0.5. Existe sempre.

X Quantil de ordem p ou 100p percentil da v.a. X, designado por qp, e definido como o valor quesatisfaz as condicoes P (X ≤ qp) ≥ p e P (X ≥ qp) ≥ 1− p. Existe sempre.

X Moda da v.a. X, designada por mo, e definida como o valor que maximiza a funcao de proba-bilidade ou a funcao densidade probabilidade, dependendo do caso, desde que seja unico. Nemsempre existe.

Considere-se agora outro aspecto relacionado com a forma das distribuicoes, mais precisamentecom a sua dispersao em torno da media, patente na figura seguinte:

f(x),

g(y)

f (x)

g(y)

x, y

0.0

0.2

0.4

0.6

0.8

1.0

−4 −2 0 2 4

Os parametros usados para capturar a forma como a distribuicao se ”espalha”em torno da mediasao chamados parametros de dispersao. Os mais usuais sao:

X Variancia (σ2) e desvio padrao (σ), ja anteriormente definidos. Existem quase sempre.

X Coeficiente de variacao, definido quando existem a media µ - que tem de ser positiva - e o desviopadrao σ, por c.v. = σ

µ × 100.

X Amplitude interquartis. Fixando o 1o quartil (= quantil 0.25) e o 3o quartil (= quantil 0.75)esta amplitude e dada por q0.75 − q0.25.

Ainda relacionado com a forma das distribuicoes definem-se parametros que dao uma indicacao dasua simetria e do seu achatamento. O primeiro designa-se por coeficiente de simetria e define-secomo:

β1 =µ3

σ3,

onde µ3 e o momento central de ordem 3 da v.a. e σ o seu desvio padrao. Quando este coeficiente enulo indica uma distribuicao simetrica, como as que aparecem nos graficos anteriores. Se β1 > 0 fala-sede uma distribuicao assimetrica positiva e se β1 < 0 temos uma distribuicao assimetrica negativa.

Page 49: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 47

Relativamente ao achatamento da distribuicao, define-se coeficiente de achatamento ou kur-tosis como:

β2 =µ4

σ4− 3,

onde µ4 e o momento central de ordem 4 da v.a. e σ o seu desvio padrao. Conforme β2 for menorou maior falamos, respectivamente, de uma distribuicao mais achatada (conforme a curva a verde dadistribuicao do grafico anterior) ou menos achatada (como a azul).

4.3 Exercıcios Propostos

4.1 A v.a. X representa o numero de vezes que o Jose, estranho personagem, vai ao cafe por dia.Este numero e determinado pelo seguinte procedimento:

X De manha o Jose lanca ao ar uma moeda equilibrada. Se sair cara ele vai ao cafe, casocontrario nao vai.

X A hora de almoco, se ele foi ao cafe de manha, so volta a ir se nao estiver a chover, o queacontece com uma probabilidade de 0.2. Se nao tiver ido de manha, volta a lancar moedaao ar e, novamente, so vai ao cafe se sair cara.

(a) Determine a funcao de probabilidade da v.a. X.

(b) Qual a probabilidade de o Jose tomar 2 cafes por dia, sabendo que toma pelo menos 1 nessedia?

(c) Determine o numero medio de cafes que o Jose toma por dia e a sua variancia.

4.2 Determine o valor medio e a variancia da v.a. discreta X com funcao de probabilidade: f(0) = 18

f(1) = 38 f(2) = 3

8 f(3) = 18 . Calcule ainda:

E [g(X)], com g(X) = X3, E

[

1

1 +X

]

e E [X2].

4.3 Seja X uma v.a. tal que P (X = 0) = 14 , P (X = 1) = p

2 , P (X = 2) = 58 − p

2 e P (X = 3) = 18 ,

com 0 ≤ p ≤ 12 . Determine p de forma a que V (X) seja mınima.

4.4 Numa lotaria foram emitidos 10000 bilhetes. Sorteia-se 1 premio de 25000 unidades monetarias(u.m.) e 10 premios de 2500 u.m.. Seja X a v.a. que representa o valor do premio de um bilhetequalquer.

(a) Determine a funcao de probabilidade de X.

(b) Qual a probabilidade de um bilhete nao ter qualquer premio?

(c) Qual a probabilidade de um bilhete ter pelo menos 2500 u.m.?

(d) Determine o E [X], V (X) e c.v.(X). Comente.

Page 50: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 48

4.5 Uma comissao de alunos esta a organizar uma festa da faculdade. Os alunos vao comprar 200litros de cerveja. Um fornecedor deste lıquido (A) cobra 1 unidade monetaria (u.m.) por litropermitindo a devolucao da cerveja que sobrar (e que nao tem de ser paga) e um outro fornecedor(B) cobra 0.5 u.m. por litro, nao admitindo devolucoes. Os alunos, independentemente dequanto lhes custe a cerveja, cobram 1.5 u.m. por litro.

Sabendo que, se estiver bom tempo - o que acontecera com probabilidade 0.8 - os alunos con-seguem vender os 200 litros de cerveja, mas se estiver mau tempo so vendem metade, a quemdevem comprar?

4.6 Seja X uma v.a. com a seguinte funcao distribuicao:

F (x) =

0, x < 01− (x+ 1)e−x, x ≥ 0

(a) Determine a funcao densidade probabilidade de X.

(b) Determine E [X] e V (X).

4.7 Determine E [X], E [X − 1], V (X), E [X(X − 1)], E [eX ], a mediana e o coeficiente de variacaoda v.a. X que tem a seguinte funcao densidade probabilidade:

f(x) =

x2 , 0 ≤ x ≤ 1

12 , 1 < x ≤ 2

3−x2 , 2 < x ≤ 3

0, x < 0 ∨ x > 3

4.8 A v.a. X tem a seguinte funcao densidade probabilidade:

f(x) =

k sin(x), 0 ≤ x ≤ π0, c.c.

(a) Determine o valor da constante k.

(b) Determine E [X].

(c) Sabendo que V (X) = π2

4 − 2, determine E [X2].

(d) Determine E [cos(X)].

(e) Determine V(5X-4).

4.9 A distribuicao com a seguinte funcao densidade e a chamada distribuicao de Cauchy:

f(x) =1

π(1 + x2), x ∈ R

Mostre que esta distribuicao nao tem valor medio.

Page 51: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 49

4.10 Numa reparticao publica o horario de atendimento e das 10h as 17h e o tempo de espera ate seratendido (horas) e uma v.a. X com a seguinte funcao densidade probabilidade (f.d.p.):

f(x) =

λe−λx, x ≥ 00, x < 0

O parametro λ da f.d.p. depende da hora a que se for a referida reparticao, valendo λ = 14 no

perıodo das 10h as 15h e λ = 16 no perıodo das 15h as 17h. Sabendo que a probabilidade de

uma pessoa qualquer, que tem de ir a referida reparticao, o fazer no 1o perıodo (10h-15h) e de0.4, determine:

(a) A probabilidade de uma pessoa que vai a reparticao as 11h esperar no maximo 20 minutos.

(b) A probabilidade de uma pessoa que vai a reparticao as 16h esperar pelo menos 20 minutos.

(c) O tempo de espera medio, mediano e modal e respectiva variancia e coeficiente de variacao,no perıodo das 10h as 15h.

(d) O tempo de espera medio, mediano e modal e respectiva variancia e coeficiente de variacao,no perıodo das 15h as 17h.

4.11 O tempo (horas) que o tecnico Manel demora a compor um aparelho de vıdeo e uma variavelaleatoria cuja funcao densidade e dada por:

f(x) =

13 , 0 < x < 30, c.c.

(a) Qual a probabilidade de o tecnico Manel demorar mais de 2 horas a compor um vıdeo?

(b) Quanto tempo demora, em media, o tecnico a compor um aparelho de vıdeo?

(c) O custo da reparacao (e) depende do tempo que a mesma demora a executar, sendo iguala (40 + 3

√X). Qual o custo medio de compor um aparelho de vıdeo?

(Exercıcio de exame)

4.12 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Abaixo encontra-se a funcao distribuicao da v.a. discreta X. Entao o seu valor esperadovale 6.3.

F (x) =

0.0, x < 50.4, 5 ≤ x < 60.6, 6 ≤ x < 70.9, 7 ≤ x < 101.0, x ≥ 10

(b) Em determinado exame de Probabilidades e Estatıstica verificou-se que a media das notasfoi de 9 valores mas que a sua mediana foi de 4 valores. Esta situacao e impossıvel.

(c) A distribuicoes de probabilidade assimetricas esquerdas correspondem valores de variancianegativos.

Page 52: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 50

(d) Considere o grafico seguinte referente a valores observados de duas variaveis aleatorias, X1

e X2:

X1

X2

−10

−10

−5

−5

0

0

5

5

10

10

Entao podemos afirmar com base neste grafico que X1 e X2 tem a mesma media mas quea variancia de X2 e maior do que a de X1.

(Exercıcio de exame)

4.13 Num concurso de televisao o apresentador propoe ao concorrente o seguinte jogo: atiram-se aoar 3 moedas, em simultaneo, e se todos os lancamentos resultarem em caras o apresentador da10e ao concorrente; Se todos os lancamentos resultarem em coroas o apresentador da igualmenteao concorrente 10e. Mas se os lancamentos resultarem em 2 caras e 1 coroa ou em 2 coroas e 1cara, o concorrente tem de dar ao apresentador 5e.

(a) Represente X a quantidade de dinheiro ganha pelo concorrente. Determine a sua funcaode probabilidade.

(b) Baseado no valor esperado de X diga se o concorrente deve aceitar jogar este jogo.

(Exercıcio de exame)

4.14 Seja X uma variavel aleatoria com a seguinte funcao densidade probabilidade:

f(x) =

16 , −2 ≤ x ≤ 40, caso contrario

(a) Determine P (−1 ≤ X ≤ 1|X > 0).

(b) Considere a variavel aleatoria Y = X2. Determine P (Y ≤ 1).

(c) Ainda considerando Y = X2, determine a media e a variancia de Y .

(Exercıcio de exame)

Page 53: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 5

Vectores aleatorios

Em muitas experiencias aleatorias os resultados sao traduzidos nao apenas por uma unica quantidadenumerica, mas por duas ou mais. Por exemplo, ao estudar a estatura fısica das pessoas de uma certapopulacao e usual registar-se um par de medidas (x, y) em que x representa a altura de uma pessoa ey o respectivo peso.

Assim, para descrever convenientemente essas experiencias temos de estudar vectores de variaveisaleatorias, ditos vectores aleatorios.

Definicao 5.1 Seja (Ω,S) um espaco amostral. Um vector aleatorio de dimensao p, X = (X1, . . . ,Xp)e uma funcao real e finita, X : Ω → Rp, definida como X(ω) = (X1(ω), . . . ,Xp(ω)), ω ∈ Ω, tal quepara x = (x1, . . . , xp) ∈ Rp,

Ax = ω ∈ Ω : (X1(ω) ≤ x1,X2(ω) ≤ x2, . . . ,Xp(ω) ≤ xp) ∈ S,

i.e., Ax e um acontecimento.

Teorema 5.1 Sejam X1,X2, . . . ,Xp p variaveis aleatorias. Entao X = (X1, . . . ,Xp) e um vectoraleatorio de dimensao p.

Aqui vamos restringir-nos apenas aos vectores aleatorios com dois elementos, ditos pares aleatorios,representados por (X,Y ). Estes podem ser do tipo discreto, contınuo ou misto, conforme X e Y saovariaveis de tipo discreto, contınuo ou uma discreta e a outra contınua.

5.1 Par aleatorio discreto

Definicao 5.2 Um par aleatorio (X,Y ) e dito ser discreto se toma valores num conjunto nu-meravel de pares de pontos com probabilidade 1, i.e. se existe D =

(xi, yj) ∈ R2 : P (X = xi, Y = yj) > 0,i = 1, 2, . . . , j = 1, 2, . . ., quanto muito numeravel, tal que P ((X,Y ) ∈ D) = 1.

Definicao 5.3 Seja (X,Y ) um par aleatorio discreto tomando valores no conjunto D =

(xi, yj) ∈ R2 :P (X = xi, Y = yj) > 0, i = 1, 2, . . . , j = 1, 2, . . .. Chamamos funcao de (massa) probabilidadeconjunta de (X,Y ) a:

51

Page 54: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 52

pij = P (X = xi, Y = yj), i = 1, 2, . . . , j = 1, 2, . . .

verificando as seguintes condicoes:

(i) 0 ≤ pij ≤ 1, ∀(xi, yj) ∈ D;

(ii)+∞∑

i=1

+∞∑

j=1

pij = 1

A representacao da funcao de probabilidade conjunta do par aleatorio discreto costuma-se fazerda seguinte forma:

X\Y y1 y2 . . . yj . . .

x1 p11 p12 . . . p1j . . . p1· =∑

j=1 p1j

x2 p21 p22 . . . p2j . . . p2· =∑

j=1 p2j

......

.... . .

.... . .

...

xi pi1 pi2 . . . pij . . . pi· =∑

j=1 pij

......

.... . .

.... . .

...

p·1 =∑

i=1 pi1 p·2 =∑

i=1 pi2 . . . p·j =∑

i=1 pij . . . 1

Definicao 5.4 Dado um par aleatorio discreto (X,Y ) define-se funcao de probabilidade marginalde X e funcao de probabilidade marginal de Y como:

pi· = P (X = xi) =∞∑

j=1

P (X = xi, Y = yj) =∞∑

j=1

pij, i = 1, 2, . . .

p·j = P (Y = yj) =

∞∑

i=1

P (X = xi, Y = yj) =

∞∑

i=1

pij, j = 1, 2, . . .

Estas duas funcoes sao funcoes de probabilidade de variaveis aleatorias unidimensionais.

Exemplo 5.1 Seja (X,Y ) um par aleatorio, representando X o numero de batatas que nascem deuma unica semente de batata e Y o numero de vezes que se adubou as respectivas batateiras, desde asua sementeira ate a sua apanha. A funcao de probabilidade conjunta de (X,Y ) segue-se:

X \ Y 1 2 3

2 0.13 0.03 0.04 P(X=2)=0.23 0.10 0.12 0.08 P(X=3)=0.34 0.07 0.13 0.10 P(X=4)=0.35 0.03 0.05 0.12 P(X=5)=0.2

P(Y=1)=0.33 P(Y=2)=0.33 P(Y=3)=0.34 1

Page 55: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 53

Daqui se ve o seguinte:

X A probabilidade de terem nascido 5 batatas de uma batateira apenas adubada 1 vez e:

P (X = 5, Y = 1) = 0.03

X A probabilidade de nascerem menos batatas do que a quantidade de vezes que se adubou a cor-respondente batateira e:

P (X < Y ) = P (X = 2, Y = 3) = 0.04

X A probabilidade de nascerem 5 batatas e:

P (X = 5) = P (X = 5, Y = 1)+P (X = 5, Y = 2)+P (X = 5, Y = 3) = 0.03+0.05+0.12 = 0.20

X A probabilidade de determinada batateira so ter sido adubada 2 vezes e:

P (Y = 2) = P (X = 2, Y = 2) + P (X = 3, Y = 2) + P (X = 4, Y = 2) + P (X = 5, Y = 2) =

= 0.03 + 0.12 + 0.13 + 0.05 = 0.33

X A funcao probabilidade marginal de X e:

X

2 3 4 50.2 0.3 0.3 0.2

X A funcao probabilidade marginal de Y e:

Y

1 2 30.33 0.33 0.34

2

Definicao 5.5 Seja (X,Y ) um par aleatorio discreto. Se P (Y = yj) > 0, a funcao

P (X = xi|Y = yj) =P (X = xi, Y = yj)

P (Y = yj),

para j fixo, chama-se funcao de probabilidade condicionada de X dado Y = yj.

Page 56: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 54

Definicao 5.6 Seja (X,Y ) um par aleatorio discreto. Se P (X = xi) > 0, a funcao

P (Y = yj|X = xi) =P (X = xi, Y = yj)

P (X = xi),

para i fixo, chama-se funcao de probabilidade condicionada de Y dado X = xi.

Exemplo 5.2 Relativamente ao par aleatorio (X,Y ) do exemplo 5.1, determinemos a funcao deprobabilidade condicionada de X dado que apenas se adubou uma vez, i.e. Y = 1:

P (X = 2|Y = 1) =P (X = 2, Y = 1)

P (Y = 1)=

0.13

0.33' 0.394

P (X = 3|Y = 1) =P (X = 3, Y = 1)

P (Y = 1)=

0.10

0.33' 0.303

P (X = 4|Y = 1) =P (X = 4, Y = 1)

P (Y = 1)=

0.07

0.33' 0.212

P (X = 5|Y = 1) =P (X = 5, Y = 1)

P (Y = 1)=

0.03

0.33' 0.091

Assim,

X|Y = 1

2 3 4 50.394 0.303 0.212 0.091

Determinemos agora a funcao de probabilidade de Y sabendo que apenas obtivemos 2 batatas,i.e. X = 2.

P (Y = 1|X = 2) =P (X = 2, Y = 1)

P (X = 2)=

0.13

0.2= 0.65

P (Y = 2|X = 2) =P (X = 2, Y = 2)

P (X = 2)=

0.03

0.2' 0.15

P (Y = 3|X = 2) =P (X = 2, Y = 3)

P (X = 2)=

0.04

0.2' 0.20

Entao,

Y |X = 2

1 2 30.65 0.15 0.20

2

Page 57: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 55

5.2 Par aleatorio contınuo‡

Definicao 5.7 Um par aleatorio (X,Y ) diz-se contınuo se existe uma funcao nao negativa fX,Y talque, ∀(x, y) ∈ R2,

P (X ≤ x, Y ≤ y) =

∫ x

−∞

∫ y

−∞fX,Y (u, v)dudv.

A funcao fX,Y chamamos funcao densidade probabilidade conjunta ou apenas funcao densi-dade conjunta.

Notas:

1. A funcao fX,Y satisfaz as seguintes condicoes:

(i) fX,Y (x, y) ≥ 0, ∀(x, y) ∈ R2;

(ii)∫ +∞−∞

∫ +∞−∞ fX,Y (x, y)dxdy = 1.

2. Dado um qualquer intervalo I ⊂ R2,

P ((X,Y ) ∈ I) =

∫ ∫

IfX,Y (x, y)dxdy

Como fX,Y e uma funcao nao negativa entao esta probabilidade corresponde ao volume do espacodelimitado pela fX,Y e pelo intervalo I.

Definicao 5.8 Dado um par aleatorio contınuo (X,Y ) define-se funcao densidade de probabil-idade marginal de X e a funcao densidade de probabilidade marginal de Y , designando-serespectivamente por fX e fY , como:

fX (x) =

∫ +∞

−∞f(X,Y ) (x, y) dy, ∀x ∈ R

fY (y) =

∫ +∞

−∞f(X,Y ) (x, y) dx, ∀y ∈ R

Estas duas funcoes sao funcoes densidade de probabilidade de variaveis aleatorias uni-dimensionais.

Exemplo 5.3 Os tempos de vida, em centenas de horas, das duas componentes principais de umsistema de controlo sao v.a.’s (X,Y ) com funcao densidade conjunta

fX,Y (x, y) =

cx2y 0 < x < 3, 0 < y < 20 outros valores de (x, y) ∈ R2

a) Qual o valor de c?

fX,Y (x, y) ≥ 0, ∀ (x, y) ∈ R2 ⇒ c ≥ 0

∫ +∞

−∞

∫ +∞

−∞fX,Y (x, y) dxdy = 1 ⇔

∫ 3

0

∫ 2

0cx2y dxdy = 1 ⇔ c = 1/18

Page 58: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 56

b) Qual a probabilidade de cada uma das componentes durar mais de 100 horas?

P (X > 1, Y > 1) =

∫ 3

1

∫ 2

1

1

18x2y dxdy =

13

18

c) Qual a probabilidade da 1a componente durar mais de 100 horas?

P (X > 1) =

∫ 3

1

fXdx =?

fX (x) =

∫ +∞

−∞

f(X,Y ) (x, y) dy =

∫ 2

0

1

18x2y dy =

x2

9, 0 < x < 3

P (X > 1) =

∫ 3

1

x2

9dx =

26

27

2

Proposicao 5.1 Seja fX,Y a funcao densidade conjunta de um par aleatorio contınuo (X,Y ) e sejafY a funcao densidade marginal de Y . Em todos os pontos (x, y) onde fX,Y e contınua e fY (y) > 0 ee contınua, a funcao densidade condicionada de X, dado que Y = y, existe e calcula-se como:

fX|Y (x|y) =fX,Y (x, y)

fY (y).

Proposicao 5.2 Seja fX,Y a funcao densidade conjunta de um par aleatorio contınuo (X,Y ) e sejafX a funcao densidade marginal de X. Em todos os pontos (x, y) onde fX,Y e contınua e fX(x) > 0e e contınua, a funcao densidade condicionada de Y , dado que X = x, existe e calcula-se como:

fY |X(y|x) = fX,Y (x, y)

fX(x).

5.3 Independencia entre variaveis aleatorias

A distribuicao conjunta de um vector aleatorio determina de forma unica as distribuicoes marginaisde cada uma das suas componentes mas o contrario, em geral, nao e verdade. Aprendemos nesta seccaouma classe especial de variaveis para as quais isto acontece.

Definicao 5.9 Seja (X,Y ) um par aleatorio discreto. As variaveis X e Y dizem-se independentesse e so se

P (X = xi, Y = yj) = P (X = xi)P (Y = yj) , ∀ (xi, yj) ∈ D

ou numa notacao simplificada,

pij = pi·p·j, i, j = 1, 2 . . .

Page 59: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 57

Definicao 5.10 ‡ Seja (X,Y ) um par aleatorio contınuo. As variaveis X e Y dizem-se indepen-dentes se e so se

fX,Y (x, y) = fX (x) fY (y) , ∀ (x, y) ∈ R2

Exemplo 5.4 Retomemos o exemplo 5.1, relativamente ao numero de batatas por batateira e a quan-tidade de vezes que esta foi adubada. Como temos, por exemplo, que:

P (X = 2, Y = 1) = 0.13

P (X = 2) = 0.2

P (Y = 1) = 0.33

P (X = 2)× P (Y = 1) = 0.2× 0.33 = 0.066 6= 0.13 = P (X = 2, Y = 1),

entao as variaveis X e Y nao sao independentes - o numero de batatas por batateira depende daquantidade de adubacao. 2

Exemplo 5.5 ‡ Continuemos o exemplo 5.3:

d) Os tempos de vida das componentes sao independentes?

fX (x) =

∫ +∞

−∞

fX,Y (x, y) dy =

∫ 2

0

1

18x2y dx =

x2

9, 0 < x < 3

fY (y) =

∫ +∞

−∞

fX,Y (x, y) dx =

∫ 3

0

1

18x2y dx =

y

2, 0 < y < 2

fX (x) =

x2/9 0 < x < 30 c.c.

fY (y) =

y/2 0 < y < 20 c.c.

fX,Y (x, y) =

118x

2y 0 < x < 3, 0 < y < 20 c.c

= fX (x) fY (y)

Logo as variaveis sao independentes.

e) Com a informacao da alınea anterior, a alınea b) no exercıcio 5.3 poder-se-ia determinar deoutra forma:

P (X > 1, Y > 1) = P (X > 1)P (Y > 1) =26

27× 3

4=

13

18,

pois :

P (X > 1) =

∫ 3

1fX (x) dx =

∫ 3

1

x2

9dx =

26

27

P (Y > 1) =

∫ 2

1fY (y) dy =

∫ 2

1

y

2dy =

3

4

2

Page 60: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 58

5.4 Momentos de vectores aleatorios

Definicao 5.11 Seja (X,Y ) um par aleatorio e g : R2 → R uma funcao quase-contınua. Define-sevalor medio ou valor esperado ou media de g(X,Y ) como:

(a) E [g(X,Y )] =∞∑

i=1

∞∑

j=1

g(xi, yj)P (X = xi, Y = yj)1, se (X,Y ) for vector aleatorio discreto com

f. probabilidade conjunta pij = P (X = xi, Y = yj),∀i, j.

(b) E [g(X,Y )] =

∫ +∞

−∞

∫ +∞

−∞g(x, y)fX,Y (x, y)dxdy

2, se (X,Y ) vector aleatorio contınuo com funcao

densidade conjunta fX,Y (., .).

Nota: Em particular estaremos mais interessados no caso g(x, y) = xy, obtendo:

X E [XY ] =∑∞

i=1

∑∞j=1 xiyjP (X = xi, Y = yj)

X E [XY ] =∫ +∞−∞

∫ +∞−∞ xyfX,Y (x, y)dxdy

Definicao 5.12 Seja (X,Y ) um par aleatorio. Sendo µX = E [X] e µY = E [Y ], define-se co-variancia entre X e Y por:

cov (X,Y ) = E [(X − µX) (Y − µY )] ,

desde que o lado direito da igualdade exista.

Proposicao 5.3 Seja (X,Y ) um par aleatorio. Entao, caso exista a covariancia entre X e Y , estapode ser calculada atraves da formula:

cov (X,Y ) = E (XY )− E (X)E (Y )

A covariancia da uma indicacao sobre a forma como as variaveis sao relacionadas. Em geral, umvalor positivo de covariancia entre X e Y e uma indicacao que Y tende a crescer linearmente quandoX cresce e um valor negativo indica que Y tende a decrescer linearmente quando X cresce.

Teorema 5.2 Sejam X e Y variaveis aleatorias independentes tais que os seus valores medios, E [X]e E [Y ], respectivamente, existem. Entao,

E [XY ] = E [X]E [Y ]

Note-se que o teorema anterior e facilmente generalizavel a mais de duas variaveis aleatorias.

1Caso esta serie seja absolutamente convergente, ficando doravante esta nota subjacente a todas as definicoes deste

tipo.2Caso este integral seja absolutamente convergente, ficando doravante esta nota subjacente a todas as definicoes deste

tipo.

Page 61: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 59

Corolario 5.2.1 Se X e Y sao variaveis aleatorias independentes, entao cov(X,Y ) = 0.

Note-se que o resultado anterior trata-se de uma implicacao e nao equivalencia. Assim, pode havervariaveis cuja covariancia seja nula e elas ainda assim nao sejam independentes.

Teorema 5.3 Sejam X e Y variaveis aleatorias tais que existam as suas variancias, V (X) e V (Y ),respectivamente. Entao,

V (X ± Y ) = V (X) + V (Y )± 2cov(X,Y )

Tambem este teorema e facilmente generalizavel a mais de duas variaveis aleatorias.

Corolario 5.3.1 Se X e Y sao variaveis aleatorias independentes, entao V (X±Y ) = V (X)+V (Y ).

Exemplo 5.6 Retome-se o exemplo 5.1, da quantidade de batatas obtidas para diferentes esquemasde adubacao. Ja vimos que estas variaveis nao sao independentes, pelo que a sua covariancia podenao ser nula. Vamos calcula-la:

E [XY ] =

5∑

x=2

3∑

y=1

xyP (X = x, Y = y) = 2× 1× 0.13 + 2× 2× 0.03 + 2× 3× 0.04+

+ 3× 1× 0.10 + . . . = 7.33

E [X] =

5∑

x=2

xP (X = x) = 2× 0.2 + 3× 0.3 + 4× 0.3 + 5× 0.2 = 3.5

E [Y ] =3∑

y=1

yP (X = y) = 1× 0.33 + 2× 0.33 + 3× 0.34 = 2.01

cov(X,Y ) = E [XY ]− E [X]E [Y ] = 7.33 − 3.5× 2.01 = 0.295

2

Proposicao 5.4 Sejam X, Y , W e Z variaveis aleatorias, a, b, c e d constantes reais. Entao:

X cov(X,Y ) = cov(Y,X);

X cov(X,X) = V (X);

X cov (a+ bX, c + dY ) = bd cov (X,Y );

X cov (aX + bY, cZ + dW ) = ac cov (X,Z) + ad cov (X,W ) + bc cov (Y,Z) + bd cov (Y,W ).

Ja dissemos que a covariancia entre duas variaveis aleatorias X e Y da uma indicacao da existenciade alguma relacao linear entre elas. A forca desta relacao e medida atraves de uma quantidade chamadacoeficiente de correlacao.

Page 62: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 60

Definicao 5.13 Seja (X,Y ) um par aleatorio. Define-se coeficiente de correlacao entre (X,Y )como

ρ (X,Y ) =cov (X,Y )

V (X)V (Y )

Proposicao 5.5 Seja (X,Y ) um par aleatorio. Entao:

X −1 ≤ ρ (X,Y ) ≤ 1;

X |ρ (X,Y )| = 1 se e so se P (Y = a+ bX) = 1, sendo a e b constantes reais;

X Se X e Y sao v.a.’s independentes ρ (X,Y ) = 0.

Exemplo 5.7 Relativamente ao exemplo 5.1, calculemos o coeficiente de correlacao entre o numerode batatas por batateira (X) e o numero de adubagens (Y ).

cov(X,Y ) = 0.295

E [X] = 3.5

E [Y ] = 2.01

V (X) = E [X2]− E 2[X] =

5∑

x=2

x2P (X = x)− 3.52 =

= 22 × 0.2 + 32 × 0.3 + 42 × 0.3 + 52 × 0.2 − 12.25 = 13.3 − 12.25 = 1.05

V (Y ) = E [Y 2]− E 2[Y ] =

3∑

y=1

y2P (Y = y)− 2.012 =

= 12 × 0.33 + 22 × 0.33 + 32 × 0.34 − 4.0401 = 4.71 − 4.0401 = 0.6699

Entao:

ρ(X,Y ) =cov(X,Y )√

V (X)V (Y )=

0.295√1.05 × 0.6699

' 0.35

Assim concluımos que a relacao entre X e Y e fraca.

5.5 Exercıcios Propostos

5.1 Considere o vector aleatorio (X,Y ) com a seguinte funcao de probabilidade conjunta:

X \ Y 2 4 6

1 18

38 0 4

82 1

8 0 14

38

3 116

116 0 1

8516

716

14 1

Page 63: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 61

(a) Determine as funcoes de probabilidade marginais de X e de Y .

(b) As variaveis X e Y sao independentes?

(c) Calcule P (X + Y ≤ 5) e P (Y −X ≥ 3).

(d) Calcule E [X], E [Y ], V (X), V (Y ), cov(X,Y ) e V (X + Y ).

5.2 Numa empresa de aluguer de avioes informam-nos de que a procura diaria de avioes de pas-sageiros, X, e a procura diaria de avioes de transporte rapido de correio, Y , constituiem um paraleatorio (X,Y ), cuja funcao de probabilidade conjunta e dada por:

X \ Y 0 1 2

0 0 0.251 0.05 0.352 0.1 0.1 p+ 0.23 0 0.1 p

0.2 0.5

(a) Qual a probabilidade de, num dia, a procura de avioes de passageiros ser inferior a procurade avioes de transporte rapido de correio?

(b) Deduza a funcao de probabilidade da procura total de avioes de aluguer.

5.3 O Joao costuma jogar, todas as semanas, 3 partidas de tenis e 1 partida de xadrez, contra a suanamorada. Verifica-se que o Joao ganha a partida de xadrez com probabilidade 0.4. Quanto aosjogos de tenis, ganha 40% das vezes as 3 partidas, 30% das vezes 2 partidas e 10% das vezes 1partida.

Considere que os resultados do tenis sao independentes dos resultados do xadrez.

Represente X o numero de vezes que o Joao ganha, por semana, a partida de xadrez e Y onumero de vezes que ganha ao tenis.

(a) Determine a funcao de probabilidade conjunta do vector aleatorio (X,Y ) e as funcoes deprobabilidade marginais de X e de Y .

(b) Determine o numero medio de vitorias do Joao no xadrez e no tenis, por semana, e osrespectivos desvios padrao.

(c) Determine cov(X,Y ).

5.4 Um supermercado tem para venda leite de uma determinada marca, disponıvel em embalagens de1 litro e de 1/2 litro. Relativamente ao numero de embalagens desta marca vendidas diariamente,considere as v.a.’s X-no de embalagens de 1 litro e Y -no de embalagens de 1/2 litro. Acercadestas v.a.’s sabe-se que:

X O domınio de X e 0, 1, 2, 3 e Y pode assumir valores 0 ou 1.

X Os valores de Y sao igualmente provaveis.

X 20% dos dias nao se vendem embalagens de 1 litro e P (X = 1) = P (X = 2).

X Todos os dias se vendem embalagens desta marca de leite.

X P (X = 2;Y = 0) = P (X = 2;Y = 1) = 0.15

X Os dias em que se vendem 3 embalagens de 1 litro e nenhuma de 1/2 litro, ocorrem comprobabilidade 0.15.

Page 64: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 62

(a) Deduza a funcao de probabilidade conjunta do par aleatorio (X,Y ).

(b) Determine a probabilidade de num dia se venderem mais embalagens de 1 litro do que de1/2 litro.

(c) Num dia em que se registou a venda de 1/2 litro de leite, qual a probabilidade de se tervendido mais de que 1 embalagem de 1 litro.

(d) Estude a independencia das variaveis aleatorias X e Y .

5.5 Tendo o par aleatorio (X,Y ) a seguinte funcao de probabilidade conjunta:

X \ Y −a (a− 6) a 2a

0 k2

k2 k 0 2k

2 0 k2 k k

2 2kk2 k 2k k

2 1

(a) Determine o valor de k.

(b) Determine o valor de a sabendo que E [Y ] = 2E [X].

(c) Calcule cov(X,Y ).

5.6 Numa fabrica produzem-se ratos de computador, que podem sofrer de dois tipos diferentes dedefeitos - digamos A e B. Para cada rato produzido definem-se duas variaveis aleatorias, X e Y ,representando, respectivamente, o numero de defeitos do tipo A e do tipo B a si associados:

X =

0, rato sem defeito do tipo A

1, rato com defeito do tipo AY =

0, rato sem defeito do tipo B

1, rato com defeito do tipo B

Sabendo que P (Y = 0) = 0.80, P (X = 1|Y = 1) = 0.7 e P (X = 1|Y = 0) = 0.1:

(a) Determine a funcao de probabilidade conjunta do par aleatorio (X,Y ).

(b) Justifique se para cada rato o numero de defeitos do tipo A e independente do numero dedefeitos do tipo B.

(c) Calcule a P (X < Y ).

(d) Qual a probabilidade de o numero total de defeitos num qualquer rato da producao serinferior a 2?

5.7 Considere as famılias de determinado paıs com tres filhos. Neste universo representem X eY , respectivamente, o numero de filhos daltonicos e o numero de filhos canhotos, por famılia.Admita que o par aleatorio (X,Y ) tem a seguinte funcao de probabilidade conjunta:

X\Y 0 10 0.501 0.252 0.05 0.05 0.1

0.8 0.2

Page 65: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 63

(a) Sabendo que cov(X,Y ) = 0.09 complete o quadro das probabilidades conjuntas acima.

(b) Qual a proporcao de famılias que nao tem nenhum filho simultaneamente daltonico e can-hoto? Qual a proporcao de famılias sem filhos daltonicos? E sem filhos canhotos? O quee que estes resultados lhe podem dizer quanto a independencia entre o numero de filhosdaltonicos e o numero de filhos canhotos?

(c) Determine ρ(X,Y ). Comente.

5.8 Suponhamos que M1 e M2 sao duas maquinas que funcionam independentemente e sejam X e Yvariaveis aleatorias que representam, respectivamente, no diario de avarias de M1 e o no diariode avarias de M2. Sabendo que:

X A maquina M1 nunca avaria mais do que uma vez por dia e, que a maquina M2 avaria, nomaximo, duas vezes por dia;

X A probabilidade de M1 nao avariar e de 0.7;

X A probabilidade de M2 nao avariar e 0.5 e a de avariar duas vezes e 0.3,

Construa a tabela da funcao de probabilidade conjunta e marginais associada ao par aleatorio(X,Y ).

5.9 Sejam X e Y duas v.a.’s tais que V (X) = σ2 e V (Y ) = 2σ2. Considere novas v.a.’s T = 2X +Ye W = X − Y . Sabendo que V (W ) = σ2, calcule:

(a) O coeficiente de correlacao entre X e Y .

(b) V (T ).

(c) cov(W,T ).

5.10 Seja (X,Y ) um par aleatorio para o qual V (X) = V (Y ) = σ2 e coeficiente de correlacao ρ. Sejamas novas v.a.’s U = X + Y e W = X − Y . Mostre que V (W ) = 2σ2(1− ρ) e cov(U,W ) = 0.

5.11 ‡ Seja (X,Y ) um vector aleatorio com a seguinte funcao densidade probabilidade conjunta:

f(x, y) =

k(x+ 2y), 0 < x < 1, 0 < y < 10, c.c.

(a) Determine k.

(b) Determine as funcoes densidade marginais de X e Y .

(c) As variaveis X e Y sao independentes?

(d) Calcule P (15 < X < 25).

(e) Calcule P (X < Y ).

(f) Calcule P (15 < X < 25 |Y > 1

2 ),

5.12 ‡ Seja (X,Y ) um vector aleatorio com a seguinte funcao densidade probabilidade conjunta:

f(x, y) =

k, x > 0, y < 0, y > x− 20, restantes valores de (x,y)

Page 66: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 64

(a) Determine k.

(b) As variaveis X e Y sao independentes?

5.13 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Sejam X e Y duas variaveis aleatorias. Se cov(X,Y ) = 0 entao X e Y sao variaveisindependentes.

(b) A covariancia entre duas variaveis aleatorias e uma quantidade sempre positiva ou nula.

(Exercıcio de exame)

5.14 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Seja X uma v.a. tal que E[X] = µ e V (X) = σ2. Entao cov(X,X) = 0.

(b) Sejam X1 e X2 duas variaveis aleatorias independentes e identicamente distribuıdas, comvalor medio µ e variancia σ2. A custa desta variaveis definam-se as seguintes outras duasvariaveis aleatorias: Y1 = X1 +X2 e Y2 = 2X1. Entao a cov(Y1, Y2) = 0.

(c) O Francisco e o Joao costumam encontrar-se todas as semanas. O Joao chega atrasado aesses encontros com probabilidade 0.5 e o Francisco chega atrasado com probabilidade 0.2- assuma independencia entre encontros e tambem entre os atrasos dos dois amigos.

SejaX (respectivamente Y ) a variavel aleatoria que conta, em 2 semanas quaisquer, quantasvezes se atrasa o Francisco (respectivamente o Joao). Entao a funcao de probabilidade davariavel aleatoria que conta o numero de vezes que o Francisco se atrasa, nessas duassemanas, sabendo que o numero de atrasos do Joao e 2, e dada por:

P (X = x|Y = 2) =

0.64, x = 00.32, x = 10.04, x = 2

(d) A covariancia entre duas variaveis aleatorias tem sempre de ser maior do que o correspon-dente coeficiente de correlacao entre as variaveis.

5.15 Nas urgencias do hospital de S. Sebastiao gasta-se, por cada 1 hora, X sacos de algodao e Yseringas. No quadro abaixo representa-se a funcao de probabilidade conjunta deste par aleatorio(X,Y ), que se encontra incompleto:

X\Y 0 1 2

0 1/12 1/121 0

1

(a) Complete a funcao de probabilidade conjunta sabendo que a probabilidade de se gastar 1seringa e o dobro da probabilidade de se gastarem 2 seringas e que a probabilidade de segastarem 0 seringas e o triplo da probabilidade de se gastarem 2 seringas.

(b) Calcule a probabilidade de o numero de sacos de algodao gastos numa hora ser superior aonumero de seringas gastas nessa hora.

Page 67: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 65

(c) Determine a funcao de probabilidade do numero de sacos de algodao gastos numa hora, X,e a sua correspondente funcao distribuicao.

(d) Determine o numero medio de sacos de algodao gastos numa hora e o numero medio deseringas gastas nesse mesmo perıodo.

(e) Determine a covariancia entre as variaveis X e Y . Comente este resultado, referindo se opode usar para decidir quanto a independencia entre as variaveis. Justifique.

(Exercıcio de exame)

5.16 O Sr. Ze e a Sra Maria trabalham na mesma loja. Todas as manhas pode acontecer que cada umdeles tenha de se ausentar do seu posto de trabalho. Assim, representando a variavel aleatoriaX o numero de vezes que isso acontece ao Sr. Ze, por manha, e a variavel aleatoria Y o numerode vezes que tal sucede a Sra Maria, por manha, conhecemos a funcao de probabilidade conjuntadestas duas variaveis:

X\Y 0 1 2

0 0.125 0.05 0.075 0.251 0.25 0.1 0.15 0.52 0.125 0.05 0.075 0.25

0.5 0.2 0.3 1

(a) Deduza a funcao distribuicao do numero de vezes X que o Sr. Ze se ausenta do seu postode trabalho por manha.

(b) Determine a probabilidade de, numa determinada manha, o Sr. Ze se ausentar do seu postode trabalho no maximo uma vez.

(c) Determine a probabilidade de, numa manha de trabalho, o Sr. Ze se ausentar do seu postode trabalho no maximo uma vez, sabendo que nessa mesma manha a Sra Maria ausentou-seuma unica vez. Explique em que sentido e que o resultado obtido lhe permite comecar atecer consideracoes sobre a independencia das variaveis X e Y .

(d) Determine E [X+2], V(X+2) e V(X+Y ), justificando convenientemente os passos dados.

(Exercıcio de exame)

5.17 Por dia, o numero de pacientes com queixas de tensao baixa atendidos em determinado servicode urgencias hospitalares e uma variavel aleatoria X com a seguinte funcao de probabilidade:

X

1 2 3 40.4 0.3 0.2 0.1

Sabe-se ainda que o numero de pacientes com desmaios, Y , atendidos neste mesmo servico, pordia, e sempre dado pelo numero de pacientes com queixas de tensao baixa, X, mais 5 pacientes(com outras queixas): Y = X + 5.

(a) Qual a probabilidade de, num qualquer dia, aparecerem neste servico de urgencias 2 pa-cientes com queixas de tensao baixa e 7 pacientes com desmaios? E qual a probabilidadede, num qualquer dia, aparecerem neste servico de urgencias 2 pacientes com queixas detensao baixa e 8 pacientes com desmaios?

Page 68: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 66

(b) Determine a funcao de probabilidade conjunta do par aleatorio (X,Y ).

Sugestao: Comece por enumerar quais os valores que a variavel Y pode tomar.

(c) Encontre o coeficiente de correlacao entre X e Y . Comente o seu valor.

(d) Qual o numero medio de pacientes com queixas de tensao baixa neste servico, por dia? Equal o seu coeficiente de variacao?

(Exercıcio de exame)

5.18 Uma certa maquina de fax esta avariada. Assim e frequente enviarem-se faxes que nunca chegamao seu destino. Seja X o numero de vezes que um fax e enviado e Y o numero de vezes que essefax e recebido. (X,Y ) e um par aleatorio que tem a seguinte funcao de probabilidade conjunta:

X \ Y 0 1 2

1 0.4 0.2 0 0.62 0.2 0.15 0.05 0.4

0.6 0.35 0.05 1

(a) Calcule P (Y < X). Comente.

(b) Qual o numero medio de faxes enviados e qual o numero medio de faxes recebido? Comente.

(c) Sabendo que V (Y ) = 0.3475, calcule o coeficiente de correlacao entre X e Y . Comente.

(d) Calcule a probabilidade de receber 2 faxes sabendo que foram enviados 2 faxes.

(e) O que pode dizer quanto a independencia entre as variaveis X e Y . Justifique.

(Exercıcio de exame)

5.19 Considere o par aleatorio (X,Y ) em que X e Y representam o numero de golos marcados peloBenfica e pelo Sporting, respectivamente, no classico derby Benfica-Sporting. Sabe-se que:

• X,Y ∈ 0, 1, 2.• A probabilidade do jogo terminar empatado e de 1/3 sendo que as diferentes possibilidades

de empate tem igual probabilidade de ocorrer.

• A vitoria de qualquer equipa so pode eocorrer pela diferenca de um golo.

• A probabilidade de vitoria do Benfica e o dobro da do Sporting, sendo que P (X = 1, Y =0) = P (X = 2, Y = 1) e P (X = 0, Y = 1) = P (X = 1, Y = 2).

(a) Determine as funcoes de probabilidade conjunta e marginais.

(b) As variaveis X e Y sao independentes?

(c) Qual a probabilidade de vitoria do Benfica?

(d) Qual a probabilidade de no total serem marcados tres golos?

(e) Calcule cov(X,Y ).

(Exercıcio de exame)

5.20 Seja X a variavel aleatoria que indica o numero de vezes que a electricidade de uma moradia e“cortada” por falta de pagamento, num ano, e a variavel aleatoria Y indica o numero de vezesque a agua e “cortada” pela mesma razao. Sabe-se que a funcao de probabilidade conjunta dopar aleatorio (X,Y ) e a seguinte

Page 69: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 67

X\Y 0 1 2

0 c1 c2 0.11 0.1 0.1 c32 0.1 0.0 0.1

(a) Complete a tabela e determine as funcoes de probabilidade marginais de X e Y sabendoque E(XY ) = 0.5 e E(Y 2) = 1.1.

Se nao resolveu a alınea a) considere c1 = 0.2, c2 = 0.1 e c3 = 0.2.

(b) Qual a probabilidade da electricidade ser “cortada” num ano em que nao houve cortes deagua?

(c) Determine o coeficiente de correlacao entre as variaveis X e Y . Comente o valor obtido.

(d) Determine a funcao de probabilidade do total de cortes num ano.

(Exercıcio de exame)

Page 70: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 6

Distribuicoes especiais

Este capıtulo trata de algumas distribuicoes de probabilidade que sao mais frequentemente usadasem aplicacoes praticas, bem como algumas das suas propriedades. Comeca por se introduzir primeiroalgumas distribuicoes discretas seguindo-se com outras do tipo contınuo.

6.1 Algumas distribuicoes discretas

6.1.1 Distribuicao Uniforme Discreta

Suponhamos que determinada variavel aleatoria X pode tomar qualquer valor inteiro de 1 a n,com igual probabilidade, 1

n .

Definicao 6.1 Dizemos que a variavel aleatoria X segue uma distribuicao Uniforme Discretade parametro n e escrevemos X ∼ Uniforme(n) ou, abreviadamente, X ∼ Unif(n), se a funcao deprobabilidade de X e dada por:

X

1 2 . . . n

1n

1n . . . 1

n

ou P (X = x) =1

n, x = 1, . . . , n.

Proposicao 6.1 Seja a v.a. X ∼ Uniforme(n). Entao:

X E [X] = n+12 ;

X V (X) = n2−112 ;

X F (x) =

0, x < 1

kn , k ≤ x < k + 1

k = 1, . . . , n − 1

1, x ≥ n

.

68

Page 71: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 69

Demonstracao:

E [X] =n∑

x=1

x P (X = x) =n∑

x=1

x × 1

n=

1

n

n∑

x=1

x =1

n

n(n+ 1)

2=

n+ 1

2

V (X) = E [X2]− E 2[X] =

n∑

x=1

x2 P (X = x)

−(

n+ 1

2

)2

=

n∑

x=1

x2 × 1

n− (n+ 1)2

4=

=1

n

n∑

x=1

x2 − (n+ 1)2

4=

1

n· 2n

3 + 3n2 + n

6− (n+ 1)2

4=

n2 − 1

12

F (x) → Fica como exercıcio.

Exemplo 6.1 Considere-se a experiencia aleatoria de lancar um dado de 6 faces equilibrado, e seja Xa v.a. que conta o numero de pintas que resultam. Entao X ∼ Unif(6), P (X = x) = 1

6 , x = 1, . . . , 6,o numero esperado de pintas e E [X] = 6+1

2 = 3.5 e a probabilidade de sair 6 pintas e de P (X = 6) = 16 .2

6.1.2 Distribuicao de Bernoulli

Qualquer experiencia aleatoria pode resultar num determinado acontecimento A ∈ S ou no seucomplementar, A ∈ S. Assim, associada a qualquer experiencia aleatoria e sempre possıvel definiruma variavel aleatoria (v.a.) X que toma o valor 1 se ocorre A e 0 se A nao ocorre, traduzindo areferida dicotomia dos resultados. Chamando p = P (A) > 0 entao a funcao de probabilidade de Xe dada por:

X

0 11− p p

, 0 < p < 1 (6.1.1)

Definicao 6.2 Dizemos que a variavel aleatoria X segue uma distribuicao de Bernoulli de parametrop e escrevemos X ∼ Bernoulli(p) ou, abreviadamente, X ∼ Ber(p), se a funcao de probabilidade deX e dada por (6.1.1).

A p e usual designar-se por probabilidade de sucesso (correspondendo ao sucesso acontecer A).O acontecimento complementar de A e designado como um insucesso.

Proposicao 6.2 Seja a v.a. X ∼ Bernoulli(p). Entao:

X E [X] = p;

X V (X) = p(1− p);

Page 72: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 70

X F (x) =

0 x < 01− p 0 ≤ x < 11 x ≥ 1

.

Demonstracao:

E [X] = 0× (1− p) + 1× p = p

V (X) = E [X2]− E 2[X] =

02 × (1− p) + 12 × p

− p2 = p− p2 = p(1− p)

F (x) → Fica como exercıcio.

Exemplo 6.2 Considere-se a experiencia aleatoria de lancar ao ar uma moeda equilibrada, e seja Xa v.a. que indica se sai cara, i.e. que vale 1 se sai cara e 0 caso contrario. Entao X ∼ Ber

(

12

)

.2

6.1.3 Distribuicao Binomial

Suponhamos que associado a certa experiencia aleatoria pode ocorrer o acontecimento A ∈ S,com probabilidade p = P (A) > 0, ou nao ocorrer A ∈ S, com probabilidade 1 − p = P (A) > 0 -dicotomia. Designo a ocorrencia de A como um sucesso e o seu complementar como um insucesso.Se eu repetir a experiencia um numero n de vezes, fixo, independentemente entre repeticoes, possodefinir uma variavel aleatoria X que conta o numero de vezes que A ocorre nas n provas independentes.A sua funcao de probabilidade e dada por:

P (X = x) = Cnx px(1− p)n−x, x = 0, 1, . . . , n 0 < p < 1 (6.1.2)

Definicao 6.3 Dizemos que a variavel aleatoria X segue uma distribuicao Binomial de parametrosn e p, e escrevemos X ∼ Binomial(n, p) ou, abreviadamente, X ∼ Bin(n, p), se a funcao de proba-bilidade de X e dada por (6.1.2).

Notemos que a distribuicao Binomial pode ainda ser encarada como a distribuicao da soma de nvariaveis aleatorias independentes e identicamente distribuıdas Bernoulli(p). Notemos tambem queno caso particular de n = 1, a distribuicao Binomial(1,p) coincide com a distribuicao Bernoulli(p).

Proposicao 6.3 Seja a v.a. X ∼ Binomial(n, p). Entao:

X E [X] = np;

X V (X) = np(1− p);

X F (x) =∑bxc

k=0Cnk pk(1− p)n−k.

Page 73: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 71

Demonstracao:

E [X] =n∑

x=0

x P (X = x) =n∑

x=0

x Cnx px(1− p)n−x =

n∑

x=1

xn!

x!(n− x)!px(1− p)n−x =

=n∑

x=1

n!

(x− 1)!(n − x)!px(1− p)n−x =

n−1∑

x=0

n!

x!(n − x− 1)!px+1(1− p)n−x−1 =

=

n−1∑

x=0

n(n− 1)!

x!(n − x− 1)!pxp(1− p)n−x−1 = np

n−1∑

x=0

(n− 1)!

x!(n− x− 1)!px(1− p)n−x−1 =

= np

n−1∑

x=0

Cn−1x px(1− p)n−1−x = (Binomio de Newton (a+ b)n−1, com a = p, b = (1− p)

= np (p+ (1− p))n−1 = np

V (X) = E [X2]− E 2[X] =

E [X2] =

n∑

x=0

x2 P (X = x) =

n∑

x=0

x2 Cnx px(1− p)n−x =

=

n∑

x=1

xn!

(x− 1)!(n − x)!px(1− p)n−x =

n−1∑

x=0

(x+ 1)n!

x!(n − x− 1)!px+1(1− p)n−x−1 =

=n−1∑

x=0

xn!

x!(n − x− 1)!px+1(1− p)n−x−1 +

n−1∑

x=0

n!

x!(n− x− 1)!px+1(1− p)n−x−1 =

=

n−1∑

x=1

n!

(x− 1)!(n − x− 1)!px+1(1− p)n−x−1 + np

n−1∑

x=0

(n− 1)!

x!(n− 1− x)!px(1− p)n−x−1 =

=

n−2∑

x=0

n!

x!(n− x− 2)!px+2(1− p)n−x−2 + np(p+ (1− p))n−1 =

= n(n− 1)p2n−2∑

x=0

(n− 2)!

x!(n− 2− x)!px(1− p)n−x−2 + np =

= n(n− 1)p2(p+ (1− p))n−2 + np = n(n− 1)p2 + np

V (X) = E [X2]− E 2[X] = n(n− 1)p2 + np− (np)2 = np (n− 1)p + 1− np = np(1− p)

F (x) → Fica como exercıcio.

Exemplo 6.3 Considere-se a experiencia aleatoria de lancar ao ar dez vezes uma moeda equilibrada,e seja X a v.a. que conta o numero de caras nos 10 lancamentos. Assumo que os lancamentos saoindependentes, pelo que estou a contar o numero de sucessos (=sair cara) num numero fixo (dez) deprovas (lancamentos) independentes. Entao X ∼ Bin

(

10, 12)

e a probabilidade de saırem 10 caras ede:

Page 74: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 72

P (X = 10) = C1010

(

1

2

)10 (

1− 1

2

)0

' 0.00098

2

Exemplo 6.4 Considere a seguinte experiencia aleatoria: dentro de um saco tenho 21 bolas verdes evermelhas, na proporcao de 1:2, respectivamente, das quais vou retirar ao acaso e com reposicao 6bolas. Seja X a v.a. que conta o numero de bolas verdes obtidas. Como eu reponho cada bola que voutirando, as minhas extraccoes sao independentes e a probabilidade de sair uma bola verde nao variaentre extraccoes. Estou assim a contar o numero de sucessos (=sair bola verde) num numero fixo de6 extraccoes (provas) independentes. Assim, X ∼ Bin

(

6, 13)

.A probabilidade de saırem 2 bolas verdes e:

P (X = 2) = C62

(

1

3

)2 (

1− 1

3

)4

' 0.329

2

Teorema 6.1 (Propriedade aditiva da distribuicao Binomial) Sejam Xi, i = 1, . . . ,m, mvariaveis aleatorias independentes com Xi ∼ Binomial(ni, p). Entao a sua soma tem tambem dis-tribuicao Binomial, i.e. :

Sm =m∑

i=1

Xi ∼ Binomial(n1 + . . .+ nm, p).

Exemplo 6.5 Um viveiro de trutas e constituıdo por 10 tanques, numerados de 1 a 10, sendo onumero de peixes no tanque i de ni, i = 1, . . . , 10, na tabela abaixo.

n1 n2 n3 n4 n5 n6 n7 n8 n9 n10

150 255 365 236 656 1256 789 879 369 741

Sabe-se que o numero de trutas femeas de cada tanque e uma v.a. Xi, i = 1, . . . , 10, que segueuma distribuicao Binomial, Xi ∼ Bin(ni, 1/2), i = 1, . . . , 10.

Assim sendo, o numero total de femeas no viveiro, S10 =∑10

i=1Xi, tem tambem distribuicaoBinomial:

S10 =

10∑

i=1

Xi ∼ Bin

(

10∑

i=1

ni,1

2

)

≡ Bin

(

5696,1

2

)

2

Page 75: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 73

6.1.4 Distribuicao Hipergeometrica

Suponhamos que temos a nossa disposicao uma populacao de N elementos, dos quais M possuemdeterminada caracterıstica e os restantes (N − M) nao a possuem (dicotomia). Da totalidade dosN elementos seleccionamos ao acaso e sem reposicao n elementos (amostra) e estamos interessadosem contabilizar nestes n elementos quantos possuem a referida caracterıstica. Note-se que aqui naoha independencia entre extraccoes, ja que cada uma delas esta condicionada pelo que ja aconteceuantes. Definimos assim uma variavel aleatoria X que representa precisamente esse numero. A suafuncao de probabilidade muito facilmente se determina e e dada por:

P (X = x) =CMx CN−M

n−x

CNn

, max(0,M + n−N) ≤ x ≤ min(M,n) (6.1.3)

Note-se que o numero de elementos na amostra que possui a referida caracterıstica (X) nunca podeexceder o menor valor entre a dimensao da amostra (n) e o numero de elementos que possuem a referidacaracterıstica na totalidade dos N elementos (M), naturalmente! Noutros termos, X ≤ min(M,n).

Por outro lado o numero de elementos que na amostra nao possui a dita caracterıstica, n−X, naopode exceder o numero de elementos que no universo da nossa escolha nao possuem a tal caracterıstica,N −M . Assim, n−X ≤ N −M ⇔ X ≥ n−N +M . Claro que X tera de ser sempre nao negativo,donde X ≥ min(0, n −N +M).

Definicao 6.4 Dizemos que a variavel aleatoria X segue uma distribuicao Hipergeometrica deparametros N , M e n, e escrevemos X ∼ Hipergeometrica(N,M,n) ou X ∼ Hiperg(N,M,n), abre-viadamente, se a funcao de probabilidade de X e dada por (6.1.3).

Por nao ter muito interesse para o nosso curso apresentamos sem demonstracao o seguinte:

Proposicao 6.4 Seja a v.a. X ∼ Hipergeometrica(N,M,n). Entao:

X E [X] = nMN ;

X V (X) = n MN2(N−1)

(N −M)(N − n);

Exemplo 6.6 Considere-se a seguinte experiencia aleatoria: dentro de um saco tenho 21 bolas verdese vermelhas, na proporcao de 1:2, respectivamente - 7 bolas verdes e 14 vermelhas. Vou retirar, datotalidade das bolas, ao acaso e sem reposicao 6 bolas. Seja X a v.a. que conta o numero debolas verdes obtidas. Como eu nao reponho cada bola que vou tirando, as minhas extraccoes saodependentes. Estou assim a contar o numero de sucessos (=sair bola verde) num numero fixo de 6extraccoes (provas) dependentes. Entao, X ∼ Hiperg (21, 7, 6).

A probabilidade de saırem 2 bolas verdes e:

P (X = 2) =C72 C14

4

C216

' 0.387

2

Page 76: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 74

Nota: E importante notar as diferencas entre as distribuicoes Hipergeometrica e Binomial. Aprimeira distribuicao surge sempre associada a populacoes finitas (N !), de onde se fazem extraccoessem reposicao, correspondendo a uma situacao de sucessivas provas dependentes. Ja a distribuicaoBinomial esta associada a populacoes infinitas, no sentido que se pode dela amostrar infinitamente,por haver uma situacao de reposicao ou independencia entre provas.

Regra 6.1 (Aproximacao da distribuicao Hipergeometrica pela distribuicao Binomial)Seja X uma v.a. tal que X ∼ Hipergeometica(N,M,n). Entao, caso n

N ≤ 0.1, i.e. caso o tamanhoda amostra seja muito pequeno em relacao ao tamanho da populacao, entao pode aproximar-se adistribuicao de X por uma distribuicao Binomial(n, p), onde p = M

N .

Exemplo 6.7 Seja X uma v.a. com distribuicao Hipergeometrica(100, 60, 9). Calculemos a seguinteprobabilidade:

P (X = 3) =C603 C40

6

C1009

' 0.06905 ' 0.07

No entanto, como nN = 9

100 = 0.09, podemos aproximar a distribuicao Hipergeometrica(100, 60, 9) poruma Binomial(9, 60

100) ≡Binomial(9, 0.6) e voltar a calcular a probabilidade anterior:

P (X = 3) ' C93 0.63 0.46 ' 0.07432 ' 0.07

6.1.5 Distribuicao Geometrica

Suponhamos que associado a certa experiencia aleatoria pode ocorrer o acontecimento A ∈ S, comprobabilidade p = P (A) > 0, ou nao ocorrer A ∈ S, com probabilidade 1− p = P (A) > 0 (dicotomia).Designo a ocorrencia de A como um sucesso e o seu complementar como um insucesso. Defino avariavel aleatoriaX como o numero de vezes que e necessario repetir a experiencia, independentemente,ate que se verifique a ocorrencia de um sucesso. A sua funcao de probabilidade e dada por:

P (X = x) = p(1− p)x−1, x = 1, 2, . . . 0 < p < 1 (6.1.4)

Definicao 6.5 Dizemos que a variavel aleatoria X segue uma distribuicao Geometrica de parametrop, e escrevemos X ∼ Geometrica(p) ou, abreviadamente, X ∼ Geo(p), se a funcao de probabilidadede X e dada por (6.1.4).

Proposicao 6.5 Seja a v.a. X ∼ Geometrica(p). Entao:

X E [X] = 1p ;

X V (X) = 1−pp2 ;

X F (x) =

0, x < 1

1− (1− p)bxc, x ≥ 1.

Page 77: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 75

Demonstracao:

E [X] =+∞∑

x=1

x P (X = x) =+∞∑

x=1

x p(1− p)x−1 = p+∞∑

x=1

x (1− p)x−1 = p+∞∑

x=1

d

dp(−(1− p)x) =

= −pd

dp

(

+∞∑

x=1

(1− p)x

)

= −pd

dp

(

1− p

1− (1− p)

)

= −p ·(

− 1

p2

)

=1

p

V (X) = E [X2]− E 2[X] =

E [X2] =+∞∑

x=1

x2 P (X = x) =+∞∑

x=1

x2 p(1− p)x−1 = p+∞∑

x=1

x · (x+ 1-1) (1− p)x−1 =

= p+∞∑

x=1

(x+ 1)x(1 − p)x−1 − p+∞∑

x=1

x(1− p)x−1 = p+∞∑

x=1

d2

dp2((1− p)x)− E [X] =

= pd2

dp2

(

+∞∑

x=1

(1− p)x

)

− 1

p= p

d2

dp2

(

1− p

1− (1− p)

)

− 1

p=

= p · 2

p3− 1

p=

2− p

p2

V (X) = E [X2]− E 2[X] =2− p

p2−(

1

p

)2

=1− p

p2

F (x) → Fica como exercıcio.

Exemplo 6.8 Considere-se a experiencia aleatoria de lancar ao ar uma moeda equilibrada e seja X av.a. que conta o numero de lancamentos necessarios ate sair uma cara. Assumindo que os lancamentossao independentes, X ∼ Geo

(

12

)

. Consequentemente, a probabilidade de serem necessarios 10 lanca-mentos ate obtermos uma cara e dada por:

P (X = 10) =1

2×(

1− 1

2

)9

' 0.00098.

2

Exemplo 6.9 Considere a seguinte experiencia aleatoria: dentro de um saco tenho 21 bolas verdes evermelhas, na proporcao de 1:2, respectivamente, das quais vou retirar ao acaso e com reposicao 6bolas. Seja X a v.a. que conta o numero de bolas que tenho de extrair ate obter uma bola verde. Comoeu reponho cada bola que vou tirando, as minhas extraccoes sao independentes. Assim, X ∼ Geo

(

13

)

.A probabilidade de serem necessarias 2 extraccoes ate sair uma bola verde e entao:

P (X = 2) =1

3×(

1− 1

3

)1

' 0.(2)

2

Page 78: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 76

Teorema 6.2 (Propriedade da falta de memoria da distribuicao Geometrica) Seja X ∼Geometrica(p). Entao:

P (X > s+ t | X > t) = P (X > s).

Demonstracao: Fica como exercıcio (Sugestao: recorra a funcao distribuicao de X).

6.1.6 Distribuicao Poisson

Estudamos anteriormente a distribuicao Binomial e vimos que e usada quando contamos o numerode sucessos em n provas independentes. Frequentemente, em particular em aplicacoes medicas, onumero de provas a considerar e muito elevado e a probabilidade de sucesso muito pequena, pelo queo calculo de probabilidades se pode tornar muito demorado. Nestas condicoes e possıvel consideraruma outra distribuicao, que aproxima razoavelmente bem as probabilidades Binomiais:

Definicao 6.6 Dizemos que a variavel aleatoria X segue uma distribuicao de Poisson de parametroλ, e escrevemos X ∼ Poisson(λ) ou, abreviadamente, X ∼ Poi(λ), se a funcao de probabilidade deX e dada por:

P (X = x) =e−λλx

x!, x = 0, 1, 2, . . . , λ > 0 (6.1.5)

Proposicao 6.6 Seja a v.a. X ∼ Poisson(λ). Entao:

X E [X] = λ;

X V[X] = λ;

X F (x) =∑bxc

k=0e−λλk

k!

Demonstracao:

E [X] =

+∞∑

x=0

x P (X = x) =

+∞∑

x=0

xe−λλx

x!=

+∞∑

x=1

e−λλx

(x− 1)!=

+∞∑

x=0

e−λλx+1

x!=

= e−λ+∞∑

x=0

λxλ

x!= e−λ · λ

+∞∑

x=0

λx

x!= e−λ · λ · eλ = λ

Page 79: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 77

V (X) = E [X2]− E 2[X]

E [X2] =

+∞∑

x=0

x2 P (X = x) =

+∞∑

x=0

x2e−λλx

x!=

+∞∑

x=1

xe−λλx

(x− 1)!=

+∞∑

x=0

(x+ 1)e−λλx+1

x!=

=

+∞∑

x=0

xe−λλx+1

x!+ e−λ

+∞∑

x=0

λxλ

x!= λ

+∞∑

x=0

xe−λλx

x!+ e−λ · λ

+∞∑

x=0

λx

x!=

= λ E [X] + e−λ · λ · eλ = λ2 + λ

V (X) = (λ2 + λ)− λ2 = λ

Exemplo 6.10 Seja X a v.a. que representa o numero de carracas num determinado cao, que segueuma distribuicao Poisson(2). Assim, em media, este cao apresenta E [X] = 2 carracas e a probabili-dade de ele ter em si pelo menos 3 carracas e dada por:

P (X ≥ 3) = 1−P (X < 3) = 1−P (X = 0)−P (X = 1)−P (X = 2) = 1−e−220

0!−e−221

1!−e−222

2!' 0.323

2

Teorema 6.3 (Propriedade aditiva da Poisson) Sejam X1,X2, . . . ,Xn variaveis aleatorias in-dependentes com distribuicao Poisson, Xi ∼ Poisson(λi), i = 1, . . . , n. Entao a sua soma e aindaPoisson:

Sn =n∑

i=1

Xi ∼ Poisson(λ1 + . . . + λn)

Observacao: O parametro λ da distribuicao Poisson pode ser visto como uma taxa de ocorrenciado fenomeno em estudo por unidade (seja ela de area, de tempo). Assim, se considerarmos muitasunidades juntas (que nao se sobreponham, naturalmente) a variavel que conta o numero de ocorrenciasem todas as unidades tem distribuicao de Poisson com parametro dado pelo produto de λ pelo numerode unidades.

Exemplo 6.11 Represente a v.a. X o numero de pes de milho produzidos por metro quadrado deterreno. Sabe-se que X ∼ Poi(10). Qual a probabilidade de numa faixa de terreno de 2 m2 nascerem20 pes?

Considere-se a v.a. Y que representa o numero de pes de milho nascidos em 2 m2 de terreno.Y ∼ Poisson(2× 10) ≡ Poisson(20). Entao:

P (Y = 20) =e−202020

20!' 0.0888

Page 80: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 78

Observacao: A distribuicao de Poisson, porque aproxima a distribuicao Binomial quando a proba-bilidade de sucesso e pequena, e tambem designada distribuicao de acontecimentos raros. Napratica:

Regra 6.2 (Aproximacao da distribuicao Binomial pela distribuicao de Poisson) Seja Xuma v.a. tal que X ∼ Binomial(n, p). Entao, caso n ≥ 50 e np ≤ 5, i.e. caso o tamanho da amostraseja muito grande e o acontecimento que se mede raro, entao pode-se aproximar a distribuicao de Xpor uma distribuicao Poisson(λ), onde λ = np.

Exemplo 6.12 A probabilidade de determinada malformacao congenita e de 0.05. Qual a probabili-dade de num conjunto de 50 criancas existir esta malformacao em pelo menos 2 delas?

Defina-se a v.a. X como o numero de criancas que tem esta malformacao em 50. Entao X ∼Binomial(50, 0.05).

P (X ≥ 2) = 1− P (X < 2) = 1− P (X = 0)− P (X = 1) =

= 1− C500 0.050(1− 0.05)50 − C50

1 0.051(1− 0.05)49 ' 1− 0.239 ' 0.761

Alternativamente, como n = 50 ≥ 50 e np = 50×0.05 = 2.5 ≤ 5, podemos aproximar a distribuicaoBinomial por uma distribuicao de Poisson, X ∼ Poi(50× 0.05) ≡ Poisson(2.5). Entao:

P (X ≥ 2) = 1− P (X < 2) = 1− P (X = 0)− P (X = 1) =

= 1− e−2.52.50

0!− e−2.52.51

1!' 1− 0.287 ' 0.713

2

6.2 Algumas distribuicoes contınuas

6.2.1 Distribuicao Uniforme Contınua

Definicao 6.7 Dizemos que a variavel aleatoria X segue uma distribuicao Uniforme no intervalo[a, b], −∞ < a < b < +∞, e escrevemos X ∼ Uniforme [a, b] ou, abreviadamente, X ∼ Unif [a, b],se a funcao densidade probabilidade de X e dada por:

f(x) =

1b−a , a ≤ x ≤ b

0 , c.c.

Nota: Os extremos a e b podem indiferentemente ser excluıdos do intervalo [a, b], ambos ou apenasum deles.

Apresenta-se na figura 6.1 a funcao densidade de uma v.a. Uniforme[a,b] generica.

Proposicao 6.7 Seja a v.a. X ∼ Uniforme[a, b]. Entao:

Page 81: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 79

f (x)

xa b

1b−a

Figura 6.1: Funcao densidade de X ∼ Uniforme [a, b].

X E [X] = a+b2 ;

X V (X) = (b−a)2

12 ;

X F (x) =

0, x < ax−ab−a , a ≤ x < b

1, x ≥ b

.

Demonstracao:

E [X] =

∫ +∞

−∞xf(x)dx =

∫ b

ax · 1

b− adx =

[

x2

2(b− a)

]a

b

=b2 − a2

2(b− a)=

a+ b

2

V (X) = E [X2]− E 2[X] =

∫ +∞

−∞x2f(x)dx

−(

a+ b

2

)2

=

∫ b

ax2 · 1

b− adx− (a+ b)2

4=

=

[

x3

3(b− a)

]a

b

− (a+ b)2

4=

b3 − a3

3(b− a)− (a+ b)2

4=

=(b− a)(b2 + ab+ a2)

3(b− a)− a2 + 2ab+ b2

4=

b2 + a2 − 2ab

12=

(b− a)2

12

F (x) → Fica como exercıcio.

Exemplo 6.13 Represente a v.a. X o tempo (em minutos) entre partidas sucessivas de comboios daestacao de Sete Rios, com destino ao Pragal. Sabe-se que este tempo se distribui uniformemente nointervalo de 0 a 15 minutos, i.e. X ∼ Uniforme[0, 15].

O tempo medio entre partidas e pois de 0+152 = 7.5 minutos e a probabilidade de ter de se esperar

mais de 10 minutos por um comboio que nos leve ao Pragal e de:

P (X > 10) =

∫ +∞

10f(x)dx =

∫ 15

10

1

15 − 0dx =

1

3

2

Page 82: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 80

6.2.2 Distribuicao Exponencial

Definicao 6.8 Uma variavel aleatoria X diz-se seguir uma distribuicao Exponencial de parametroλ, e escrevemos X ∼ Exponencial(λ) ou, abreviadamente, X ∼ Exp(λ), se a sua funcao densidadeprobabilidade for dada por:

f(x) =

λ e−λx, x > 00 , x ≤ 0

λ > 0

Apresenta-se na figura 6.2 a funcao densidade de uma v.a. Exponencial(λ) generica.

f (x)

x

Figura 6.2: Funcao densidade de X ∼ Exponencial(λ).

Proposicao 6.8 Seja a v.a. X ∼ Exponencial(λ). Entao:

X E [X] = 1λ ;

X V (X) = 1λ2 ;

X F (x) =

0, x < 01− e−λx, x ≥ 0

.

Demonstracao: Temos de fazer aqui integracao por partes:

Page 83: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 81

E [X] =

∫ +∞

−∞xf(x)dx =

∫ +∞

0x · λe−λxdx = lim

R→+∞

[

−x e−λx]R

0+

∫ R

0e−λxdx

=

= limR→+∞

−R e−λR + 0 +

[

e−λx

−λ

]R

0

= 0 + limR→+∞

e−λR − 1

−λ

=0− 1

−λ=

1

λ

V (X) = E [X2]− E 2[X] =

∫ +∞

−∞x2f(x)dx

−(

1

λ

)2

=

∫ +∞

0x2 · λe−λxdx− 1

λ2=

= limR→+∞

[

−x2 e−λx]R

0+

∫ R

02x · e−λxdx

− 1

λ2=

= limR→+∞

−R2 e−λR + 0 +

[

2x · e−λx

−λ

]R

0

+

∫ R

0

2 e−λx

λ

− 1

λ2

= 0 + limR→+∞

−2R e−λR

λ+ 0 +

[

2e−λx

−λ2

]R

0

− 1

λ2=

= 0 + limR→+∞

−2 e−λR

λ2+

2

λ2

− 1

λ2= 0 +

2

λ2− 1

λ2=

1

λ2

F (x) → Fica como exercıcio.

Nota: A distribuicao exponencial e frequentemente usada para modelar tempos de vida, particular-mente para aquelas situacoes em que o tempo de vida que ainda falta decorrer e independente do queja decorreu. Isto devido a seguinte propriedade da distribuicao exponencial:

Teorema 6.4 (Propriedade da falta de memoria da distribuicao exponencial) Seja X ∼Exponencial(λ). Entao:

P (X ≥ s+ t|X ≥ s) = P (X ≥ t)

Demonstracao: Fica como exercıcio.

Exemplo 6.14 A v.a. X representa o tempo de vida (meses) de determinada marca de velas paramotores de carros, seguindo uma distribuicao exponencial de valor medio 6, i.e. X ∼ Exponencial(16).A probabilidade de uma qualquer dessas velas durar mais de 1 ano e de:

P (X > 12) = 1− P (X ≤ 12) = 1− F (12) = 1− (1− e−126 ) ' 0.135

2

Page 84: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 82

6.2.3 Distribuicao Normal

Uma das distribuicoes mais importantes e usadas nas probabilidades e estatıstica e a que estudamosnesta seccao.

Definicao 6.9 Uma variavel aleatoria X diz-se seguir uma distribuicao Normal de parametros µe σ2, e escrevemos X ∼ Normal(µ, σ2) ou, abreviadamente, X ∼ N(µ, σ2), se a sua funcao densidadeprobabilidade for dada por:

f(x) =1√2πσ

e−(x−µ)2

2σ2 , x ∈ R, µ ∈ R, σ > 0

Notas:

X A distribuicao Normal e tambem conhecida pelo nome de Gaussiana ou distribuicao deGauss.

X Quando µ = 0 e σ = 1, a v.a. X ∼ N(0, 1) toma o nome de Normal reduzida. A sua funcaodistribuicao designamos por Φ(·).

X A distribuicao Normal e simetrica em torno de µ.

Apresenta-se na figura 6.3 a funcao densidade de uma v.a. Normal(µ, σ2) generica.

Figura 6.3: Funcao densidade de X ∼ Normal(µ, σ2).

Proposicao 6.9 Seja a v.a. X ∼ Normal(µ, σ2). Entao:

X E [X] = µ;

X V (X) = σ2;

Demonstracao: Fora do ambito deste curso.

Page 85: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 83

Teorema 6.5 Seja X ∼ N(µ, σ2). Entao:

Z =X − µ

σ∼ N(0, 1).

Este teorema e a base do calculo de probabilidades de variaveis aleatorias normais. Suponhamosque estamos interessados em calcular a probabilidade de determinada v.a. X ∼ N(µ, σ2) pertencer aum intervalo qualquer [a, b]. Naturalmente que tentarıamos calcular o seguinte:

P (a ≤ X ≤ b) =

∫ b

a

1√2πσ

e−(x−µ)2

2σ2 dx

Acontece que este integral nao se consegue determinar analiticamente. Como tal terıamos derecorrer a aproximacoes numericas, pouco praticas de obter...

No entanto, a luz do teorema 6.5, todos os calculos de probabilidades de variaveis aleatoriasnormais se podem reduzir ao calculo de probabilidades de uma v.a. Normal reduzida - que se encontratabelada!:

P (a ≤ X ≤ b) = P

(

a− µ

σ≤ X − µ

σ≤ b− µ

σ

)

= P

(

a− µ

σ≤ Z ≤ b− µ

σ

)

=

= P

(

Z ≤ b− µ

σ

)

− P

(

Z ≤ a− µ

σ

)

= Φ

(

b− µ

σ

)

−Φ

(

a− µ

σ

)

→ Valores tabelados.

Exemplo 6.15 A v.a. X representa as notas dos alunos de determinada escola na disciplina de Pro-babilidades e Estatıstica (PE), numa escala de 0% a 100%. Sabe-se que esta variavel tem distribuicaoNormal X ∼ N(60, 102).

(a) Qual a probabilidade de determinado aluno ter nota inferior a 70% a PE?

P (X < 70) = P

(

X − 60

10<

70− 60

10

)

= P (Z < 1) = Φ(1) = 0.8413

(b) Qual a probabilidade de determinado aluno ter nota superior a 50% a PE?

P (X > 50) = 1− P (X ≤ 50) = 1− P

(

Z ≤ 50− 60

10

)

= 1− P (Z ≤ −1) =

(Porque a Normal reduzida e simetrica em torno de 0, o seu valor medio)

= 1− P (Z ≥ 1) = 1− (1− P (Z < 1)) = Φ(1) = 0.8413

(c) Qual a probabilidade de determinado aluno ter nota compreendida entre 50% e 70% a PE?

P (50 < X < 70) = P

(

50− 60

10< Z <

70− 60

10

)

= P (−1 < Z < 1) =

= P (Z < 1)− P (Z ≤ −1) = P (Z < 1)− P (Z ≥ 1) = P (Z < 1)− (1− P (Z < 1)) =

= 2Φ(1)− 1 = 0.6826

2

Page 86: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 84

Teorema 6.6 Sejam X1,X2, . . . ,Xn n variaveis aleatorias independentes com distribuicoes Xi ∼N(

µi, σ2i

)

, i = 1, 2, . . . , n. Considerando as constantes reais a1, a2, . . . , an, com algum ai 6= 0, temosque:

Y = a1X1 + . . .+ anXn ∼ N(

a1µ1 + . . .+ anµn, a21σ

21 + . . .+ a2nσ

2n

)

Note que:

E (Y ) = E

(

n∑

i=1

aiXi

)

=

n∑

i=1

aiE (Xi) =

n∑

i=1

aiµi

V (Y ) = V

(

n∑

i=1

aiXi

)

=n∑

i=1

a2i V (Xi) =n∑

i=1

a2iσ2i

Exemplo 6.16 O tempo (em minutos) que um par de sapatos demora a ser confeccionado, numadeterminada fabrica, e a soma dos tempos que demora nos tres sectores por onde tem de passar -desenho, corte e costura. Representando por X1, X2 e X3, respectivamente, esses tempos, sabendoque X1 ∼ N(7, 22), X2 ∼ N(2, 12) e X3 ∼ N(4, 12), independentes, qual a probabilidade de um par desapatos demorar menos de 14 minutos a ser executado?

O tempo total de confeccao de um qualquer par de sapatos e dado por Y = X1 + X2 + X3 e enormalmente distribuıdo:

Y ∼ N(

7 + 2 + 4, 22 + 12 + 12)

≡ N (13, 6)

Assim:

P (Y < 14) = P

(

Z <14− 13√

6

)

= P (Z < 0.41) = 0.6591

2

6.2.4 Distribuicao Qui-quadrado

Definicao 6.10 Define-se funcao gama, denotando-se por Γ(α), como:

Γ(α) =

∫ +∞

0xα−1e−xdx, α > 0

Proposicao 6.10 Algumas propriedades da funcao Γ:

X Γ(1) = 1;

X Γ(α) = (α− 1)Γ(α − 1);

X Se α = n for um inteiro positivo, Γ(n) = (n− 1)!.

Page 87: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 85

Definicao 6.11 Uma variavel aleatoria X diz-se seguir uma distribuicao Qui-quadrado com ngraus de liberdade, e escrevemos X ∼ χ2

(n), se a sua funcao densidade probabilidade for dada por:

f(x) =

1Γ(n/2)2n/2 e

−x/2xn/2−1, x > 0

0 , x ≤ 0

Apresenta-se na figura 6.4 a funcao densidade de uma v.a. χ2(n) generica.

f (x)

x

Figura 6.4: Funcao densidade de X ∼ χ2(n).

Proposicao 6.11 Seja a v.a. X ∼ χ2(n). Entao:

X E [X] = n;

X V (X) = 2n.

Demonstracao: Fora do ambito deste curso.

Para o calculo de probabilidades associado a variaveis aleatorias com distribuicao Qui-quadradonao temos de integrar a funcao densidade atras definida, ja que existem tabelas da funcao distribuicaoda Qui-quadrado, para diversos graus de liberdade!

Exemplo 6.17 Considere a v.a. X ∼ χ2(9). Calcule as seguintes probabilidades, recorrendo a tabela

da Qui-quadrado:

(a) P (X < 17) ' 0.95.

(b) P (X > 19) = 1− P (X ≤ 19) ' 1− 0.975 = 0.025.

Page 88: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 86

2

Teorema 6.7 Seja X ∼ N(0, 1). Entao:

Y = X2 ∼ χ2(1).

6.2.5 Distribuicao T de Student

Definicao 6.12 Sejam X ∼ N(0, 1) e Y ∼ χ2(n), com X e Y independentes. Entao a seguinte variavel

aleatoria :

T =X

Y/n

diz-se ter uma distribuicao t-student com n graus de liberdade e escrevemos T ∼ t(n).

A sua funcao densidade probabilidade e dada por:

fn(t) =Γ((n + 1)/2)

Γ(n/2)√nπ

(1 + t2/n)−(n+1)/2, t ∈ R

Apresenta-se na figura 6.5 a funcao densidade de uma v.a. t(n) generica.

x

Figura 6.5: Funcao densidade de X ∼ t(n).

Proposicao 6.12 Seja a v.a. X ∼ t(n). Entao, caso n > 2:

X E [X] = 0;

Page 89: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 87

X V (X) = nn−2 .

Demonstracao: Fora do ambito deste curso.

Para o calculo de probabilidades associado a estas variaveis aleatorias t-student mais uma vezrecorremos a tabelas existentes das suas funcoes distribuicao, para os diversos graus de liberdade.

Exemplo 6.18 Considere a v.a. T ∼ t(8). Calcule as seguintes probabilidades, recorrendo a tabela dat-student:

(a) P (T < 2.31) ' 0.975.

(b) P (−2.31 < T < 2.31) = P (T < 2.31)−P (T ≤ −2.31) = (Simetria da dist. em torno da media)

P (T < 2.31) − P (T ≥ 2.31) = P (T < 2.31) − (1 − P (T < 2.31)) = 2P (T < 2.31) − 1 =2× 0.975 − 1 = 0.95.

2

6.3 Exercıcios Propostos

6.1 Um consumidor queixou-se as autoridades que no supermercado do Sr. Manuel se vendiamlatas de cogumelos com o prazo de validade ultrapassado. No seguimento desta denuncia uminspector das actividades economicas dirigiu-se ao referido supermercado e seleccionou, ao acasoe sem reposicao, 6 latas - do total de 50 que o Sr. Manuel ainda tinha para vender.

Como na realidade ainda restavam 7 latas com o prazo de validade ultrapassado, qual a proba-bilidade de o Sr. Manuel ser multado (i.e., de o inspector descobrir pelo menos uma lata com oprazo ultrapassado)?

6.2 De forma a proceder a uma classificacao geral do estado das praias Portuguesas, uma comissaoEuropeia vai inspeccionar 10 praias, seleccionadas ao acaso de entre as 100 existentes. A comissaoatribui a classificacao de Bom se pelo menos 8 das 10 praias inspeccionadas estiverem em bomestado. Sabendo que, da totalidade das 100 praias, 15 nao apresentam boas condicoes, qual aprobabilidade de Portugal:

(a) Obter uma classificacao de Suficiente, pelo facto de a comissao so ter encontrado 7 praiasem bom estado?

(b) Obter uma boa classificacao?

(c) Se a comissao so inspeccionasse 5 praias, qual a probabilidade de nao encontrar nenhumaem mau estado?

(d) Nas praias inspeccionadas quantas se esperam que estejam em bom estado?

6.3 O senhor Sousa tem uma empresa que compra e vende selos e outros artigos de coleccionismo. Eleguarda 20 selos dentro de uma bolsa preta, estando ainda cada um deles metido num envelopeopaco. 6 destes selos valem 100 euros cada um e os restantes nada valem. O senhor Sousa,para promover a venda, cobra 20 euros por cada selo, mas nao permitindo que o cliente veja oconteudo do envelope. Suponha que um cliente compra 5 selos.

Page 90: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 88

(a) Qual a probabilidade dos cinco selos nada valerem?

(b) Qual a probabilidade do cliente nao perder nem ganhar dinheiro com a compra?

6.4 Num determinado percurso de aviao, a probabilidade de uma pessoa qualquer que aı viaje pediruma refeicao vegetariana e de 0.2. Supondo que em determinado dia viajam 10 pessoas no aviao,calcule a probabilidade de:

(a) Ninguem pedir refeicao vegetariana.

(b) Todos pedirem refeicao vegetariana.

(c) Pelo menos uma pedir refeicao vegetariana.

6.5 Determinado exame e constituıdo por 5 questoes de escolha multipla, em que cada questao tem4 opcoes de resposta possıveis - apenas uma sendo a correcta. Supondo que um aluno que vaifazer o exame responde a tudo ao acaso, qual e a probabilidade de ele acertar a mais de metadedas questoes? Qual e o numero medio de respostas correctas? E o seu desvio padrao?

6.6 Sabe-se que 5% dos copos produzidos em determinada fabrica apresentam pequenos defeitos.Seleccionando-se da producao da fabrica, ao acaso, 50 copos, qual a probabilidade de:

(a) Nenhum ser defeituoso?

(b) Um ser defeituoso?

(c) No maximo 1 ser defeituoso?

(d) Calcule o numero medio de copos defeituosos nesta amostra e o seu desvio padrao.

6.7 Verifica-se que, relativamente a um determinado dado, quando ele e lancado, a probabilidadede sair um numero par e duas vezes superior a probabilidade de sair um numero ımpar. Se Xrepresentar a v.a. que conta o numero de vezes que sai um numero par em 4 lancamentos destedado, determine a sua funcao de probabilidade.

6.8 Na sala de aula de uma escola primaria 5 meninos lancam ao ar moedas equilibradas. O Joaofaz 10 lancamentos, o Pedro 15, a Joana 7, a Francisca 21 e o Luıs 13. Qual a probabilidade deque no total dos lancamentos saiam exactamente 30 caras?

6.9 Numa prisao existem 1500 presos, dos quais 4% cometeram homicıdios por envenenamento.Seleccionando-se aleatoriamente 8 presos para executarem os trabalhos na cozinha da prisao,qual a probabilidade de que 2 deles sejam deste tipo de homicıdas?

6.10 Uma lista de clientes de uma empresa e constituıda por 1000 enderecos de clientes. Destes, 300compraram nos ultimos 3 meses, pelo menos um produto da empresa. Com o objectivo de avaliarda aceitacao de um novo produto, 25 clientes daquela lista foram escolhidos ao acaso e sondadosacerca do novo produto. Qual a probabilidade de no maximo 2 dos 25 clientes escolhidos, fazeremparte do grupo dos que realizaram alguma compra durante os ultimos 3 meses?

6.11 O Jose costuma jogar aos dardos acertando o alvo com probabilidade de 0.8, de cada vez quefaz pontaria. Qual a probabilidade de ele ter de jogar 3 vezes o dardo ate conseguir espetar aseta no referido alvo? Indique eventuais pressupostos para a sua resposta.

6.12 Em determinada maternidade a probabilidade de um recem-nascido ser do sexo feminino e de0.51. Qual a probabilidade de ser preciso que nascam 5 bebes ate surgir uma menina?

Page 91: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 89

6.13 Prove o teorema 6.2, referente a propriedade da falta de memoria da distribuicao geometrica.

6.14 O numero de chamadas de emergencia que um servico de ambulancias recebe por dia e uma v.a.de Poisson. Sabendo que a probabilidade de nao haver nenhuma chamada num dia e de 0.15,determine a probabilidade de:

(a) Haver apenas uma chamada num dia.

(b) Haver 2 chamadas num dia.

(c) Haver no maximo 3 chamadas num dia.

(d) Haver pelo menos 4 chamadas num dia.

(e) O numero medio de chamadas por dia e o seu desvio padrao.

6.15 Suponha que X e uma v.a. com distribuicao de Poisson.

Se P (X = 2) = 23P (X = 1), calcule P(X=0) e P(X=3).

6.16 Suponha que, em media, 10 pessoas vao a uma caixa multibanco, por dia. Admitindo que onumero de pessoas que vao a essa caixa multibanco e uma v.a. com distribuicao Poisson:

(a) A probabilidade de nao ir ninguem a caixa multibanco em determinada semana.

(b) A probabilidade de irem 50 pessoas a referida caixa nessa semana.

(c) O numero medio de visitas a caixa multibanco por semana e o seu coeficiente de variacao.

6.17 Na portagem da ponte 25 de Abril o numero de veıculos automoveis que passa em cada cabinede pagamento da portagem, por minuto, segue uma distribuicao de Poisson com valor medio 1veıculo. Supondo que em determinado minuto estao abertas 10 cabines, qual a probabilidade deserem, no total, atendidos 11 condutores nesse minuto?

6.18 Suponha que num livro de 500 paginas existem 300 erros tipograficos, distribuıdos aleatoriamentepor todo o livro. Assumindo que o numero de erros segue uma distribuicao de Poisson, determinea probabilidade de uma dada pagina conter:

(a) 2 erros tipograficos.

(b) Pelo menos 2 erros tipograficos

6.19 Um grande armazem de venda de material de vidro de laboratorio emprega 100 pessoas. Tem-severificado que o numero de pecas quebradas, por empregado e por mes, segue uma distribuicaode Poisson de valor medio 1.5. Cada peca partida representa um prejuızo de 40 centimos, peloque o armazem so arca com a despesa de um maximo de 3 pecas por mes e por empregado. Apartir deste valor e no salario do empregado que se desconta a despesa.

(a) Qual a probabilidade de um empregado escolhido ao acaso ter de pagar do seu bolso algumprejuızo num qualquer mes?

(b) Considere agora a variavel aleatoria que representa o prejuızo do armazem, por mes e porempregado. Determine a sua funcao de probabilidade, qual e esse prejuızo medio e o seudesvio padrao.

6.20 Em determinada empresa 2% das chamadas telefonicas recebidas sao enganos. Qual a probabil-idade aproximada de, em 200 telefonemas, haver pelo menos 2 enganos? Qual o numero mediode enganos?

Page 92: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 90

6.21 Numa feira popular a probabilidade de uma pessoa contrair uma intoxicacao alimentar e de0.0005. Determine a probabilidade de, em 300 pessoas, 2 ficarem intoxicadas.

6.22 Suponha que em cada 1000 indivıduos de uma certa populacao de coelhos, 2 sao albinos. Rep-resente X o numero de coelhos albinos existentes numa amostra de 1000 coelhos retirada dessapopulacao. Calcule as probabilidades P (X = 1) e P (X ≥ 3).

6.23 O tempo (em horas) que o Sr. Ze trabalha por dia e uma v.a. X com distribuicao constante nointervalo [9, 12].

(a) Identifique a distribuicao da v.a. X. Determine o numero medio de horas que o Sr. Zetrabalha por dia e o seu desvio padrao.

(b) Qual o numero mınimo de horas de trabalho diario em 90% dos dias de trabalho do Sr. Ze?

(c) Qual a probabilidade de o Sr. Ze trabalhar mais de 11 horas por dia em 4 dias de umasemana util (=5 dias)?

6.24 Determinado jogo consiste em acertar com um dardo num segmento de recta de comprimento1 metro. Admitindo se acerta apenas sobre o segmento de recta (e nao fora dele) e que se temigual probabilidade de acertar em qualquer seu ponto:

(a) Identifique a funcao densidade probabilidade da v.a. X que representa a distancia do pontoonde se acertou a um dos extremos do segmento.

(b) Calcule P (0.4 < X < 0.6).

(c) Qual o valor medio do ponto onde se acerta? E o seu coeficiente de variacao?

(d) Calcule P (0.4 < X < 0.6|X > 0.5).

6.25 Num posto dos correios o tempo (minutos) que a D. Hermınia demora a atender cada um dosseus clientes e uma v.a. exponencial de valor medio 3 minutos. Determine:

(a) A funcao distribuicao de X.

(b) A probabilidade de um cliente demorar mais de 5 minutos a ser atendido.

(c) A probabilidade de um cliente demorar mais de 3 minutos a ser atendido.

(d) A probabilidade de um cliente demorar mais de 5 minutos a ser atendido, sabendo que jaesta a ser atendido ha pelo menos 2 minutos. Compare com a probabilidade anterior ecomente.

(e) O coeficiente de variacao do tempo de atendimento.

6.26 A v.a. X representa o tempo de vida (horas) das series de luzes que se vendem no Natal. Sabe-seque esta variavel tem distribuicao exponencial com parametro 0.01. Determine:

(a) A probabilidade de uma serie destas luzes durar menos de 150 horas.

(b) O tempo medio de duracao de cada serie de luzes e o seu desvio padrao.

(c) Cada serie destas tem uma garantia de 150 horas de funcionamento. Qual a probabilidadede em 20 series vendidas 5 serem devolvidas por se terem avariado dentro do perıodo degarantia?

6.27 Demonstre o teorema 6.4.

Page 93: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 91

6.28 Seja X uma v.a. com distribuicao N(100, 202). Calcule:

(a) P (X < 125).

(b) P (X > 115).

(c) P (60 < X < 140).

6.29 Seja X uma v.a. normal com media 12 e variancia 2. Determine c tal que:

(a) P (X < c) = 0.1.

(b) P (X > c) = 0.25.

(c) P (12 − c < X < 12 + c) = 0.95.

6.30 Admita que o Q.I. das pessoas de determinado paıs e uma v.a. X com distribuicao normal demedia 90 e desvio padrao 12. Determine:

(a) A percentagem da populacao com Q.I. entre 85 e 95.

(b) A percentagem da populacao com Q.I. entre 78 e 102.

(c) O valor c > 0 tal que a percentagem da populacao com Q.I. entre 90 − c e 90 + c seja de95%.

(d) 10000 pessoas desta populacao concorreram ao selecto clube SMART, que apenas admiteindivıduos com Q.I. superior a 120. Quantas destas pessoas espera o clube vir a admitir?

6.31 A altura (metros) a que crescem os pinheiros e uma v.a. X normalmente distribuıda com desviopadrao igual a 1 metro. Supondo que 90% dos pinheiros atingem uma altura de pelo menos 16metros, qual a altura media dos pinheiros?

6.32 Numa fabrica de embalar arroz este trabalho e executado por uma maquina. A quantidade dearroz (Kg) que entra nos pacotes e uma v.a. X seguindo uma distribuicao normal de valor medioµ e desvio padrao σ.

(a) Determine σ sabendo que a quantidade embalada difere da sua media por menos de 100g,em 95 % dos casos.

(b) Supondo que µ = 1Kg, determine a probabilidade de, em 10 pacotes de arroz embaladospor esta maquina, 2 terem menos de 0.9Kg.

6.33 Considere X uma v.a. Normal de valor medio 2 e variancia 9. Seja I um intervalo do tipo[4− a, a]. Determine o valor de a de modo a que P (X ∈ I) = 0.90.

6.34 A altura (metros) a que um atleta salta e uma v.a. Normal de media 1.8m e desvio padrao20cm. Sabendo que 20% das vezes o atleta consegue saltar acima de h, determine h.

6.35 Num jardim zoologico existem um leao e um tigre que consomem, independentemente um dooutro, o mesmo tipo de alimentacao - carne de 2a. A quantidade de carne (Kg) que cada umdeles come por dia sao variaveis aleatorias, representadas por X1 para o leao e X2 para o tigre,respectivamente, normalmente distribuıdas com media 4Kg e desvio padrao 0.5Kg. Determinea probabilidade de, num determinado dia:

(a) Ambos os animais comerem menos de 3Kg de carne cada.

(b) O leao comer mais do que o tigre.

Page 94: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 92

(c) Metade do que o leao come juntamente com 34 do que o tigre come exceder os 4Kg.

6.36 Um restaurante vende comida a peso e constatou que a quantidade de comida vendida (Kg) temdistribuicao Normal, dependendo os seus parametros de o cliente ser homem ou mulher - casoseja mulher a media e de 0.4 Kg e o desvio padrao 0.1 Kg e caso seja homem a media e de 0.5Kg e o desvio padrao e de 0.2 Kg. Sabendo que os clientes sao 55% mulheres e 45% homens, eque a quantidade de comida consumida e independentes entre clientes:

(a) Determine a probabilidade de um cliente qualquer consumir menos de 0.5 Kg de comida.

(b) Sabendo que um cliente consumiu mais de 0.6 Kg de comida, qual a probabilidade de serhomem?

(c) Num grupo de 4 mulheres e 6 homens qual a probabilidade de se consumir menos de 5 Kgde comida?

6.37 Admita que X e uma v.a. com distribuicao t com 14 graus de liberdade, X ∼ t(14). Determineo valor de c, tal que:

(a) P (X ≤ c) = 0.75;

(b) P (X ≤ c) = 0.05;

(c) P (|X| > c) = 0.4.

6.38 Suponha queX e uma v.a. com distribuicao χ2 com 10 graus de liberdade, X ∼ χ2(10). Determine

o valor de c, tal que:

(a) P (X ≤ c) = 0.95;

(b) P (X ≤ c) = 0.05.

6.39 Um foguete espacial e constituıdo por 3 partes distintas, capsula, corpo e depositos. Representemas v.a.’s X, Y e W o peso da capsula, o peso do corpo do foguete e o peso dos depositos,respectivamente, em toneladas. Sabe-se que X ∼ N(5, 1), Y ∼ N(10, 22) e W ∼ N(7, 22), sendoas tres variaveis independentes entre si.

(a) Qual a probabilidade de o peso da capsula estar compreendido entre 3 e 7 toneladas?

(b) Qual o peso h que o corpo do foguete ultrapassa em 2.5% das vezes?

(c) Qual a probabilidade de o peso da capsula mais o peso dos depositos excederem o peso docorpo do foguete?

(Exercıcio de exame)

6.40 Seja X uma v.a. com distribuicao de Poisson de parametro λ. Prove que E [X] = λ.

(Exercıcio de exame)

6.41 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

De uma populacao suına de 100 porcos uma proporcao deles, p > 0, sao pretos. A probabilidadede encontrarmos 2 porcos rosa, ao seleccionarmos ao acaso um grupo de 4 porcos, e de 4p.

6.42 Considere a v.a. X que representa o numero de navios que atracam, por dia, em determinadoporto. Sabe-se que X tem distribuicao Poisson com valor medio 3 navios.

(a) Qual a probabilidade de em determinado dia atracarem no maximo 2 navios nesse porto?

Page 95: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 93

(b) Qual a probabilidade de em 5 dias chegarem apenas 2 navios?

(c) Considere agora a v.a. Y que representa o tempo entre chegadas sucessivas de 2 navios,medido em dias. Sabe-se que esta variavel tem distribuicao exponencial com parametroigual ao parametro da v.a. X atras descrita.

i. Deduza a funcao distribuicao de Y .

ii. Qual a probabilidade de o tempo entre duas chegadas sucessivas seja superior a 1 dia?

iii. Qual o tempo medio de chegadas e o correspondente desvio padrao?

6.43 Seja X uma variavel aleatoria tal que X ∼ N(2, σ2) e considere o acontecimento A = X < 3com P (A) = 0.9938.

(a) Determine σ.

(b) Considere agora o acontecimento B = X > σ + 2.i. Determine P (B).

ii. A e B sao acontecimentos independentes?

(c) Suponha que repete, de forma independente, 10 vezes a experiencia aleatoria que poderesultar no acontecimento A acima definido. Qual a probabilidade de se verificar A pelomenos 9 vezes?

6.44 Numa operacao stop montada pela GNR em determinado ponto da cidade, com o objectivo decontrolar o uso do cinto de seguranca por parte do condutores, o intervalo de tempo T quemedeia entre a passagem de automoveis cujo condutor nao usa cinto de seguranca (em minutos)segue uma distribuicao exponencial com media 10 minutos.

(a) Diga o que entende por funcao distribuicao de uma variavel aleatoria. Deduza a funcaodistribuicao de T .

(b) Qual a probabilidade da GNR estar mais de meia hora sem se deparar com um condutorinfractor (sem cinto) neste ponto da cidade?

(Exercıcio de exame)

6.45 A variavel aleatoria X (metros) representa o comprimento de barras de ferro da producao deuma fabrica. Esta variavel aleatoria e normalmente distribuıda com media 10m e variancia 4m2.Cada uma destas barras e considerada sem defeito se o seu comprimento X se encontra entre 8e 12 metros.

(a) Qual a percentagem de barras defeituosas na producao? (Arredonde a sua resposta ascentesimas).

(b) Determinado cliente esta interessado em comprar 100 destas barras. O preco que vamosfazer depende de um processo de inspeccao, por parte do cliente, a qualidade das barras.Assim ele pretende inspeccionar, ao acaso e sem reposicao, um conjunto de 10 barras dolote total das 100 que lhe vamos vender, oferecendo o seguinte: 100 e por barra se nesteconjunto de 10 nao houver nenhuma barra defeituosa; caso encontre pelo menos uma barradefeituosa so paga 50 e por barra. Qual e a quantidade de dinheiro que esperamos realizarcom esta operacao?

(c) Considere que tem duas destas barras. Qual a probabilidade de o comprimento total dasduas barras exceder os 20 metros? Justifique, indicando eventuais pressupostos que tenhade fazer.

Page 96: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 94

(Exercıcio de exame)

6.46 Considere as variaveis aleatorias X ∼ N(µX , σ2X) e Y ∼ N(µY , σ

2Y ), independentes. Determine

a covariancia entre as variaveis aleatorias W e U , dadas por W = X+Y e U = X−Y . Pode usaro resultado que obteve para concluir quanto a independencia (ou falta dela) entre as variaveisaleatorias W e U?

(Exercıcio de exame)

6.47 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Suponhamos que escolhemos ao acaso 3 alunos de uma turma com 15 rapazes e 10 raparigas,sem reposicao. Se X denotar o numero de rapazes seleccionados neste processo e Y denotaro numero de raparigas seleccionadas entao E[X − Y ] = 0.6.

(b) O tempo entre chegadas sucessivas de clientes a uma reparticao publica distribui-se ex-ponencialmente com media 2 minutos. Se o unico empregado dessa reparticao fizer umintervalo de 10 minutos para tomar cafe, a probabilidade de que nenhum cliente cheguedurante esse perıodo e de 0.007 (assuma que o empregado inicia o intervalo apos a chegadado ultimo cliente).

(c) O Jose tem rifas de Natal para vender e sabe, de anos anteriores, que aproximadamente10% das pessoas abordadas para o efeito compram uma rifa. Assumindo independenciaentre as decisoes de cada pessoa, podemos dizer que a variavel aleatoria X que representao numero de pessoas que o Jose tem de abordar ate conseguir vender uma rifa segue umadistribuicao Bernoulli(0.10).

(d) Tenho um conjunto de 5000 macarocas de milho das quais 80 sao vermelhas (milho rei) -as restantes sao amarelas. Vou seleccionar aleatoriamente 70 macarocas (de entre as 5000),representando a variavel aleatoria X numero de macarocas de milho rei que calharam naamostra. Entao posso dizer que X segue uma distribuicao Binomial(70,0.016).

(Exercıcio de exame)

6.48 Uma maquina de cafe pode ser regulada para encher com uma media de µ cl cada chavena.Sabe-se que a quantidade de cafe por chavena segue uma distribuicao normal com desvio padrao0.3cl.

(a) Quanto devera valer µ de forma a que chavenas com capacidade de 8cl so transbordem 1%das vezes?

Considere, para a resolucao das restantes alıneas, µ = 6.

(b) Se um cafe normal significar ter entre 5cl e 7cl, qual e a percentagem dos cafes que e normal?

(c) Pretende-se encher um jarro, de capacidade 60cl, com cafe. Qual a probabilidade de, ao sepedir a maquina que de 10 cafes, este limite nao seja ultrapassado.

(Exercıcio de exame)

6.49 A variavel aleatoria X representa o erro de arredondamento (em decimas de centimos, dc)efectuado na conversao dos precos de escudos para euros (um arredondamento negativo indicaque eu perdi dinheiro na operacao e um positivo que ganhei). Pensa-se que X segue umadistribuicao normal com valor medio 0dc e desvio padrao 1dc.

Page 97: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 95

(a) Qual o domınio da funcao densidade de X.

(b) Qual a probabilidade de no arredondamento de um certo preco eu ficar a perder mais de1dc?

(c) E qual a probabilidade do arredondamento ser inferior a 1dc?

(d) Imagine que eu vou a uma loja e compro 10 produtos. Qual a probabilidade de eu ficar aperder dinheiro nas seguintes duas situacoes:

i) O dono da loja soma os precos em escudos e arredonda apenas o total para euros.

ii) O dono da loja arredonda cada preco individual para euros e o arredondamento totale dado pela soma dos arredondamentos individuais.

(Exercıcio de exame)

6.50 Justifique que a funcao f(x) = 12√2π

exp

−x2

2

, x ∈ R, nao e uma funcao densidade proba-

bilidade.

(Exercıcio de exame)

Page 98: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 7

Teorema Limite Central

Neste capıtulo apresenta-se um resultado muito importante na teoria das Probabilidades e Estatıstica,que permite a determinacao aproximada da distribuicao da soma de variaveis aleatorias independentes,com a mesma distribuicao, eventualmente desconhecida.

7.1 Teorema Limite Central

Teorema 7.1 (Teorema Limite Central) Seja X1, . . . ,Xi, . . . uma sucessao de variaveis aleatoriasindependentes e identicamente distribuıdas (i.i.d.), com valor medio µ e variancia σ2 6= 0, finitos.Com base nestas define-se a v.a. Zn como:

Zn =

∑ni=1 Xi − nµ√

nσ=

Sn − nµ√nσ

, com Sn =

n∑

i=1

Xi.

Entao a distribuicao de Zn converge para uma distribuicao Normal reduzida, quando n → +∞, ouseja, a sua distribuicao assimptotica e uma Normal reduzida:

Zn =Sn − nµ√

a

∼ N(0, 1)

Nota: Na pratica, este teorema usa-se genericamente quando temos valores de n ≥ 30.

Apresentamos de seguida o T.L.C. de uma forma mais interessante para o que iremos aprenderposteriormente. Se no quociente que define Zn atras dividirmos tanto o numerador como o denomi-nador por n, o T.L.C. passa a ser enunciado nao em relacao ao total, Sn, mas em relacao a media das

variaveis aleatorias Xi, X =1

n

n∑

i=1

Xi:

Teorema 7.2 (Teorema Limite Central) Seja X1, . . . ,Xi, . . . uma sucessao de variaveis aleatoriasindependentes e identicamente distribuıdas (i.i.d.), com valor medio µ e variancia σ2 6= 0, finitos.

96

Page 99: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 97

Entao:

Zn =X − µ

σ/√n

a

∼ N(0, 1)

Exemplo 7.1 Num estudo sobre vendas num hipermercado, concluiu-se que a procura diaria de arroz(em Kg) e uma v.a. com valor medio 40Kg e desvio-padrao 5Kg.

Tendo sido encomendado 14.500Kg de arroz para venda venda no proximo ano, qual a probabilidadedeste stock cobrir a procura de arroz nesse perıodo? (Considere-se um ano com 364 dias).

Seja Xi = procura de arroz no dia i, i=1,2,. . . ,364 e admitamos que estas variaveis alaetorias saoi.i.d.. Sabemos que:

E (Xi) = 40Kg, V (Xi) = 25Kg2, i = 1, 2, . . . , 364

A procura de arroz durante um ano sera S364 =

364∑

i=1

Xi e queremos calcular P (S364 ≤ 14.500).

Ignoramos qual a distribuicao de S364, mas como se trata de uma soma de um grande numero devariaveis aleatorias i.i.d. (364 > 30), entao pelo T.L.C.

S364 − 364 × 40√364 × 5

=S364 − 14.560√

364× 5

a

∼ N(0, 1)

Assim,

P (S364 ≤ 14.500) = P

(

S364 − 14.560√364 × 5

≤ 14.500 − 14.560√364 × 5

)

≈ P (Z ≤ −0.63) = Φ (−0.63) =

= 1− Φ (0.63) = 1− 0.7357 = 0.2643

Conclusao: ”E recomendavel comprar mais arroz!”2

Apresentamos de seguida dois importantes corolarios do T.L.C., referentes a aproximacao devariaveis aleatorias Binomial e Poisson, respectivamente, pela distribuicao Normal, que podem sermuito uteis no calculo de probabilidades.

Corolario 7.2.1 Seja X uma v.a. com distribuicao Binomial de parametros n e p, i.e. X ∼Binomial(n, p). Se n ≥ 30 e p tal que np > 5 e n(1− p) > 5, entao:

Xa

∼ N(np, np(1− p))

Corolario 7.2.2 Seja X uma v.a. com distribuicao Poisson de parametro λ, i.e. X ∼ Poisson(λ).Se λ > 5, entao:

X

a

∼ N(λ, λ)

Page 100: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 98

Nota: Em ambos os corolario anteriores, como aproximamos a distribuicao de uma v.a. discretapela distribuicao de uma v.a. contınua, o calculo de probabilidades aproximadas deve ser efectuadosobre acontecimentos do tipo X ≤ k, sendo k um numero inteiro nao negativo, nomeadamente,

P (X ≤ k) ≈ P

(

Z ≤ k − np√

np (1− p)

)

, no caso Binomial;

P (X ≤ k) ≈ P

(

Z ≤ k − λ√λ

)

, no caso Poisson.

Exemplo 7.2 Considere-se a v.a. X ∼ Binomial (60, 0.1). Calculemos P (2 ≤ X ≤ 10) e P (X = 10).

Como n = 60 ≥ 30, np = 60 × 0.1 = 6 > 5 e n(1 − p) = 60 × 0.9 = 54, Xa

∼ N(np, np(1 − p)) ≡

N(60× 0.1, 60 × 0.1× 0.9) ≡ N(6, 5.4). Entao:

P (3 ≤ X ≤ 10) = P (X ≤ 10) − P (X < 3) = P (X ≤ 10)− P (X ≤ 2) ≈

≈ P

(

Z ≤ 10− 6√5.4

)

− P

(

Z ≤ 2− 6√5.4

)

= P (Z ≤ 1.72) − P (Z ≤ −1.72) =

P (Z ≤ 1.72) − P (Z ≥ 1.72) = P (Z ≤ 1.72) − (1− P (Z ≤ 1.72)) =

= 2× P (Z ≤ 1.72) − 1 = 2× Φ(1.72) = 2× 0.9573 = 0.9146

P (X = 10) = P (X ≤ 10)− P (X ≤ 9) ≈ P

(

Z ≤ 10− 6√5.4

)

− P

(

Z ≤ 9− 6√5.4

)

=

P (Z ≤ 1.72) − P (Z ≤ 1.29) = Φ(1.72) − Φ(1.29) = 0.9573 − 0.9015 = 0.0558

Nota: Experimente calcular os valores das probabilidades acima usando a distribuicao exacta, paracomparar resultados.

2

Exemplo 7.3 Considere-se a v.a. X ∼ Poisson(230). Calculemos P (X = 241). Estando nas

condicoes do corolario (7.2.2), Xa

∼ N(λ, λ) ≡ N(230, 230). Entao:

P (X = 241) = P (X ≤ 241) − P (X ≤ 240) ≈ P

(

Z ≤ 241− 230√230

)

− P

(

Z ≤ 240 − 230√230

)

=

P (Z ≤ 0.73) − P (Z ≤ 0.66) = Φ(0.73) − Φ(0.66) = 0.7673 − 0.7454 = 0.0219

2

Page 101: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 99

7.2 Exercıcios Propostos

7.1 Numa loja de conveniencia cada pessoa gasta, em media, 10e, com um desvio padrao de 3.75e.Qual a probabilidade de 100 clientes gastarem mais de 1100e, admitindo que os gastos saoindependentes de pessoa para pessoa?

7.2 O numero de sismos no Japao, por mes, e uma v.a. com media 5 sismos e desvio padrao 2sismos. Admitindo que os sismos sao independentes entre si, determine a probabilidade de nosproximos 40 anos haver no maximo 2300 sismos.

7.3 Uma empresa vende caixas com biscoitos e, quando lhe e solicitado, envia-as pelo correio. Paraas evitar pesar, cobra sempre o valor de portes de correio correspondente a admitir que qualquercaixa pesa 2508g.Cada caixa leva 100 biscoitos e o peso da embalagem plastica e desprezavel.Se soubermos que o peso de cada biscoito e variavel mas que em media pesa 25g com um desviopadrao de 8g, determine a probabilidade do valor pago em portes de correio com o envio de umacaixa ser inferior ao valor que pagaria, caso a caixa fosse pesada.

7.4 Ao adicionar numeros, um computador arredonda cada numero para o inteiro mais proximo.Admita que os erros cometidos sao v.a.’s independentes e identicamente distribuıdas (i.i.d.) comvalor medio igual a 0 e variancia igual a 1/12.Se 1200 numeros forem adicionados, qual a probabilidade aproximada de que o erro totalcometido nao ultrapasse 15.4?

7.5 Envelopes de aviao sao empacotados em grupos de 100, sendo depois pesados. Supondo que opeso de cada envelope e uma v.a. com valor medio igual a 1 grama e desvio padrao de 0.05 g,independentemente de envelope para envelope, determine:

(a) a probabilidade de que um pacote, com exactamente 100 envelopes, pese mais de 100.5 g.

(b) a probabilidade de que a media dos pesos dos 100 envelopes de um pacote, diste do respec-tivo valor medio por uma quantidade superior a 0.01g.

7.6 Numa determinada estufa de producao de tulipas vao-se semear 240 bolbos desta flor. Sabe-seque em media cada bolbo produz 4 flores, com um desvio padrao de 2 flores. Qual a probabilidadeaproximada de se conseguir obter uma producao final de mais de 1000 tulipas? Justifique.

7.7 Na populacao das mulheres cerca de 20% estao gravidas. Supondo que se selecciona ao acaso250 mulheres, qual a probabilidade de que 50 estejam gravidas? E qual a probabilidade de quepelo menos 50 estejam gravidas?

7.8 Um aviario vende ovos em caixas de 1 duzia, verificando-se que cerca de 1% dos ovos se partemno transporte para os seus locais de comercializacao. Num contentor com 80 caixas qual aprobabilidade de se encontrarem entre 5 e 15 ovos partidos?

7.9 Um medico atende, em media, 4 pessoas por hora, todas as manhas de trabalho (4 horas),cobrando por consulta 75 e. Admitindo que o numero de pessoas atendidas por hora segue umadistribuicao Poisson, qual a probabilidade de:

(a) Em 10 manhas ele receber pelo menos 12 750 e.

(b) Em 6 manhas receber entre 7200 e e 7950 e.

Page 102: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 100

7.10 O numero de utentes diarios de uma maquina de venda de selos tem uma distribuicao de Poissoncom valor medio 20. Determine a probabilidade de num mes de 30 dias:

(a) Usarem a maquina entre 580 e 621 pessoas.

(b) Usarem a maquina 580 pessoas.

7.11 Sabe-se que o numero de automoveis que entram numa auto-estrada num perıodo de 10 segundose uma v.a. com distribuicao de Poisson de valor medio 3.Qual a probabilidade aproximada de entrarem 20 ou mais automoveis durante 30 segundos?

7.12 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Quando o carteiro Ze toca a porta demoram sempre um determinado tempo a abrir, que sesabe ter distribuicao exponencial de valor medio 30 segundos. Todos os dias o carteiro Zetem de tocar em 300 portas diferentes. A probabilidade de, num desses dias, demoraremmenos de 10 segundos a abrir em mais de 70 das portas e de aproximadamente 0.1.

(b) A altura a que cada pulga da especie ”Bicho-de-pe”salta e uma variavel aleatoria de media10 centımetros e desvio padrao 2 centımetros. Assim, somando a altura a que 100 destaspulgas saltam, podemos dizer que a probabilidade dessa altura total exceder os 10 metrose aproximadamente 0.5.

(c) Suponha que o numero de chocolates vendidos diariamente por uma maquina e uma variavelaleatoria de valor medio e desvio padrao iguais a 3 chocolates. Assuma ainda que o numerode chocolates vendidos em determinado dia e independente do numero de chocolates vendi-dos noutro dia qualquer. Entao a probabilidade de em 60 dias a maquina vender no maximo180 chocolates e de 0.5.

(d) Uma companhia de seguros esta a considerar criar um seguro especial para cobrir as perdasde colheita de cereja por causa do granizo. Sabe-se que a probabilidade da colheita de umqualquer agricultor ser perdida por este motivo, num qualquer ano, e de 0.01. Supondo que2500 produtores de cereja estariam interessados em subscrever tal seguro, a probabilidadede num determinado ano a companhia de seguros ser obrigada a pagar no maximo 10premios, relativos a este seguro e a este numero de produtores, e de aproximadamente 0.2.

(e) O numero de estrelas cadentes que se observa das 21h as 22h de cada dia, no Cabo da Roca,e uma variavel aleatoria com media 5 e variancia 4. Podemos entao dizer que em meio ano(= 183 dias) a probabilidade de se observarem no total mais de 913 estrelas cadentes nestehorario e de aproximadamente 0.53.

(Exercıcio de exame)

7.13 Enuncie o Teorema do Limite Central e de um seu exemplo de aplicacao.

(Exercıcio de exame)

Page 103: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 8

Inferencia Estatıstica. EstimacaoPontual. Distribuicoes porAmostragem.

O principal objectivo da maioria dos estudos estatısticos e a generalizacao, para as populacoes emestudo, das caracterısticas observadas nas amostras destas recolhidas.

Muito frequentemente a informacao que dispomos existe apenas para um subgrupo (uma amostra)de um grande conjunto de items de interesse, significando a necessidade de generalizacoes para alemdos dados.

A inferencia estatıstica consiste assim num conjunto de metodos usados para tirar conclusoessobre uma populacao e permitir a tomada de decisoes. Estes metodos utilizam a informacao contidanuma amostra da populacao. A inferencia estatıstica compreende duas grandes areas de interesse - aestimacao de parametros e os testes de hipoteses.

Por exemplo, considere-se que estamos interessados em conhecer o nıvel de poluicao medio numdeterminado lago. Podemos recolher, em diversos dias escolhidos ao acaso, amostras da agua e mediresse nıvel. A media dos valores observados pode servir para estimar (pontualmente) o verdadeiro valormedio do nıvel de poluicao. Ainda referente a este exemplo, determinado organismo ambiental podeestar interessado em testar se o nıvel medio de poluicao nas aguas do lago (desconhecido) ultrapassacerto valor estipulado por lei. Tal pode tambem ser feito usando a amostra de dados observada.

Antes de avancarmos para o estudo de alguns dos metodos da inferencia estatıstica, apresentamosalgumas definicoes de conceitos essenciais a compreensao do que se segue.

8.1 Populacoes, amostras aleatorias e estatısticas

E muito importante saber distinguir uma populacao de uma amostra.

Definicao 8.1 (Populacao) Uma populacao consiste em todas as possıveis observacoes de um dadofenomeno.

Definicao 8.2 (Amostra) Uma amostra e um subconjunto da populacao.

Deve-se ainda saber distinguir uma populacao finita de uma populacao infinita.

101

Page 104: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 102

Uma populacao e finita se consiste num numero finito ou fixo de elementos ou observacoes como,por exemplo, o caso do numero de alunos de uma determinada escola ou os nıveis das aguas do Tejoregistados mensalmente de 1900 a 2000.

Uma populacao e infinita se contem, pelo menos hipoteticamente, um numero infinito de elementoscomo, por exemplo, quando observamos o valor de uma v.a. contınua e ha um numero infinito deresultados possıveis, ou quando eu penso que nao ha limite para o numero de vezes que posso atirarao ar uma moeda equilibrada.

Neste curso nos vamos apenas focar-nos nas populacoes infinitas.As generalizacoes que almejamos conseguir, baseadas em amostras, nao terao significado se as

amostras nao tiverem a si associadas um elemento de aleatoriedade. Imaginemos que estavamosinteressados em estimar a quantidade media de dinheiro que os Portugueses dispendem nas ferias doVerao. Se seleccionassemos uma amostra de Portugueses que tivessemos encontrado num cruzeiro deluxo e os inquirıssemos a este respeito, ninguem acharia que os resultados obtidos seriam adequadospara extrapolar para a restante populacao portuguesa! Temos pois de recorrer a amostras seleccionadasao acaso, de entre todos os elementos da populacao, ditas amostras aleatorias:

Definicao 8.3 (Amostra aleatoria) Uma amostra de tamanho n de uma populacao infinita e ditauma amostra aleatoria se consiste em valores de variaveis aleatorias independentes todas tendo amesma distribuicao f(·):

(X1, . . . ,Xn) tal que Xi

i.i.d.

∼ f(·), i = 1, . . . , n.

Exemplo 8.1 Suponhamos que estamos interessados na populacao peso das formigas da especieSolenopsis, medido em decimas de grama e denotada pela v.a. X. Sabemos que esta populacao segueuma distribuicao normal de media 10dg e desvio padrao 2dg, X ∼ N(10, 22).

Desta populacao vamos recolher uma amostra aleatoria de 4 elementos - 4 pesos (X1,X2,X3,X4).Como todos estes pesos vem da mesma populacao, entao:

X1 ∼ N(10, 22)

X2 ∼ N(10, 22)

X3 ∼ N(10, 22)

X4 ∼ N(10, 22),

sendo X1, X2, X3 e X4 v.a.’s independentes.Imagine que, apos a seleccao aleatoria de 4 formigas, os pesos observados foram x1 = 8dg, x2 =

13dg, x3 = 9dg e x4 = 8.5dg. Isto significa que a amostra aleatoria (X1,X2,X3,X4) foi concretizadana amostra observada (x1, x2, x3, x4) = (8, 13, 9, 8.5).

2

Vamos pois estar concentrados nos problema de seleccionar uma amostra aleatoria da populacaoem estudo com densidade (ou funcao probabilidade) f(·) e com base nela fazer-se inferencias sobref(·), mais precisamente sobre parametros desconhecidos de f(·).

Dada uma amostra aleatoria, precisamos ainda definir o conceito de estatıstica:

Page 105: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 103

Definicao 8.4 (Estatıstica) Uma estatıstica e uma qualquer funcao das observacoes de uma amostraaleatoria.

Exemplo 8.2 (Alguns exemplos de estatısticas) Dada uma amostra aleatoria (X1, . . . ,Xn), dedimensao n, sao estatısticas:

X A media amostral, X =1

n

n∑

i=1

Xi;

X Momento amostral de ordem k, Mk =1

n

n∑

i=1

Xki ;

X A variancia amostral, S2 =1

n− 1

n∑

i=1

(

Xi − X)2

=1

n− 1

(

n∑

i=1

X2i − nX2

)

;

X O desvio padrao amostral, S =√S2;

X O maximo amostral, X(n) = maxX1, . . . ,Xn;

X O mınimo amostral, X(1) = minX1, . . . ,Xn;

X A mediana e a moda amostrais, Me e Mo, respectivamente;

X A propria amostra, (X1, . . . ,Xn).

2

Nota: Uma estatıstica, sendo uma funcao das observacoes, e uma variavel aleatoria. A sua dis-tribuicao tem o nome de distribuicao por amostragem da estatıstica.

8.2 Estimacao pontual

Comecamos agora a abordar o problema da estimacao, apontado como uma das areas de interesseda inferencia estatıstica. Este problema vai ser aqui tratado da seguinte forma - suponhamos que apopulacao em que estamos interessados e representada por uma v.a. X que segue uma distribuicaode forma conhecida a menos de um parametro (ou conjunto de parametros) - por exemplo, X podeseguir uma distribuicao N(µ, 22), em que µ e desconhecido.

O objectivo da estimacao pontual e entao seleccionar um unico numero, baseado em dados amostrais,que seja o valor mais plausıvel para o parametro a estimar. O valor numerico de uma estatıstica eusado como estimativa pontual.

Nota: E habitual denotar por letras gregas os parametros populacionais a estimar.

Definicao 8.5 (Estimador e estimativa pontual) Se X e uma v.a. com funcao densidade ouprobabilidade f(x), caracterizada por um parametro desconhecido θ, e (X1, . . . ,Xn) e uma amostraaleatoria de tamanho n de X, a estatıstica T = h(X1, . . . ,Xn) e chamada um estimador pontual deθ. Apos a amostra ter sido recolhida, o valor particular que T toma, digamos T = θ, e chamadoestimativa pontual de θ.

Page 106: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 104

Nota: O parametro desconhecido a estimar θ, do qual depende a distribuicao de probabilidade deuma variavel aleatoria, pode ser um vector, i.e. pode ser constituıdo por mais de um elemento.

Exemplo 8.3 Retomemos o exemplo 8.1, da populacao peso das formigas Solenopsis, medido emdecimas de grama e denotada pela v.a. X. Suponhamos que o parametro µ da media populacional eradesconhecido, i.e. X ∼ N(µ, 22), µ desconhecido. O valor de µ pode ser estimado pontualmente, porexemplo, pela media de uma amostra aleatoria. Se quisermos usar uma amostra aleatoria de dimensao4, (X1,X2,X3,X4), entao um estimador de µ e:

X =1

4

4∑

i=1

Xi

Se a amostra observada foi (x1, x2, x3, x4) = (8, 13, 9, 8.5), entao a estimativa de µ e a concretizacaodo estimador X, atras:

µ = x =1

4

4∑

i=1

xi = 9.625dg

2

Apresentamos de seguida quais os mais habituais parametros populacionais que teremos de estimare qual o estimador pontual que usualmente se utiliza na sua estimacao:

Parametro Populacional Estimador

Media populacional Media amostralµ X

Momento de ordem k Momento amostral de ordem kmk Mk

Proporcao populacional Proporcao amostralp P

Variancia populacional Variancia amostralσ2 S2

Desvio padrao populacional Desvio padrao amostralσ S

Diferenca das medias de 2 amostrasDiferenca das medias de duas populacoes independentes, uma de cada populacao

µ1 − µ2 X1 − X2

8.3 Metodos de Obtencao de Estimadores‡

Vamos agora descrever dois dos metodos mais empregues, de entre os existentes, para a obtencaode estimadores para cada parametro populacional que tenhamos de estimar - o Metodo dos Momentose o Metodo da Maxima Verosimilhanca.

Page 107: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 105

8.3.1 Metodos dos Momentos

Um dos primeiros metodos de obtencao de estimadores para parametros desconhecidos foi o metododos momentos, que decorre da equacao dos momentos populacionais desconhecidos, dependentes doparametro a estimar, com momentos amostrais.

Definicao 8.6 (Metodo dos Momentos) Seja X e uma v.a. com funcao densidade ou probabilidadef(x), caracterizada por um parametro desconhecido θ, eventualmente vectorial, i.e. θ = (θ1, . . . , θp),e seja mk = E [Xk] o momento de ordem k de X (em torno da origem), regra geral dependente de

θ, mk = mk(θ). Seja (X1, . . . ,Xn) e uma amostra aleatoria de tamanho n de X e Mk =1

n

n∑

i=1

Xki o

momento amostral de ordem k.Formem-se as seguintes p equacoes em θ = (θ1, . . . , θp):

M1 = m1(θ)...

Mk = mk(θ)...

Mp = mp(θ)

A solucao θ = (θ1, . . . , θp) destas equacoes, que assumimos unica, chamamos estimador dos mo-mentos de θ.

Exemplo 8.4 Retomando o exemplo 8.1, da populacao peso das formigas Solenopsis, medido emdecimas de grama e denotada pela v.a. X. Continuemos a supor que o parametro µ da media popu-lacional e desconhecido, i.e. X ∼ N(µ, 22), µ desconhecido.

Encontremos o estimador dos momentos de µ, recorrendo a uma amostra aleatoria de dimensaon retirada da populacao, (X1, . . . ,Xn). Sabemos que m1 = E [X] = µ, depende do parametro descon-hecido. Entao, de acordo com o metodo dos momentos, devemos equacionar esta quantidade com ocorrespondente momento amostral, M1 =

1n

∑ni=1 Xi = X:

m1 = M1 ⇔ µ = X.

Assim o estimador dos momentos de µ e µ = X.2

8.3.2 Metodo da Maxima Verosimilhanca

Este metodo de estimacao, popularizado no inıcio do seculo XX, e o mais frequentemente usadoessencialmente por causa das propriedades que confere aos estimadores que obtem. Assenta na ideiaque o estimador de um parametro deve ser aquele que maximiza a funcao densidade ou de probabilidadeda amostra.

Page 108: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 106

Definicao 8.7 (Funcao de verosimilhanca) Dado um conjunto de n variaveis aleatorias X1, . . . ,Xn

cuja distribuicoes dependem de parametros θ, define-se a sua funcao verosimilhanca como a correspon-dente funcao densidade ou probabilidade conjunta, que se denota por L, considerada como funcao deθ, L(θ) = f(x1, . . . , xn; θ).

Nota: Se (X1, . . . ,Xn) for uma amostra aleatoria entao a sua funcao de verosimilhanca e dada por:

L(θ) = f(x1, . . . , xn; θ) =

n∏

i=1

f(xi).

Definicao 8.8 (Metodo da Maxima verosimilhanca) Seja L(θ) a funcao verosimilhanca de umconjunto de variaveis aleatorias X1, . . . ,Xn. Se θ = θ(x1, . . . , xn) for o valor que maximiza L(θ), deentre todos os valores que θ pode tomar, entao θ(X1, . . . ,Xn) e o estimador de maxima verosimilhancade θ e θ = θ(x1, . . . , xn) a correspondente estimativa de maxima verosimilhanca.

Exemplo 8.5 Voltemos ao exemplo 8.1, da populacao peso das formigas Solenopsis, medido emdecimas de grama e denotada pela v.a. X. Continuemos a supor que o parametro µ da media popu-lacional e desconhecido, i.e. X ∼ N(µ, 22), µ desconhecido.

Encontremos o estimador de maxima verosimilhanca de µ, recorrendo a uma amostra aleatoria dedimensao n retirada da populacao, (X1, . . . ,Xn):

L(µ) = f(x1, . . . , xn;µ) =n∏

i=1

f(xi) =n∏

i=1

1

2√2π

exp

−(xi − µ)2

2× 22

=

=1

(2√2π)n

exp

1

8

n∑

i=1

(xi − µ)2

A maximizacao da verosimilhanca acima e equivalente a maximizacao do logaritmo natural daverosimilhanca:

l(µ) = log(L(µ)) = n log

(

1

2√2π

)

+1

8

n∑

i=1

(xi − µ)2

Para maximizarmos esta funcao em µ encontremos o zero da sua derivada:

dl(µ)

dµ= 0 ⇔ 1

8

n∑

i=1

2(xi − µ) = 0 ⇔n∑

i=1

xi − nµ = 0 ⇔ µ =1

n

n∑

i=1

xi = x

Assim o estimador de maxima verosimilhanca de µ e tambem µ = X.2

Seguidamente vamos considerar algumas propriedades que os estimadores idealmente devem pos-suir, e que servem de guia a escolha de qual o estimador mais adequado ao nosso problema de estimacao.

Page 109: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 107

8.4 Algumas Propriedades dos Estimadores

Definicao 8.9 (Estimador centrado) Um estimador pontual T diz-se centrado para o parametro θse E [T ] = θ. Um estimador que nao e centrado diz-se enviesado.

Definicao 8.10 (Erro Padrao de um estimador) Dado um estimador pontual T define-se o seuerro padrao, que se designa SET , como o seu desvio padrao, caso exista:

SET =√

V(T )

Caso o erro padrao envolva parametros desconhecidos, que possam ser estimados dos dados, a substi-tuicao destes valores estimados no erro padrao produz o chamado erro padrao estimado, denotadopor SET .

Nota: No caso de estimadores centrados, o erro padrao serve para medir a precisao do estimador.Quanto menor for, melhor e a qualidade do estimador. Mais, dados dois estimadores centrados,digamos T1 e T2, do mesmo parametro, aquele que tiver menor variancia (= menor erro padrao) econsiderado melhor estimador.

Exemplo 8.6 Considere-se uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com valor medioµ. X e estimador centrado de µ:

E [X ] = E

[

1

n

n∑

i=1

Xi

]

=1

nE

[

n∑

i=1

Xi

]

=1

n

n∑

i=1

E [Xi] =1

n

n∑

i=1

µ =1

nnµ = µ

Temos ainda que V(X) =σ2

n, ou seja, SEX =

V(X) =σ√n

:

V(X) = V

(

1

n

n∑

i=1

Xi

)

=1

n2V

(

n∑

i=1

Xi

)

= (Xi v.a.′s independentes)

=1

n2

n∑

i=1

V(Xi) =1

n2

n∑

i=1

σ2 =1

n2nσ2 =

σ2

n

Assim, quanto maior for n menor sera a variancia (e o erro padrao) do estimador. Desta forma, paramelhorar a qualidade da estimacao bastara aumentar o tamanho da amostra, se possıvel.

Nota: Supondo que σ2 era desconhecido, podia ser estimado a partir dos dados por S2, sendo poiso erro padrao estimado da media dado por SEX = S√

n.

2

Exemplo 8.7 Considere-se uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com valor medioµ e variancia σ2. S2 e estimador centrado de σ2:

Page 110: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 108

E [S2] = E

[

1

n− 1

n∑

i=1

(Xi − X)2

]

=1

n− 1E

[

n∑

i=1

(X2i + X2 − 2XiX)

]

=

=1

n− 1E

[

n∑

i=1

X2i +

n∑

i=1

X2 − 2

n∑

i=1

XiX

]

=1

n− 1E

[

n∑

i=1

X2i + nX2 − 2X

n∑

i=1

n

nXi

]

=

=1

n− 1E

[

n∑

i=1

X2i + nX2 − 2XnX

]

=1

n− 1E

[

n∑

i=1

X2i − nX2

]

=

=1

n− 1

n∑

i=1

E[X2i ]− nE [X2]

= (8.4.1)

Repare-se agora que:

σ2 = V(Xi) = E [X2i ]− E 2[Xi] ⇔ σ2 = E [X2

i ]− µ2 ⇔ E [X2i ] = σ2 + µ2 (8.4.2)

E tambem que:

V(X) =σ2

n⇔ E [X2]− E 2[X] =

σ2

n⇔ E [X2]− µ2 =

σ2

n⇔ E [X2] =

σ2

n+ µ2 (8.4.3)

Substituindo-se (8.4.2) em (8.4.1), obtemos:

E [S2] =1

n− 1

n∑

i=1

(σ2 + µ2)− n

(

σ2

n+ µ2

)

=1

n− 1

(

nσ2 + nµ2 − nσ2

n− nµ2

)

1

n− 1(nσ2 − σ2) =

1

n− 1

(n− 1)σ2

= σ2

2

Notemos que apesar de S2 ser estimador centrado de σ2, o mesmo nao acontece com S em relacaoa σ - i.e., E [S] 6= σ - apesar de para amostras grandes S ser um estimador ”quase centrado”de σ.

Definicao 8.11 (Enviesamento de um estimador) Dado um estimador pontual T de um parametroθ define-se o seu enviesamento, que se denota por bias(T ), como:

bias(T ) = E [T ]− θ

Exemplo 8.8 Considere-se uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com valor medio

µ e variancia σ2. S ′ 2 =1

n

n∑

i=1

(Xi − X)2 nao e estimador centrado de σ2:

E [S ′ 2] = E

[

1

n

n∑

i=1

(Xi − X)2

]

= E

[

n− 1

n(n− 1)

n∑

i=1

(Xi − X)2

]

=

= E

[

n− 1

nS2

]

=n− 1

nE[

S2]

=n− 1

nσ2 6= σ2

Page 111: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 109

Consequentemente, o seu enviesamento e diferente de zero:

bias(S ′ 2) = E [S ′ 2]− σ2 =n− 1

nσ2 − σ2 = −σ2

n

No entanto este enviesamento converge para zero a medida que o tamanho da amostra n aumenta,o que equivale a dizer que o valor esperado do estimador S ′ 2, apesar de nao coincidir com o parametroσ2 que estima, tende para este valor a medida que aumenta o tamanho da amostra, sendo por issoS ′ 2 um estimador assimptoticamente centrado. 2

Definicao 8.12 (Estimador assimptoticamente centrado) Um estimador pontual T de um parametroθ diz-se assimptoticamente centrado para θ se lim

n→∞E (T ) = θ.

Para podermos comparar estimadores nao centrados nao podemos recorrer apenas ao erro padraodos estimadores, que avalia quao dispersos se encontram esses estimadores em redor do seu valor esper-ado (funcao do parametro a estimar), mas temos tambem de levar em consideracao os correspondentesenviesamentos, que avaliam a distancia do valor esperado do estimador ao parametro que ele estima:

Definicao 8.13 (Erro quadratico medio) Sendo T um estimador pontual de um parametro θ,define-se o seu erro quadratico medio como:

EQM(T ) = E[

(T − θ)2]

Proposicao 8.1

EQM(T ) = V (T ) + bias2(T )

Demonstracao:

EQM(T ) = E[

(T − θ)2]

= E[

(T −E [T ]E [T ]E [T ] +E [T ]E [T ]E [T ]− θ)2]

=

= E[

(T − E [T ])2 + (E [T ]− θ)2 + 2 (T − E [T ]) (E [T ]− θ)]

=

= E[

(T − E [T ])2]

+ E[

(E [T ]− θ)2]

+ 2E [(T − E [T ]) (E [T ]− θ)] =

= V(T ) + (E [T ]− θ)2 + 2 (E [T ]− θ) E [(T − E [T ])] =

= V(T ) + (bias(T ))2 + 2 (E [T ]− θ) (E [T ]− E [T ]) =

= V(T ) + bias2(T ) + 2 (E [T ]− θ)× 0 = V(T ) + bias2(T )

Quando os estimadores sao centrados o seu enviesamento e nulo, donde o erro quadratico mediocoincide com a sua variancia, e a comparacao entre este tipo de estimadores acaba apenas por assentarapenas na comparacao dos seus erros padrao.

Page 112: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 110

Definicao 8.14 (Eficiencia de um estimador) A eficiencia de um estimador e medida atraves doseu erro quadratico medio. Dados dois estimadores pontuais T1 e T2 de um parametro θ dizemos queT1 e mais eficiente do que T2 se:

EQM(T1) < EQM(T2)

Caso a desigualdade anterior seja valida para qualquer estimador pontual T2 de θ entao dizemosque T1 e o estimador mais eficiente de θ.

Exemplo 8.9 Considere-se uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com valor medioµ e variancia σ2. X = 1

n

∑ni=1 Xi e um estimador de µ mais eficiente do que T = nX1:

EQM [X ] = V (X) + bias2(X) =σ2

n+ 02 =

σ2

n

EQM [T ] = V(T ) + bias2(T ) = V (nX1) + (E [T ]− µ)2 =

= n2V(X1) + (E [nX1]− µ)2 = n2σ2 + (nE [X1]− µ)2 =

= n2σ2 + (n− 1)2 µ2 =σ2

n

σ2

n

σ2

n− σ2

n

σ2

n

σ2

n+ n2σ2 + (n− 1)2 µ2 =

=σ2

n+

(

n2 − 1

n

)

σ2 + (n− 1)2 µ2 = EQM [X ] + termo nao negativo ≥ EQM [X ]

2

Para finalizar, referimos uma outra propriedade importante dos estimadores, baseada no conceitode consistencia de um estimador, relacionada com a ideia de que quanto mais informacao amostralpossuirmos (maior numero de elementos na amostra, n), mais proximamente conseguimos estimaro valor do parametro. A avaliacao desta propriedade e usualmente feita atraves do EQM , com oseguinte resultado:

Proposicao 8.2 (Estimador consistente) Um estimador pontual centrado T do parametro θ econsistente se lim

n→∞EQM(T ) = 0.

Exemplo 8.10 X e um estimador consistente de µ, ja que limEQM(X) = limV (X) = lim

(

σ2

n

)

=

0.2

8.5 Distribuicoes por amostragem

Como vimos cada estimador e uma estatıstica, pois e sempre uma funcao da amostra aleatoria.Assim, cada estimador e uma v.a. com uma distribuicao associada, a qual designamos por distribuicaopor amostragem.

Page 113: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 111

Nesta seccao vamos estudar a distribuicao por amostragem de alguns estimadores, em algumassituacoes concretas de interesse.

8.5.1 Distribuicoes por amostragem da media amostral, X

8.5.1.1 Suponhamos que foi seleccionada uma amostra aleatoria de dimensao n, (X1, . . . ,Xn), de umapopulacao Normal de media µ e variancia σ2, conhecida. Assim, Xi ∼ N(µ, σ2), σ2

conhecida.

Consequentemente, neste contexto, a distribuicao por amostragem de X =∑n

i=1 Xi

n e ainda

Normal, com media E [X ] = µ e variancia V[X ] = σ2

n , ja que este estimador e dado como umacombinacao linear de variaveis aleatorias Normais independentes:

Z =X − µ

σ/√n

∼ N(0, 1)

8.5.1.2 Suponhamos agora que se seleccionou uma amostra aleatoria de dimensao n, (X1, . . . ,Xn), deuma populacao Normal de media µ e variancia σ2, desconhecida. Assim, Xi ∼ N(µ, σ2),σ2 desconhecida.

Vamos aqui usar S2 para estimar σ2, implicando uma distribuicao por amostragem para amedia amostral t-student com n− 1 graus de liberdade:

T =X − µ

S/√n

∼ t(n−1)

8.5.1.3 Suponhamos ainda que foi seleccionada uma amostra aleatoria de dimensao n, (X1, . . . ,Xn),de uma populacao Normal de media µ e variancia σ2, desconhecida, mas que o tamanhoamostral n e superior ou igual a 30.

Neste caso, a distribuicao por amostragem para a media amostral do ponto anterior,pode ser aproximada por uma distribuicao Normal reduzida, justificado atraves do Teorema doLimite Central:

Z =X − µ

S/√n

a

∼ N(0, 1)

8.5.1.4 Consideremos agora que foi seleccionada uma amostra aleatoria de dimensao n, (X1, . . . ,Xn), deuma de distribuicao desconhecida, de media µ e variancia σ2, conhecida. Consideremosainda que temos um tamanho de amostra n superior ou igual a 30.

Tambem aqui o Teorema do Limite Central e usado para justificar que a distribuicao poramostragem da media amostral e aproximadamente Normal reduzida:

Z =X − µ

σ/√n

a

∼ N(0, 1)

Page 114: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 112

8.5.1.5 Finalmente, consideremos que seleccionamos uma amostra aleatoria de dimensao n, (X1, . . . ,Xn),de uma de distribuicao desconhecida, de media µ e variancia σ2, desconhecida. Consid-eremos ainda que temos um tamanho de amostra n superior ou igual a 30.

O Teorema do Limite Central justifica que a distribuicao por amostragem da mediaamostral e aproximadamente Normal reduzida:

Z =X − µ

S/√n

a

∼ N(0, 1)

8.5.2 Distribuicao por amostragem para a diferenca de medias amostrais, X1− X2

Aqui consideraremos apenas um caso de muitos possıveis.

Suponhamos que foram seleccionadas de forma independente duas amostras aleatorias de dimensoesn1 e n2, respectivamente, de duas populacoes Normais independentes com variancias conhecidas dadas,respectivamente, por σ2

1 e σ22 . Suponhamos ainda que cada uma dessas amostras resulta nas corre-

spondentes medias amostrais X1 e X2.Neste contexto, a distribuicao por amostragem de X1 − X2 e ainda Normal, por ser a com-

binacao linear de variaveis aleatorias normais independentes:

Z =(X1 − X2)− (µ1 − µ2)

σ21

n1+

σ22

n2

∼ N(0, 1)

8.5.3 Distribuicao por amostragem da proporcao, P

Assuma-se que os elementos de determinada populacao possuem uma dada caracterıstica, comuma certa probabilidade p desconhecida, independentemente uns dos outros.

Suponhamos que se selecciona uma amostra aleatoria de n elementos desta populacao. Se X deno-tar o numero desses elementos que possuem a referida caracterıstica, sabemos queX ∼ Binomial(n, p).Mais, se o tamanho da amostra n for suficientemente grande, o Teorema do Limite Central justificaque:

Z =X − np

np(1− p)

a

∼ N(0, 1) (8.5.4)

Ja anteriormente dissemos que p pode ser pontualmente estimado pela proporcao de elementos quena amostra possuem a referida populacao, P . Notamos ainda que:

P =X

n

Esta relacao permite-nos pois obter uma distribuicao por amostragem aproximada de P ,usando (8.5.4):

Page 115: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 113

Z =P − p

p(1− p)/n

a

∼ N(0, 1)

Sendo p um parametro desconhecido, somos frequentemente levados a estimar o erro padrao nodenominador na estatıstica anterior por

P (1− P )/n.

8.5.4 Distribuicao por amostragem da variancia amostral, S2

Suponhamos que foi seleccionada uma amostra aleatoria de dimensao n, (X1, . . . ,Xn), de umapopulacao Normal de media µ, desconhecida, e variancia σ2.

Neste contexto, a distribuicao por amostragem de S2 = 1n−1

∑ni=1

(

Xi − X)2

e dada por:

X2 =(n− 1)S2

σ2∼ χ2

(n−1)

8.6 Exercıcios Propostos

8.1 Considere a populacao formada pelo numero de filhos por famılia (X) num determinado paıs,em que X=0, 1, 2, 3, 4 (nao ha famılias com mais de 4 filhos). Suponha que se conhece a suadistribuicao de probabilidade:

X

0 1 2 3 40.15 0.25 0.30 0.20 0.10

(a) Quais os valores populacionais de µ e σ2?

(b) Desta populacao recolhe-se uma amostra aleatoria constituıda por 2 famılias - (X1,X2).Qual a distribuicao de probabilidade de X1 e X2 e os respectivos parametros µ e σ2?

(c) Suponha que recolheu a seguinte amostra aleatoria de 10 famılias:

(1,3,0,0,2,3,0,2,4,1).

Com base nesta amostra estime pontualmente µ e σ2. Estime ainda o erro padrao daestimativa de µ. Comente.

8.2 Considere que se seleccionou uma amostra aleatoria (X1, . . . ,Xn) de uma populacao N(µ, σ2).

(a) Mostre que X =

∑ni=1 Xi

ne estimador centrado e consistente da media populacional.

(b) Mostre que θ1 =X1 +Xn

2e θ2 =

2X1 + 3X2 + 5X3

10tambem sao estimadores centrados de

µ. Qual e melhor? Sao consistentes?

(c) Mostre que (X)2 nao e estimador centrado de µ2.

8.3 Suponha que seleccionou uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com a seguintefuncao densidade probabilidade:

Page 116: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 114

f(x) =

1θ , 0 ≤ x ≤ θ0, c.c.

Mostre que 2X e um estimador centrado de θ. E tambem um estimador consistente?

8.4 Seja X1 a media de uma amostra aleatoria de dimensao n extraıda de uma populacao Poisson(λ)e seja X2 a media de uma amostra aleatoria da mesma dimensao extraıda de uma populacaoPoisson(2λ). Considere ainda o seguinte estimador de λ:

λ = pX1 +(1− p)X2

2, p ∈]0, 1[.

(a) λ e um estimador centrado de λ?

(b) Qual e a sua variancia e diga para que valor de p e que e mınima?

(c) λ e um estimador consistente?

8.5 Sabe-se que a idade de determinada camada do subsolo segue uma distribuicao Normal commedia de 0.5 milhoes de anos e um desvio padrao de 20000 anos. Seleccionadas ao acaso 10amostras de subsolo calcule a probabilidade de a media amostral das suas idades ser superior a490000 anos.

8.6 Suponha que amostras aleatorias de dimensao 25 sao extraıdas de uma populacao Normal demedia 100 e desvio padrao 10.

(a) Qual a probabilidade de a media amostral cair no intervalo de E [X ] − 1.96 × SE[X ] aE [X ] + 1.96 × SE[X ]?

(b) Quanto devera ser o tamanho amostral tal que a amplitude do intervalo definido em (a)diminua para 2.

8.7 O tempo de espera em pista para a descolagem de cada aviao no aeroporto de Lisboa e uma v.a.com valor medio 4 minutos e desvio padrao 2.5 minutos. Suponha que se selecciona ao acaso 50avioes, para se registarem os seus correspondentes tempos de espera. Calcule a probabilidadede a media dos tempos de espera exceder os 5 minutos.

8.8 Assuma que o numero de ovos que as tartarugas verdes depositam nas praias, em cada desova,e uma v.a. de Poisson, com valor medio 15 ovos. Seleccionando ao acaso uma amostra de100 tartarugas verdes, qual a probabilidade de que a media do numero de ovos destas estejacompreendido entre o seu valor medio e ± 3 vezes o seu erro padrao.

8.9 Suponha que o tempo de vida de determinada especie de burros e uma v.a. com distribuicaoexponencial, de valor medio 25 anos. Seleccionando ao acaso uma amostra de 40 burros destaespecie, qual a probabilidade de que a media dos seus tempos de vida seja inferior a 20 anos?

8.10 Sabe-se que o nıvel de colesterol no sangue esta dependente, entre outras coisas, da idade daspessoas. Considere a populacao desses nıveis de colesterol em adultos com idades superioresa 15 anos, que se sabe ter uma distribuicao Normal de valor medio 275 mg/dl de sangue edesvio padrao 100 mg/dl, da qual se vai retirar uma amostra de dimensao 25. Considere ainda a

Page 117: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 115

populacao das criancas com idades inferiores a 15 anos, que se sabe ter uma distribuicao Normalde valor medio 180 mg/dl de sangue e desvio padrao 40 mg/dl, da qual se vai retirar uma amostrade dimensao 20, independente da anterior. Representando X1 e X2 as medias das amostras atrasindicadas, respectivamente, calcule a probabilidade de:

(a) X1 − X2 ser superior a 100mg/dl sangue.

(b) X1 − X2 estar compreendido entre 35mg/dl sangue e 155mg/dl sangue.

8.11 No paıs das Maravilhas a proporcao de loucos e de 0.45. Suponha que se pretende seleccionaruma amostra aleatoria de 500 habitantes deste paıs. Qual a probabilidade de a proporcao deloucos que vao calhar na amostra exceder 0.5?

8.12 Numa populacao Normal de media desconhecida e desvio padrao 5 calcule a probabilidade de avariancia de uma amostra aleatoria de dimensao 20 dessa populacao estar compreendida entre26 e 58.

8.13 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Seja X a media de uma amostra aleatoria (X1, . . . ,Xn). A sua distribuicao por amostrageme sempre Normal.

(b) Se X for a media de uma amostra aleatoria (X1, . . . ,Xn) de uma populacaoX ∼ Poisson(λ),X e pior estimador de λ do que X1, o primeiro elemento da amostra.

8.14 Indique um estimador centrado e consistente para a media de uma populacaoX ∼ Exponencial(λ).

8.15 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Uma amostra aleatoria de dimensao 50 e seleccionada de uma populacao com media µ = 5e variancia σ2 = 1. Entao distribuicao amostral de X e aproximadamente t49.

(b) Um estimador centrado e preferıvel a um estimador nao centrado porque a sua variancia emenor.

(c) Seja X uma variavel aleatoria Binomial, X ∼ Bin(n, p). A proporcao amostral P = Xn e

um estimador centrado e consistente de p.

(d) Suponha que X ∼ N(4, 22) e que Y ∼ N(4, 12), independentes entre si. Seja X a mediaamostral de uma amostra aleatoria de dimensao 5 da distribuicao de X e seja Y a mediaamostral de uma amostra aleatoria de dimensao 5 da distribuicao de Y . Entao P (X >Y ) = 0.25.

(e) Se (X1,X2) formam uma amostra aleatoria de dimensao 2 de uma populacao Normal(µ, 22),entao o estimador T = X1+2X2

3 de µ tem distribuicao por amostragem Normal.

(f) O erro padrao do estimador X e igual ao desvio padrao da populacao de onde a amostraaleatoria foi seleccionada.

(g) O Teorema Limite Central e util quando se pretende fazer um teste de hipoteses sobreproporcoes.

(h) Vai seleccionar-se uma amostra aleatoria de dimensao n > 40, (X1, . . . ,Xn), de uma pop-ulacao X de media µ e variancia σ2. E indiferente estimar a media populacional µ porT1 = X ou por T2 =

X1+X2n ou ainda por T3 =

X1+X2+X33 .

(i) Uma caracterıstica numerica de uma amostra e um parametro.

Page 118: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 116

(j) Se a media de uma populacao e conhecida nao faz sentido efectuar testes de hipotesesrespeitantes a media populacional.

(k) Ao duplicar o tamanho de uma amostra aleatoria retirada de uma populacao com varianciaconhecida, a variabilidade do estimador media amostral diminui para metade.

(l) Se T1 e T2 sao estimadores centrados de um parametro θ entao uma sua qualquer combinacaolinear tambem e um estimador centrado de θ.

(m) Considere que se extrai uma amostra aleatoria (X1, . . . ,Xn) de uma populacao com dis-

tribuicao Poisson(λ). Entao T = (n−1)X1+Xn

n e um estimador centrado e consistente deλ.

(Exercıcio de exame)

Page 119: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 9

Intervalos de Confianca

No capıtulo anterior vimos como estimar pontualmente um parametro populacional a partir de umaamostra aleatoria seleccionada da populacao.

No entanto, por causa da variabilidade amostral, raramente a estimativa que obtemos para oparametro que queremos estimar coincide com ele proprio. Isto leva-nos a pensar que talvez tivessemais interesse obtermos um intervalo de valores plausıveis para o parametro a estimar, em vez de umunico ponto - estimativa intervalar.

9.1 Intervalos de Confianca

Um intervalo de confianca nao e mais do que uma estimativa intervalar para um parametro popu-lacional. Seleccionada uma amostra aleatoria da populacao, determina-se uma estimativa pontual doparametro em questao e tambem o intervalo. Nao temos a certeza que o intervalo obtido contenhao verdadeiro valor do parametro, mas o intervalo e construıdo de tal forma que temos uma grandeconfianca de que tal acontece.

Retomemos o exemplo das formigas da especie Solenopsis, do capıtulo anterior:

Exemplo 9.1 Consideramos a populacao do peso das formigas Solenopsis, medido em decimas degrama, que sabemos ter distribuicao Normal com media µ e variancia σ2 = 22, X ∼ N(µ, 22).

Desta populacao observamos a amostra de 4 pesos, (8, 13, 9, 8.5), a qual usamos para obter umaestimativa de µ, x = 9.625dg. Queremos agora determinar limites inferior e superior de um intervaloque seja quase certo de conter µ.

Em geral, para amostras de dimensao 4 desta populacao, sabemos das distribuicoes por amostragemde X estudadas no capıtulo anterior, que:

Z =X − µ

σ/√n

=X − µ

2/√4

∼ N(0, 1)

Como X estima µ temos interesse em que a v.a. Z, atras definida como a diferenca destasduas quantidades, seja o mais possıvel proximo de zero, indicando proximidade entre o estimador e oparametro. Vamos entao exigir que, com uma grande probabilidade, digamos 0.95, a v.a. Z se situeem torno de zero - ver figura.

117

Page 120: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 118

−1.96 1.960

0.95

Assim,

P (−1.96 < Z < 1.96) = 0.95 ⇔ P

(

−1.96 <X − µ

2/√4

< 1.96

)

= 0.95 ⇔

P(

−1.96× 2/√4 < X − µ < 1.96 × 2/

√4)

= 0.95 ⇔

P(

−X − 1.96 × 2/√4 < −µ < −X + 1.96 × 2/

√4)

= 0.95 ⇔

P(

X − 1.96 × 2/√4 < µ < X + 1.96 × 2/

√4)

= 0.95

Ao intervalo aleatorio(

X − 1.96× 2/√4; X + 1.96 × 2/

√4)

chamamos de intervalo de confianca a

95% para µ, designando-o por IC95%(µ). Concretizando este intervalo para a amostra observada obte-

mos o intervalo(

x− 1.96 × 2/√4; x+ 1.96 × 2/

√4)

≡(

9.625 − 1.96 × 2/√4; 9.625 + 1.96 × 2/

√4)

≡(7.665; 11.585). Tambem a concretizacao do intervalo aleatorio chamamos intervalo de confianca a95% para µ, representando-o de forma analoga a anteriormente indicada.

A probabilidade de o intervalo aleatorio(

X − 1.96× 2/√4; X + 1.96 × 2/

√4)

incluir o verdadeiro

valor da media µ e de 0.95. Isto e, se se extraırem repetidamente amostras de tamanho 4 desta mesmapopulacao e este intervalo for determinado para cada uma dessas amostras, entao a frequencia relativados intervalos contendo µ sera de aproximadamente 0.95.

Note-se entao que temos uma grande confianca (95%) de que o intervalo obtido contenha µ.Vejamos agora o que sucede aumentando a confianca do intervalo para 99%:

P (−2.58 < Z < 2.58) = 0.99 ⇔ P

(

−2.58 <X − µ

2/√4

< 2.58

)

= 0.99 ⇔

P(

X − 2.58 × 2/√4 < µ < X + 2.58 × 2/

√4)

= 0.99

Assim,

Page 121: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 119

IC99%(µ) ≡(

X − 2.58 × 2/√4; X + 2.58× 2/

√4)

≡ (X − 2.58; X + 2.58) ≡≡ (9.625 − 2.58; 9.625; 2.58) ≡ (7.045; 12.205)

Tenho entao mais confianca que µ pertence ao novo intervalo de confianca, mas para tal o intervaloresultante e mais largo!

2

No exemplo anterior construımos dois intervalos de confianca para um mesmo parametro, com basenuma argumentacao algo intuitiva. Mas em geral, qual o metodo a aplicar na construcao de intervalosde confianca? E o que vamos aprender de seguida. Mas antes comecemos por definir um conceito queiremos precisar depois:

Definicao 9.1 (Estatıstica Pivot) Seja (X1, . . . ,Xn) uma amostra aleatoria de uma populacaodependente de um parametro θ. Seja T uma estatıstica, funcao da amostra e do parametro θ,i.e. T = T (X1, . . . ,Xn, θ). Se a distribuicao por amostragem de T nao depende de θ entao diz-seque T e uma estatıstica pivot.

Exemplo 9.2 Considere-se uma amostra aleatoria (X1, . . . ,Xn) da populacao dos pesos das formigasSolenopsis, X ∼ N(µ, 22). Considere-se ainda a estatıstica

Z =X − µ

2/√n,

funcao da amostra (X1, . . . ,Xn) e do parametro populacional µ. Sabemos, do capıtulo anterior, quea sua distribuicao por amostragem e N(0, 1), i.e. uma distribuicao que nao depende do parametro µ.Por este motivo, Z atras definida e uma estatıstica pivot.

2

Definicao 9.2 (Metodo Pivotal) Se T = T (X1, . . . ,Xn, θ) for uma estatıstica pivot contınua entao,para (1 − α) fixo, existem valores c1 e c2, dependentes de (1 − α), tais que P (c1 < T < c2) = 1 − α.Se tivermos que

c1 < T (X1, . . . ,Xn, θ) < c2 ⇔ T1(X1, . . . ,Xn) < θ < T2(X1, . . . ,Xn),

para funcoes T1 e T2 nao dependentes de θ, entao (T1;T2) e um intervalo de confianca a (1−α)×100%para θ.

Notas:

1. c1 e c2 sao quantidades independentes de θ, ja que a distribuicao de T e independente de θ.

2. Diferentes pares de (c1, c2) produzem diferentes intervalos de confianca (T1;T2). Para (1 − α)fixo ha muitas possibilidades de pares (c1, c2) diferentes. Uma forma de orientar a nossa escolhae faze-la de modo a que o intervalo resultante (T1;T2) venha o mais estreito possıvel. No casode os intervalos serem construıdos com base numa estatıstica pivot com distribuicao Normal out-Student tal implica a escolha de um intervalo centrado na media da correspondente distribuicaopivot.

Page 122: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 120

9.2 Intervalos de Confianca para a media populacional, µ

Vamos deduzir nesta seccao intervalos de confianca (1 − α) × 100% para a media populacional,usando o metodo pivotal. Para tal temos de considerar diversas situacoes possıveis, que exigem o usode estatısticas pivot cuja distribuicao por amostragem estudamos no capıtulo anterior.

9.2.1 Populacao Normal com variancia conhecida

Suponhamos que seleccionamos uma amostra aleatoria (X1, . . . ,Xn) de uma populacao Normal(µ, σ2),de variancia σ2 conhecida, com a qual pretendemos construir um intervalo de confianca (1−α)×100%para µ:

• Escolha da estatıstica pivot: Z = X−µσ/

√n∼ N(0, 1);

• Para um nıvel de confianca de (1−α)×100%, escolha de c1 e c2: Pela nota 2 ao metodo pivotal,e porque a distribuicao da estatıstica pivot e Normal reduzida, escolhemos c1 = −c e c2 = c -ver figura a seguir.

−c c0

1− α

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

X − µ

σ/√n

< z1−α2⇔

− z1−α2

σ√n< X − µ < z1−α

2

σ√n⇔ −z1−α

2

σ√n− X < −µ < z1−α

2

σ√n− X ⇔

X − z1−α2

σ√n< µ < X + z1−α

2

σ√n

• Assim,

IC(1−α)×100%(µ) ≡(

X − z1−α2

σ√n

; X + z1−α2

σ√n

)

Page 123: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 121

9.2.2 Populacao Normal com variancia desconhecida

Suponhamos que seleccionamos uma amostra aleatoria (X1, . . . ,Xn) de uma populacao Normal(µ, σ2),de variancia σ2 desconhecida, com a qual pretendemos construir um intervalo de confianca (1− α)×100% para µ:

• Escolha da estatıstica pivot: T = X−µS/

√n∼ t(n−1);

• Para um nıvel de confianca de (1−α)×100%, escolha de c1 e c2: Pela nota 2 ao metodo pivotal,e porque a distribuicao da estatıstica pivot e t-Student, escolhemos c1 = −c e c2 = c.

P (−c < T < c) = 1− α ⇔ P (T < c)− P (T ≤ −c) = 1− α ⇔P (T < c)− P (T ≥ c) = 1− α ⇔ P (T < c)− (1− P (T < c)) = 1− α ⇔

P (T < c)− 1 + P (T < c) = 1− α ⇔ P (T < c) = 1− α

2⇔ c = F−1

t(n−1)

(

1− α

2

)

= t1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < T < c ⇔ −t1−α2< T < t1−α

2⇔ −t1−α

2<

X − µ

S/√n

< t1−α2⇔

− t1−α2

S√n< X − µ < t1−α

2

S√n⇔ −t1−α

2

S√n− X < −µ < t1−α

2

S√n− X ⇔

X − t1−α2

S√n< µ < X + t1−α

2

S√n

• Assim,

IC(1−α)×100%(µ) ≡(

X − t1−α2

S√n

; X + t1−α2

S√n

)

9.2.3 Populacao Normal com variancia desconhecida e n > 30

Suponhamos que seleccionamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), deuma populacao Normal(µ, σ2), de variancia σ2 desconhecida, com a qual pretendemos construir umintervalo de confianca (1− α)× 100% para µ:

• Escolha da estatıstica pivot: Z = X−µS/

√n

a

∼ N(0, 1);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Page 124: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 122

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

X − µ

S/√n

< z1−α2⇔

− z1−α2

S√n< X − µ < z1−α

2

S√n⇔ −z1−α

2

S√n− X < −µ < z1−α

2

S√n− X ⇔

X − z1−α2

S√n< µ < X + z1−α

2

S√n

• Assim, obtemos o seguinte intervalo de confianca aproximado:

IC(1−α)×100%(µ) ≡(

X − z1−α2

S√n

; X + z1−α2

S√n

)

9.2.4 Populacao desconhecida com variancia conhecida e n > 30

Suponhamos que seleccionamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), de umapopulacao desconhecida com media µ e variancia conhecida σ2, e com a qual pretendemos construirum intervalo de confianca (1− α)× 100% para µ:

• Escolha da estatıstica pivot: Z = X−µσ/

√n

a

∼ N(0, 1);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

X − µ

σ/√n

< z1−α2⇔

− z1−α2

σ√n< X − µ < z1−α

2

σ√n⇔ −z1−α

2

σ√n− X < −µ < z1−α

2

σ√n− X ⇔

X − z1−α2

σ√n< µ < X + z1−α

2

σ√n

• Assim, obtemos o seguinte intervalo de confianca aproximado:

IC(1−α)×100%(µ) ≡(

X − z1−α2

σ√n

; X + z1−α2

σ√n

)

Page 125: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 123

9.2.5 Populacao desconhecida com variancia desconhecida e n > 30

Suponhamos que seleccionamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), de umapopulacao desconhecida com media µ e variancia σ2, ambos desconhecidos, e com a qual pretendemosconstruir um intervalo de confianca (1 − α)× 100% para µ:

• Escolha da estatıstica pivot: Z = X−µS/

√n

a

∼ N(0, 1);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

X − µ

S/√n

< z1−α2⇔

− z1−α2

S√n< X − µ < z1−α

2

S√n⇔ −z1−α

2

S√n− X < −µ < z1−α

2

S√n− X ⇔

X − z1−α2

S√n< µ < X + z1−α

2

S√n

• Assim, obtemos o seguinte intervalo de confianca aproximado:

IC(1−α)×100%(µ) ≡(

X − z1−α2

S√n

; X + z1−α2

S√n

)

9.3 Intervalo de Confianca para a diferenca de medias populacionais,

µ1 − µ2

Vamos deduzir nesta seccao um intervalo de confianca (1− α)× 100% para a diferenca de mediaspopulacionais, usando o metodo pivotal. Consideramos um unico caso em que ambas as populacoesenvolvidas tem distribuicao normal com variancias conhecidas, usando uma estatıstica pivot cujadistribuicao por amostragem foi considerada no capıtulo anterior.

Suponhamos que seleccionamos uma amostra aleatoria de dimensao n1 de uma populacao comdistribuicao Normal(µ1, σ

21), de variancia σ2

1 conhecida. Seja X1 a correspondente media amostral.Suponhamos ainda que seleccionamos uma outra amostra aleatoria de dimensao n2 de uma outrapopulacao, independente da primeira, com distribuicao Normal(µ2, σ

22), σ2

2 conhecida. Seja X2 acorrespondente media amostral.

Construamos um intervalo de confianca (1− α) × 100% para µ1 − µ2:

• Escolha da estatıstica pivot: Z = (X1−X2)−(µ1−µ2)√

σ21

n1+

σ22

n2

∼ N(0, 1);

Page 126: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 124

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2: escolhemos c1 = −c e c2 = c.

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

(X1 − X2)− (µ1 − µ2)√

σ21

n1+

σ22

n2

< z1−α2⇔

− z1−α2

σ21

n1+

σ22

n2< (X1 − X2)− (µ1 − µ2) < z1−α

2

σ21

n1+

σ22

n2⇔

− z1−α2

σ21

n1+

σ22

n2− (X1 − X2) < −(µ1 − µ2) < z1−α

2

σ21

n1+

σ22

n2− (X1 − X2) ⇔

(X1 − X2)− z1−α2

σ21

n1+

σ22

n2< µ1 − µ2 < (X1 − X2) + z1−α

2

σ21

n1+

σ22

n2

• Assim,

IC(1−α)×100%(µ1 − µ2) ≡

(X1 − X2)− z1−α2

σ21

n1+

σ22

n2; (X1 − X2) + z1−α

2

σ21

n1+

σ22

n2

9.4 Intervalo de Confianca para proporcao populacional, p

Vamos deduzir nesta seccao um intervalo de confianca (1 − α) × 100% para a proporcao popula-cional, usando o metodo pivotal. Consideramos a situacao em que estamos interessados em estimar aproporcao dos elementos que na populacao possuem determinada caracterıstica, atraves da correspon-dente proporcao amostral P , referente a uma amostra de dimensao suficientemente grande. Podemosassim usar a seguinte estatıstica pivot, cuja distribuicao por amostragem foi considerada no capıtuloanterior:

• Escolha da estatıstica pivot: Z = P−p√p(1−p)/n

a

∼ N(0, 1);

Antes de deduzir o intervalo de confianca temos de fazer outra aproximacao. A variancia de P ,que e dada por p(1-p)/n e que aparece na estatıstica pivot anterior, e necessariamente descon-hecida, pois depende de p, parametro desconhecido. Assim, estima-se esta variancia com base naamostra por P(1-P)/n. Consequentemente passamos a usar a seguinte estatıstica, que tambeme pivot:

Page 127: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 125

Z = P−p√P (1−P )/n

a

∼ N(0, 1);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < Z < c) = 1− α ⇔ P (Z < c)− P (Z ≤ −c) = 1− α ⇔P (Z < c)− P (Z ≥ c) = 1− α ⇔ P (Z < c)− (1− P (Z < c)) = 1− α ⇔

Φ(c)− 1 + Φ(c) = 1− α ⇔ Φ(c) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

• Determinacao dos extremos do intervalo de confianca:

− c < Z < c ⇔ −z1−α2< Z < z1−α

2⇔ −z1−α

2<

P − p√

P (1− P )/n< z1−α

2⇔

− z1−α2

P (1− P )/n < P − p < z1−α2

P (1− P )/n ⇔− z1−α

2

P (1− P )/n − P < −p < z1−α2

P (1− P )/n − P ⇔P − z1−α

2

P (1− P )/n < p < P + z1−α2

P (1− P )/n

• Assim, obtemos o seguinte intervalo de confianca aproximado:

IC(1−α)×100%(p) ≡(

P − z1−α2

P (1− P )/n ; P + z1−α2

P (1− P )/n)

9.5 Intervalo de Confianca para a variancia populacional, σ2, e para

o desvio padrao populacional, σ

Vamos deduzir nesta seccao um intervalo de confianca (1−α)×100% para a variancia populacional,usando o metodo pivotal. Consideramos o caso em que temos uma populacao Normal(µ, σ2), em queµ e desconhecida. Vamos usar uma estatıstica pivot cuja distribuicao por amostragem foi apresentadano capıtulo anterior.

Considere-se a situacao em que temos uma amostra aleatoria (X1, . . . ,Xn) de uma populacaoNormal(µ, σ2), µ desconhecido. Esta amostra resulta na variancia amostral S2.

Construamos um intervalo de confianca (1− α) × 100% para σ2:

• Escolha da estatıstica pivot: X2 = (n−1)S2

σ2 ∼ χ2(n−1);

• Para um nıvel de confianca de (1 − α) × 100%, escolha de c1 e c2: neste caso a escolha destesvalores nao se faz de acordo com o criterio indicado na nota 2 do metodo pivotal, de menoramplitude intervalar. O criterio aqui escolhido e o da simplicidade e diz que escolhamos estesvalores de forma a que:

Page 128: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 126

P (X2 < c1) =α

2⇔ c1 = F−1

χ2(n−1)

2

)

= χα/2

P (X2 > c2) =α

2⇔ 1− P (X2 ≤ c2) =

α

2⇔ P (X2 ≤ c2) = 1− α

2

c2 = F−1χ2(n−1)

(

1− α

2

)

= χ1−α/2

Ver figura abaixo.

1− α

α2

α2

c1 c2

• Determinacao dos extremos do intervalo de confianca:

c1 < X2 < c2 ⇔ χα/2 < X2 < χ1−α/2 ⇔ χα/2 <(n− 1)S2

σ2< χ1−α/2 ⇔

χα/2

(n − 1)S2<

1

σ2<

χ1−α/2

(n− 1)S2⇔ (n− 1)S2

χ1−α/2< σ2 <

(n − 1)S2

χα/2(9.5.1)

• Assim,

IC(1−α)×100%(σ2) ≡

(

(n− 1)S2

χ1−α/2;(n− 1)S2

χα/2

)

Do resultado atras obtido, muito simplesmente se constroi o intervalo de confianca para o desviopadrao populacional σ, bastando extrair raızes em (9.5.1), resultando em:

IC(1−α)×100%(σ) ≡(√

(n− 1)S2

χ1−α/2;

(n− 1)S2

χα/2

)

Page 129: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 127

9.6 Exercıcios Propostos

9.1 Para avaliar o peso medio das macas produzidas por um determinado agricultor analisaram-se20 macas seleccionadas ao acaso da producao. Estas resultaram num peso medio de x = 320g.Assuma que os pesos das macas tem distribuicao Normal com desvio padrao σ = 20g.

(a) Construa um intervalo de confianca a 90% para a media do peso.

(b) Qual deve ser o tamanho da amostra de forma a que a amplitude do correspondente intervalode confianca a 90% para a media seja de 1g? E 5g? Comente.

9.2 A quantidade de combustıvel dispendido num percurso de Lisboa a Faro (em litros) e umavariavel aleatoria normal.

(a) Assuma que em 8 viagens Lisboa-Faro seleccionadas ao acaso se verificou um gasto medio decombustıvel de 36 litros e um desvio padrao de 10 litros. Construa intervalos de confiancapara a media a 90% e a 95% e compare-os.

(b) Assuma agora que foi em 50 viagens Lisboa-Faro, seleccionadas ao acaso, que se verificouum gasto medio de combustıvel de 36 litros e um desvio padrao de 10 litros. Construaintervalos de confianca para a media a 90% e a 95% e compare com os anteriores. Comente.

9.3 O nıvel de poluicao do ar de determinada cidade (medido em concentracao de monoxido decarbono no ar) distribui-se normalmente. Recolheram-se os seguintes valores da referida concen-tracao em 10 dias diferentes (em ppm): 0.09, 0.33, 0.01, 0.25, 0.20, 0.05, 0.03, 0.18, 0.13, 0.24.Com base nesta amostra determine um intervalo de confianca a 99% para a concentracao mediade monoxido de carbono na atmosfera.

9.4 A quantidade de gordura em 100g de carne de determinado tipo de vacas, medido em gramas,tem desvio padrao 8g. Qual deve ser o tamanho de uma amostra aleatoria a seleccionar de formaa que a amplitude de um intervalo de confianca a 95% para a gordura media por 100g de carneseja inferior a 2.5g? Refira eventuais pressupostos que teve de fazer.

9.5 Construa um intervalo de confianca a 95% para a temperatura media de uma determinada sala deespera, com base numa amostra de temperaturas recolhidas em 35 dias diferentes que resultaramnos valores x = 22.1oC e s = 3.2oC.

9.6 Estamos interessados no tempo medio de endurecimento, em minutos, de um novo tipo decimento. Para tal observamos uma amostra aleatoria de 50 tempos de endurecimento tendoverificado x = 10 min. e s = 2min.. Construa um intervalo de confianca a 99% para o referidotempo medio.

9.7 A tensao (MegaPascal) suportada por uma determinada barra de aco e uma variavel aleatoriacom desvio padrao igual a 30 MPa. Com base numa amostra aleatoria de n tensoes observadas,para as quais se verificou que

xi = 10000MPa, construiu-se um intervalo de confianca a 95%para a tensao media suportada, cujo extremo superior era de 208.3MPa. Determine o extremoinferior do referido intervalo e diga quanto vale o n, assumindo que n > 30.

9.8 O tempo medio (segundos) de reaccao de uma determinada raca de caes a um certo estımulotem interesse para um determinado treinador. Assim ele resolveu testar 32 caes escolhidosaleatoriamente tendo observado x = 1.2s e

(xi − x)2 = 15.5s2.

Page 130: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 128

(a) Construa um intervalo de confianca a 95% para o tempo medio de reaccao dos caes.

(b) Suponha que so se conseguiu obter uma amostra de 15 caes, tendo resultado em x = 1.1se∑

(xi − x)2 = 15.9s2. Construa, para este caso, um intervalo de confianca a 95% para otempo medio de reaccao dos caes, referindo eventuais pressupostos que tenha tido de fazer.

9.9 De forma a estimar o tempo medio de servico num pronto a comer (em minutos) observou-seuma amostra aleatoria de 35 servicos. Registaram-se os seguintes valores:

x = 1.3min e s = 0.22min.

Assumindo a normalidade dos tempos de servico, determine um intervalo de confianca a 95%para o tempo medio de servico.

9.10 Pretende-se construir um intervalo de confianca a 90% para a diferenca das medias de pontosobtidos por dois golfistas em determinado torneio. Sabe-se que as pontuacoes de ambos osgolfistas seguem distribuicoes Normais com desvios padrao de 3 e 5, respectivamente, para o1o e o 2o golfistas. Seleccionaram-se aleatoriamente 10 jogos do 1o golfista, tendo-se registadouma media de 36 pontos, e 15 jogos do 2o golfista, correspondendo a uma media de 30 pontos.Construa entao o referido intervalo de confianca. Comente.

9.11 O presidente da camara de Lisboa esta interessado em saber se os nıveis de poluicao atmosfericana cidade sao menores a noite do que de dia. Assim mediram-se as 16h da tarde, em 20 diasseleccionados ao acaso, as concentracoes de CO no ar (em ppm), tendo-se registado um valormedio de 0.25ppm. Seleccionaram-se ainda outros 25 dias ao acaso, tendo-se medido as 4h damanha as correspondentes concentracoes, resultando em uma media de 0.15ppm. Assumindo quea concentracao e CO se distribui Normalmente com desvio padrao de 0.05ppm durante a noitee 0.12ppm durante o dia, construa um intervalo de confianca para a diferenca das concentracoesmedias de CO de dia e a noite e comente.

9.12 Numa fabrica de embalagem de queijo em fatias seleccionaram-se aleatoriamente 100 embalagens,das quais se verificaram que 18 tinham peso inferior ao suposto - sendo por isso inadequadas.Construa um intervalo de confianca a 98%para a verdadeira proporcao de pacotes inadequadosna producao total.

9.13 De 200 casos de pessoas com cancro do colon, aleatoriamente detectadas, 12 morreram apos 5anos da deteccao.

(a) Estime pontualmente a probabilidade de uma pessoa que contraia o cancro do colon morrerapos 5 anos da sua deteccao.

(b) Quanto deveria aumentar ao tamanho da sua amostra aleatoria de forma a que a largurado intervalo de confianca a 90% para a probabilidade considerada na alınea anterior fosseinferior a 0.01?

9.14 O tempo (horas) que o Pedro dispende em filas de transito, por dia, e uma v.a. Normal.Seleccionando aleatoriamente 15 dias registaram-se os seguintes valores de espera:

1.5 1.0 1.0 2.0 1.5 1.25 1.0 2.0 1.5 1.25 1.75 0.5 1.0 1.5 1.25

Determine um intervalo de confianca a 99% para a variancia do tempo de espera.

9.15 Um profissional de bowling jogou 8 partidas num torneio, tendo obtido as seguintes pontuacoes:

117.0 220.2 199.5 237.2 249.5 179.8 259.2 248.5

Page 131: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 129

Admitindo a normalidade das pontuacoes, construa um intervalo de confianca a 95% para avariancia e para o desvio padrao (este ultimo fornece uma medida da consistencia da prestacaodo jogador).

9.16 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

Seja (X1, . . . ,Xn) uma amostra aleatoria de uma populacao X ∼ N(µ, 1). Entao X−µ1/

√ne uma

variavel pivot.

9.17 A cotacao das accoes ”Sobe-e-desce”ao fecho da bolsa, em e, segue uma distribuicao Normal,de variancia 1e. Seleccionaram-se ao acaso 15 dias para os quais se contabilizou uma media dascotacoes destas accoes, ao fecho da bolsa, de 9.5e.

(a) Estamos interessados em construir um intervalo de confianca a 88% para a verdadeiracotacao media destas accoes. Sugira uma estatıstica pivot para tal, indicando qual a suadistribuicao por amostragem.

(b) Usando a estatıstica pivot indicada na alınea anterior, construa um intervalo de confiancaa 88% para a verdadeira cotacao media destas accoes.

(c) Qual deveria ser o tamanho da amostra a considerar de forma a que a amplitude do intervalode confianca a 88% para a cotacao media destas accoes fosse metade do valor obtido naalınea anterior? Comente.

9.18 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Na estimacao intervalar da media populacional µ, aumentando o tamanho da amostra fazcom que o intervalo de confianca fique mais estreito.

(b) Esta-se interessado em construir um intervalo de confianca a 90% para o nıvel medio de clorona piscina municipal do Xeisal. Sabe-se que este nıvel (em ppm) segue uma distribuicaonormal com desvio padrao 0.1ppm. Para que o referido intervalo de confianca tenha umaamplitude inferior a 0.01ppm, deve-se recolher uma amostra aleatoria de pelo menos 1000medicoes do nıvel de cloro nas aguas da dita piscina.

(Exercıcio de exame)

9.19 Queremos estudar ha quanto tempo residem nas suas moradas actuais as pessoas de certa cidadena provıncia. Uma amostra aleatoria de 41 famılias revelou uma media de 35 meses de residenciae um desvio padrao de 6.3 meses.

(a) Qual a sua melhor estimativa do tempo medio de residencia da populacao desta cidade?

(b) Deduza um intervalo de confianca a 98% para o verdadeiro tempo medio de residencia.Justifique o seu procedimento.

(c) Empregue o intervalo de confianca encontrado na alınea anterior numa frase com significado(estatıstico).

(d) Indique uma forma de aumentar a precisao da estimacao que fez por intervalo de confiancapara a media. Justifique.

(e) Deduza um intervalo de confianca a 90% para o desvio padrao do tempo de residencia daspessoas nesta cidade. Indique eventuais pressupostos que tenha de fazer.

(Exercıcio de exame)

Page 132: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 130

9.20 A populacao de Sobriga queixa-se da qualidade da agua em determinado lago, tendo chamadoas autoridades competentes para averiguarem o caso. O Dr. T. Esta dirigiu-se ao lago, tendorecolhido a seguinte amostra de 6 medicoes de percentagens de toxicidade na agua:

1% 3% 2% 1% 0.5% 1.5%

Percentagens de toxicidade superiores a 1% indicam aguas contaminadas.

(a) Estime pontualmente a media da percentagem de toxicidade destas aguas e a sua variancia.

(b) Assumindo que a variavel aleatoria percentagem de toxicidade nas aguas deste lago segueuma distribuicao normal, deduza e determine um intervalo de confianca a 95% para acorrespondente percentagem de toxicidade media. Comente o resultado face a gravidadedo problema.

(c) Qual o tamanho da amostra que o Dr. T. Esta deveria ter recolhido de forma a que aamplitude do intervalo construıdo na alınea anterior fosse inferior a 0.2%? Refira eventuaispressupostos que tenha de efectuar.

(Exercıcio de exame)

Page 133: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 10

Testes de Hipoteses

Como ja referido anteriormente, a disciplina da estatıstica engloba dois grandes objectivos - a estimacaoe o teste de hipoteses estatısticas. Muitas vezes mais do que estimar um parametro populacionalqueremos compara-lo com algum valor de referencia, de forma a posteriormente podermos decidir emconformidade. Tal e feito atraves de testes de hipoteses, baseados em amostras aleatorias retiradas dapopulacao. Neste capıtulo iremos desenvolver metodos genericos para o levar a cabo e aplicamo-los aalguns problemas comuns.

10.1 Testes de Hipoteses

Antes de mais comecamos por introduzir alguma linguagem e notacao.

Definicao 10.1 (Hipotese Estatıstica) Uma hipotese estatıstica e uma conjectura acerca da dis-tribuicao de uma ou mais variaveis aleatorias. Se a hipotese estatıstica especifica completamente adistribuicao e chamada de hipotese simples. Caso contrario e chamada de hipotese composta.Para cada hipotese que se faca, designada por hipotese nula e denotada por H0, ha sempre uma outrahipotese, designada por hipotese alternativa e denotada por H1, que representa frequentemente ocontrario da anterior. A ideia usual e que se a hipotese nula e falsa a alternativa e verdadeira evice-versa.

Exemplo 10.1 Seja (X1, . . . ,Xn) uma amostra aleatoria da populacao dos pesos das formigas Solenop-sis anteriormente considerada, i.e. da populacao X ∼ N(µ, 22).

A hipotese estatıstica de que o peso medio desta populacao toma o valor 8dg denota-se por:

H0 : µ = 8 versus H1 6= 8

E usual abreviar a palavra ”versus”para ”vs”:

H0 : µ = 8 vs H1 6= 8

Esta e uma hipotese simples.A hipotese estatıstica de que o peso medio desta populacao e menor ou igual a 8dg denota-se por:

H0 : µ ≤ 8 vs H1 > 8

131

Page 134: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 132

Esta e uma hipotese composta.2

Definicao 10.2 (Teste de uma hipotese estatıstica) Um teste de uma hipotese estatıstica H0 euma regra para decidir se se deve rejeitar H0. Se H0 nao e rejeitada dizemos que e aceite.

Exemplo 10.2 Seja (X1, . . . ,Xn) uma amostra aleatoria da populacao dos pesos das formigas Solenop-sis, i.e. da populacao X ∼ N(µ, 22). Um teste possıvel para testar:

H0 : µ ≤ 8 vs H1 > 8,

e:

Rejeitar H0 seX − 8

2/√n

> 1.64

2

De acordo com a maneira de pensar na definicao anterior somos levados a cometer dois tipos deerros:

Definicao 10.3 (Erros do tipo I e do tipo II) A rejeicao de uma hipotese H0 quando ela everdadeira e chamado erro do tipo I e a aceitacao da hipotese H0 quando esta e falsa e chamado errodo tipo II. As suas probabilidades:

α = P (erro tipo I) = P (rejeitar H0|H0 e verdadeira)

β = P (erro tipo II) = P (aceitar H0|H0 e falso)

chamamos ainda nıvel de significancia a α e potencia do teste a 1− β .

Nota: Um teste optimo tera as duas probabilidades de erro atras definidas muito pequenas. Contudoe matematicamente impossıvel minimiza-las em simultaneo, ja que crescem geralmente no sentidoinverso. Na pratica realizamos os chamados testes de significancia, i.e., testes onde nos e quefixamos o nıvel de significancia e para os quais a funcao potencia toma o valor maximo. Os valoreshabitualmente escolhidos sao α = 0.01, α = 0.05 ou α = 0.10.

O objectivo de um teste estatıstico de uma hipotese nao e determinar se a hipotese e verdadeiraou nao, mas antes determinar se a sua validade e consistente com os dados observados numa amostrada populacao. Com este objectivo parece razoavel que a hipotese so deva ser rejeitada se os dadosobservados forem muito pouco provaveis quando a hipotese e verdadeira.

Descrevemos de seguida o procedimento usual para a construcao de um teste de hipoteses generico:

Procedimento 10.1 Suponhamos que estamos interessados em testar a hipotese de que determinadoparametro populacional θ pertence a um certo intervalo de valores de interesse Iθ, i.e.:

H0 : θ ∈ Iθ vs H1 : θ /∈ Iθ

Page 135: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 133

X A abordagem comum passa pela escolha de um estimador de θ, T (X1, . . . ,Xn), onde (X1, . . . ,Xn)e uma amostra aleatoria da populacao identificada pelo parametro θ.

X A hipotese e rejeitada se T (X1, . . . ,Xn) estiver distante de Iθ, sendo este conceito de distanciadefinido com base na distribuicao por amostragem de T , quando H0 e verdadeira - resultandonuma regiao, chamada regiao de rejeicao do teste, dependente do valor do nıvel de sig-nificancia α escolhido.

Vamos de seguida aplicar este procedimento para levar a cabo alguns testes para hipoteses relativasa media populacional, a igualdade entre medias populacionais, a proporcao populacional, a varianciapopulacional e ainda ao pressuposto de normalidade de uma populacao.

10.2 Testes de hipoteses para a media populacional, µ

10.2.1 Populacao Normal(µ, σ2), σ2 conhecido

Suponhamos que observamos uma amostra aleatoria (X1, . . . ,Xn) de uma populacaoX ∼ N(µ, σ2),em que σ2 e conhecido. Vamos nesta seccao considerar 3 hipoteses diferentes respeitantes ao parametromedia populacional, µ.

Teste bilateral

X Estamos aqui interessados em testar a hipotese de que o parametro media populacional µ, dapopulacao acima definida, vale um determinado valor, µ0:

H0 : µ = µ0 vs H1 : µ 6= µ0

X Escolhamos um estimador de µ, que ja sabemos ser X , e consideremo-lo sob a validade dahipotese nula, para servir de estatıstica de teste. Conhecemos ja a sua distribuicao por amostragem:

Z =X − µ0

σ/√n

sob H0

∼ N(0, 1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado.Estamos interessados em rejeitar a hipotese nula quando os dados observados nao estiverem deacordo com ela, i.e. quando a diferenca entre X e µ0 for consideravelmente diferente de 0, ouseja, quando a estatıstica de teste atras definida estiver longe de 0 - ver figura.

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

Page 136: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 134

−c c0α/2α/2

X Defino agora a regra de decisao do teste: Rejeitar H0 ao nıvel de significancia α se o valorobservado da estatıstica do teste pertencer a regiao de rejeicao, i.e. se zobs =

x−µ0

σ/√n

∈ Rα.

Exemplo 10.3 Consideremos novamente o exemplo da populacao dos pesos das formigas Solenopsis,i.e. a populacao X ∼ N(µ, 22), da qual observamos a amostra aleatoria de 4 pesos (8, 13, 9, 8.5). Combase nesta amostra vamos testar, a um nıvel de significancia 5% (α = 0.05), a hipotese de que o pesomedio populacional µ vale 9dg:

• H0 : µ = 9 vs H1 : µ 6= 9

• Estatıstica de teste:

Z =X − 9

2/√4

sob H0

∼ N(0, 1)

• Regiao de rejeicao para α = 0.05:

R0.05 ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) = 0.975 ⇔ c = Φ−1 (0.975) = z1− 0.052

= z0.975 = 1.96

Entao R0.05 ≡ (−∞;−1.96) ∪ (1.96;+∞)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se zobs =x− 9

2/√4

∈ R0.05.

• Decisao:

zobs =9.625 − 9

2/√4

= 0.625 /∈ R0.05

Logo, nao rejeitar H0 ao nıvel de significancia 5%, significando que os dados nao vao contra opressuposto de que o peso medio das formigas e 9dg..

2

Page 137: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 135

Nota: Ha uma analogia directa entre a estimacao por intervalos de confianca e os testes de hipoteses.Os intervalos de confianca para a media que aprendemos, por exemplo, correspondem a regiao deaceitacao de um teste bilateral para esse mesmo parametro.

p-values:Neste teste bilateral para a media rejeitamos a hipotese nula H0, a um nıvel de significancia α, se

a estatıstica de teste nao cair na regiao de rejeicao, definida de acordo com o nıvel de significanciaescolhido. Isto e, rejeitamos H0 ao nıvel de significancia α se:

X − µ0

σ/√n

> z1−α2.

Tal pode ser visto de outra forma. Para qualquer valor observado da estatıstica de teste, digamoszobs, o teste conduz a rejeicao de H0 se a probabilidade de a estatıstica de teste ser, em modulo, maiorque o valor observado, supondo verdadeira a hipotese nula H0, for inferior ao nıvel de significanciaescolhido α.

Daqui segue que podemos escolher aceitar ou rejeitar H0 determinando primeiro o valor obser-vado da estatıstica de teste, depois determinando P (|Z| > |zobs| | H0) e finalmente comparando estaprobabilidade com o nıvel de significancia escolhido. Temos entao a seguinte definicao:

Definicao 10.4 (p-value de um teste) Para um teste estatıstico de uma hipotese nula H0 define-se p-value do teste como a probabilidade de se observarem valores da estatıstica de teste tao ou maisdesfavoraveis a H0 do que o observado, sob a validade desta hipotese. Representa-se este p-value porp.

Na situacao desta subseccao, de um teste bilateral para a media, com os pressupostos efectuados,o valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Exemplo 10.4 Recuperemos o exemplo 10.3. Vimos que zobs = 0.625 ' 0.63 pelo que o p-valueassociado ao teste aı realizado e dado por:

p = 2− 2Φ(|zobs|) = 2− 2Φ(|0.63|) = 2− 2Φ(0.63) = 2− 2× 0.7357 = 0.5286

Como o p-value e superior ao nıvel de significancia entao escolhido, 0.05, somos levados a naorejeitar a hipotese nula a este nıvel de significancia. Na verdade, podemos ate comparar com outrosnıveis de significancia, por exemplo 0.01 ou 0.10, e verificar que a esses nıveis tambem nao rejeitamosa hipotese nula.

O p-value sendo grande indica-nos que a probabilidade de observarmos valores tao ou mais desfa-voraveis a hipotese nula do que aquele que observamos, sob a validade da hipotese nula, e grande, peloque o valor observado e favoravel a hipotese nula.

2

Page 138: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 136

Teste unilateral direito

X Estamos agora interessados em testar a hipotese de que o parametro media populacional µ, deuma populacao X ∼ N(µ, σ2), e menor ou igual a um determinado valor µ0:

H0 : µ ≤ µ0 vs H1 : µ > µ0

Esta hipotese diz-se unilateral direita, reflectindo a desigualdade da hipotese alternativa e resul-tando num teste que toma o mesmo nome.

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

σ/√n

sob H0

∼ N(0, 1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado.Estamos interessados em rejeitar a hipotese nula quando os dados observados nao estiverem deacordo com ela, i.e. quando a diferenca entre X e µ0 for consideravelmente maior que zero, ouseja, quando a estatıstica de teste atras definida for tambem consideravelmente maior que zero- ver figura abaixo:

c0

α

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (c; +∞),

c : P (Z < c) = (1− α) ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (z1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

σ/√n

∈ Rα.

Page 139: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 137

p-value:Na situacao desta subseccao, de um teste unilateral direito para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z > zobs | H0) = 1− P (Z ≤ zobs | H0)

(Sob H0 Z tem distribuicao N(0, 1))

= 1− Φ(zobs).

Exemplo 10.5 Consideremos novamente o exemplo da populacao dos pesos das formigas Solenopsis,i.e. a populacao X ∼ N(µ, 22), da qual observamos a amostra aleatoria de 4 pesos (8, 13, 9, 8.5). Combase nesta amostra vamos testar, a um nıvel de significancia 5% (α = 0.05), a hipotese de o pesomedio populacional µ ser inferior ou igual a 7dg:

• H0 : µ ≤ 7 vs H1 : µ > 7

• Estatıstica de teste:

Z =X − 7

2/√4

sob H0

∼ N(0, 1)

• Regiao de rejeicao para α = 0.05:

R0.05 ≡ (c; +∞),

c : P (Z < c) = 0.95 ⇔ c = Φ−1 (0.95) = z0.95 = 1.64

Entao R0.05 ≡ (1.64;+∞)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se zobs =x− 7

2/√4

∈ R0.05.

• Decisao:

zobs =9.625 − 7

2/√4

= 2.625 ∈ R0.05

Logo, rejeitar H0 ao nıvel de significancia 5%, significando que os dados nao suportam que opeso medio das formigas seja inferior ou igual a 7dg.

Adicionalmente, calculemos o p-value do teste:

p = 1− Φ(zobs) = 1− Φ(2.63) = 1− 0.9957 = 0.0043

Como este valor do p-value e menor do que o nıvel de significancia escolhido, entao rejeitamos H0

a esse nıvel de significancia.2

Page 140: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 138

Teste unilateral esquerdo

X Finalmente estamos interessados em testar a hipotese de que o parametro media populacionalµ, de uma populacao X ∼ N(µ, σ2), e maior ou igual a um determinado valor, µ0:

H0 : µ ≥ µ0 vs H1 : µ < µ0

Esta hipotese diz-se unilateral esquerda, reflectindo a desigualdade da hipotese alternativa eresultando num teste que toma o mesmo nome.

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

σ/√n

sob H0

∼ N(0, 1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado.Estamos interessados em rejeitar a hipotese nula quando os dados observados nao estiverem deacordo com ela, i.e. quando a diferenca entre X e µ0 for consideravelmente menor que zero, ouseja, quando a estatıstica de teste atras definida for tambem consideravelmente menor que zero- ver figura abaixo:

−c 0

α

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (−∞,−c),

c : P (Z < −c) = α ⇔ P (Z > c) = α ⇔ 1− P (Z ≤ c) = α ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (−∞;−z1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

σ/√n

∈ Rα.

Page 141: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 139

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z < zobs | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= Φ(zobs).

10.2.2 Populacao Normal(µ, σ2), σ2 desconhecido

Suponhamos que observamos uma amostra aleatoria (X1, . . . ,Xn) de uma populacaoX ∼ N(µ, σ2),em que σ2 e desconhecido. Voltamos a considerar 3 hipoteses diferentes respeitantes ao parametromedia populacional, µ.

Teste bilateral

X Hipoteses:

H0 : µ = µ0 vs H1 : µ 6= µ0

X Estatıstica de teste:

T =X − µ0

S/√n

sob H0

∼ t(n−1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (T < c) =α

2+ (1− α) = 1− α

2⇔ c = F−1

t(n−1)

(

1− α

2

)

= t1−α2

Entao Rα ≡ (−∞;−t1−α2) ∪ (t1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se tobs =x− µ0

s/√n

∈ Rα.

Page 142: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 140

p-value:Na situacao desta subseccao, de um teste bilateral para a media, com os pressupostos efectuados, o

valor do p-value calcula-se da seguinte forma:

p = P (|T | > |tobs| | H0) = 1− P (|T | ≤ |tobs| | H0) = 1− P (−|tobs| ≤ T ≤ |tobs| | H0) =

= 1− P (T ≤ |tobs| | H0)− P (T < −|tobs| | H0) =

(Sob H0 T tem distribuicao t(n−1))

= 1− P (T ≤ |tobs| | H0)− P (T > |tobs| | H0) = 2− 2P (T ≤ |tobs| | H0) =

= 2− 2Ft(n−1)(|tobs|).

Teste unilateral direito

X Hipoteses:

H0 : µ ≤ µ0 vs H1 : µ > µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

T =X − µ0

S/√n

sob H0

∼ t(n−1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (c; +∞),

c : P (T < c) = (1− α) ⇔ c = F−1t(n−1)

(1− α) = t1−α

Entao Rα ≡ (t1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se tobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral direito para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (T > tobs | H0) = 1− P (T ≤ tobs | H0)

(Sob H0 Z tem distribuicao t(n−1))

= 1− Ft(n−1)(tobs).

Page 143: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 141

Teste unilateral esquerdo

X Hipoteses:

H0 : µ ≥ µ0 vs H1 : µ < µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

T =X − µ0

S/√n

sob H0

∼ t(n−1)

X Regiao de rejeicao do teste:

Rα ≡ (−∞;−c),

c : P (T < −c) = α ⇔ P (T > c) = α ⇔ 1− P (T ≤ c) = α ⇔ c = F−1t(n−1)

(1− α) = t1−α

Entao Rα ≡ (−∞;−t1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se tobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (T < tobs | H0) =

(Sob H0 T tem distribuicao t(n−1))

= Ft(n−1)(tobs).

10.2.3 Populacao Normal(µ, σ2), σ2 desconhecido, n > 30

Suponhamos que observamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), de umapopulacao X ∼ N(µ, σ2), em que σ2 e desconhecido. Voltamos a considerar 3 hipoteses diferentesrespeitantes ao parametro media populacional, µ.

Teste bilateral

X Hipoteses:

H0 : µ = µ0 vs H1 : µ 6= µ0

Page 144: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 142

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste bilateral para a media, com os pressupostos efectuados, o

valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Teste unilateral direito

X Hipoteses:

H0 : µ ≤ µ0 vs H1 : µ > µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

Page 145: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 143

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (c; +∞),

c : P (Z < c) = (1− α) ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (z1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral direito para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z > zobs | H0) = 1− P (Z ≤ zobs | H0)

(Sob H0 Z tem distribuicao N(0, 1))

= 1− Φ(zobs).

Teste unilateral esquerdo

X Hipoteses:

H0 : µ ≥ µ0 vs H1 : µ < µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste:

Rα ≡ (−∞;−c),

c : P (Z < −c) = α ⇔ P (Z > c) = α ⇔ 1− P (Z ≤ c) = α ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (−∞;−z1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

Page 146: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 144

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z < zobs | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= Φ(zobs).

10.2.4 Populacao desconhecida com σ2 conhecido e n > 30

Suponhamos que observamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), de umapopulacao X com distribuicao desconhecida, mas com variancia σ2 conhecida. Voltamos a considerar3 hipoteses diferentes respeitantes ao parametro media populacional, µ.

Teste bilateral

X Hipoteses:

H0 : µ = µ0 vs H1 : µ 6= µ0

X Estatıstica de teste:

Z =X − µ0

σ/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

σ/√n

∈ Rα.

Page 147: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 145

p-value:Na situacao desta subseccao, de um teste bilateral para a media, com os pressupostos efectuados, o

valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Teste unilateral direito

X Hipoteses:

H0 : µ ≤ µ0 vs H1 : µ > µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

σ/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (c; +∞),

c : P (Z < c) = (1− α) ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (z1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

σ/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral direito para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z > zobs | H0) = 1− P (Z ≤ zobs | H0)

(Sob H0 Z tem distribuicao N(0, 1))

= 1− Φ(zobs).

Page 148: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 146

Teste unilateral esquerdo

X Hipoteses:

H0 : µ ≥ µ0 vs H1 : µ < µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

σ/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste:

Rα ≡ (−∞;−c),

c : P (Z < −c) = α ⇔ P (Z > c) = α ⇔ 1− P (Z ≤ c) = α ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (−∞;−z1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

σ/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z < zobs | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= Φ(zobs).

10.2.5 Populacao desconhecida com σ2 desconhecido e n > 30

Suponhamos que observamos uma amostra aleatoria de dimensao n > 30, (X1, . . . ,Xn), de umapopulacao X com distribuicao desconhecida, com variancia σ2 desconhecida. Voltamos a considerar3 hipoteses diferentes respeitantes ao parametro media populacional, µ.

Teste bilateral

X Hipoteses:

H0 : µ = µ0 vs H1 : µ 6= µ0

Page 149: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 147

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste bilateral para a media, com os pressupostos efectuados, o

valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Teste unilateral direito

X Hipoteses:

H0 : µ ≤ µ0 vs H1 : µ > µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

Page 150: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 148

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (c; +∞),

c : P (Z < c) = (1− α) ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (z1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral direito para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z > zobs | H0) = 1− P (Z ≤ zobs | H0)

(Sob H0 Z tem distribuicao N(0, 1))

= 1− Φ(zobs).

Teste unilateral esquerdo

X Hipoteses:

H0 : µ ≥ µ0 vs H1 : µ < µ0

Nota: Repare que o valor µ0 pertence a hipotese nula.

X Estatıstica de teste:

Z =X − µ0

S/√n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste:

Rα ≡ (−∞;−c),

c : P (Z < −c) = α ⇔ P (Z > c) = α ⇔ 1− P (Z ≤ c) = α ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (−∞;−z1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =x− µ0

s/√n

∈ Rα.

Page 151: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 149

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a media, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z < zobs | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= Φ(zobs).

10.3 Teste de hipoteses para a igualdade entre medias populacionais,

µ1 = µ2, de populacoes Normais com variancias conhecidas

Nesta seccao vamos considerar que temos duas populacoes independentes e Normais de varianciasconhecidas, respectivamente X1 ∼ N(µ1, σ

21) e X2 ∼ N(µ2, σ

22), com σ2

1 e σ22 conhecidas.

Estamos interessados em testar se as medias das duas populacoes sao iguais. Para tal recolhemosuma amostra aleatoria de dimensao n1 da primeira populacao, resultando numa media amostral X1,e seleccionamos tambem uma amostra aleatoria de dimensao n2 da segunda populacao, resultandonuma media amostral X2.

Estamos entao interessados em executar o seguinte teste bilateral:X

H0 : µ1 = µ2 vs H1 : µ1 6= µ2

⇔H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 6= 0

X A estatıstica de teste e baseada no estimador de µ1 − µ2, X1 − X2:

Z =(X1 − X2)− (µ1 − µ2)0

σ21

n1+

σ22

n2

=(X1 − X2)− 0√

σ21

n1+

σ22

n2

sob H0

∼ N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado, denotada por Rα:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

X Regra de decisao do teste: Rejeitar H0 ao nıvel de significancia α se o valor observado daestatıstica do teste pertencer a regiao de rejeicao:

Rejeitar H0 ao nıvel de significancia α se zobs =(x1 − x2)√

σ21

n1+

σ22

n2

∈ Rα.

Page 152: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 150

p-value:Na situacao desta subseccao, de um teste bilateral para a diferenca de medias, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Exemplo 10.6 Um professor lecciona Probabilidades e Estatıstica em duas faculdades distintas (A eB) e esta interessado em avaliar se ha diferenca entre as notas medias dos alunos das duas escolas.Assuma que as notas dos alunos da faculdade A nesta cadeira, XA, tem uma distribuicao Normal commedia desconhecida µA e desvio padrao σA = 1.5valores, e que as notas dos alunos da faculdade B,XB, tem tambem distribuicao Normal com media desconhecida µB e desvio padrao σB = 2 valores:

XA ∼ N(µA, 1.52) XB ∼ N(µB , 2

2)

Com este proposito seleccionou uma amostra aleatoria de dimensao 15 dos seus alunos na facul-dade A, correspondendo a uma media de notas de 12.7valores. Seleccionou ainda uma outra amostraaleatoria de dimensao 16 dos seus alunos na faculdade B, tendo obtido uma media amostral de 11.6valores.

Seguidamente levou a cabo o seguinte teste de hipoteses:

• H0 : µA − µB = 0 vs H1 : µA − µB 6= 0

• Estatıstica de teste:

Z =(XA − XB)− 0√

σ2A

nA+

σ2B

nB

sob H0

∼ N(0, 1)

• Regiao de rejeicao para α = 0.05:

R0.05 ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) = 0.975 ⇔ c = Φ−1 (0.975) = z1− 0.052

= z0.975 = 1.96

Entao R0.05 ≡ (−∞;−1.96) ∪ (1.96;+∞)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se zobs =(xA − xB)− 0√

σ2A

nA+

σ2B

nB

∈ R0.05.

Page 153: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 151

• Decisao:

zobs =12.7 − 11.6√

1.52

15 + 22

16

' 1.74 /∈ R0.05

Logo, nao rejeitar H0 ao nıvel de significancia 5%, indicando nao haver diferenca na performancemedia dos alunos das duas faculdades.

Nota: Repare que se escolhessemos um nıvel de significancia de α = 0.10, a regiao de rejeicaoresultante seria:

R0.10 ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) = 0.95 ⇔ c = Φ−1 (0.95) = z1− 0.102

= z0.95 = 1.64

Entao R0.10 ≡ (−∞;−1.64) ∪ (1.64;+∞)

Consequentemente, como zobs ∈ R0.10, eu teria de rejeitar H0 ao nıvel de significancia 10%, apesarde nao a rejeitar ao nıvel de significancia 5%.

Alternativamente poderıamos querer tomar a nossa decisao com base no p-value do teste. Vimosatras que zobs = 1.74. O p-value associado a este teste e dado por:

p = P (|Z| > |zobs| | H0) = 2− 2Φ(|zobs|) = 2− 2Φ(|1.74|) = 2− 2Φ(1.74) = 2− 2× 0.9594 = 0.0812

Como o p-value e superior ao nıvel de significancia de 5%, somos levados a nao rejeitar a hipotesenula a este nıvel de significancia. No entanto, comparando com o nıvel de significancia de 10% somoslevados a rejeitar esta hipotese nula a esse nıvel.

2

10.4 Testes de hipoteses para a proporcao p de uma populacao

Suponhamos que observamos uma amostra aleatoria de dimensao n de uma populacao, em quedeterminada proporcao desconhecida p dos seus elementos possui certa caracterıstica. Consideramos3 hipoteses diferentes respeitantes ao parametro proporcao populacional, p.

Teste bilateral

X Hipoteses:

H0 : p = p0 vs H1 : p 6= p0

Page 154: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 152

X Estatıstica de teste:

Z =P − p0

p0(1− p0)/n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (Z < c) =α

2+ (1− α) = 1− α

2⇔ c = Φ−1

(

1− α

2

)

= z1−α2

Entao Rα ≡ (−∞;−z1−α2) ∪ (z1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =P − p0

p0(1− p0)/n∈ Rα.

p-value:Na situacao desta subseccao, de um teste bilateral para a proporcao, com os pressupostos efectuados,

o valor do p-value calcula-se da seguinte forma:

p = P (|Z| > |zobs| | H0) = 1− P (|Z| ≤ |zobs| | H0) = 1− P (−|zobs| ≤ Z ≤ |zobs| | H0) =

= 1− P (Z ≤ |zobs| | H0)− P (Z < −|zobs| | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= 1− P (Z ≤ |zobs| | H0)− P (Z > |zobs| | H0) = 2− 2P (Z ≤ |zobs| | H0) =

= 2− 2Φ(|zobs|).

Teste unilateral direito

X Hipoteses:

H0 : p ≤ p0 vs H1 : p > p0

Nota: Repare que o valor p0 pertence a hipotese nula.

X Estatıstica de teste:

Z =P − p0

p0(1− p0)/n

a

∼sob H0

N(0, 1)

Page 155: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 153

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (c; +∞),

c : P (Z < c) = (1− α) ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (z1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =P − p0

p0(1− p0)/n∈ Rα.

p-value:Na situacao desta subseccao, de um teste unilateral direito para a proporcao, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z > zobs | H0) = 1− P (Z ≤ zobs | H0)

(Sob H0 Z tem distribuicao N(0, 1))

= 1− Φ(zobs).

Teste unilateral esquerdo

X Hipoteses:

H0 : p ≥ p0 vs H1 : p < p0

Nota: Repare que o valor p0 pertence a hipotese nula.

X Estatıstica de teste:

Z =P − p0

p0(1− p0)/n

a

∼sob H0

N(0, 1)

X Regiao de rejeicao do teste:

Rα ≡ (−∞;−c),

c : P (Z < −c) = α ⇔ P (Z > c) = α ⇔ 1− P (Z ≤ c) = α ⇔ c = Φ−1 (1− α) = z1−α

Entao Rα ≡ (−∞;−z1−α)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se zobs =P − p0

p0(1− p0)/n∈ Rα.

Page 156: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 154

p-value:Na situacao desta subseccao, de um teste unilateral esquerdo para a proporcao, com os pressupostos

efectuados, o valor do p-value calcula-se da seguinte forma:

p = P (Z < zobs | H0) =

(Sob H0 Z tem distribuicao N(0, 1))

= Φ(zobs).

Exemplo 10.7 Numa sondagem polıtica seleccionaram-se aleatoriamente 1000 eleitores, dos quais125 responderam que no proximo acto eleitoral nao iriam votar. Com base nesta amostra, vamostestar a hipotese da proporcao de abstencao na populacao ser inferior a 15%, usando um nıvel designificancia de 5%.

• H0 : p ≥ 0.15 vs H1 : p < 0.15

• Estatıstica de teste:

Z =P − 0.15

0.15(1 − 0.15)/n

a

∼sob H0

N(0, 1)

• Regiao de rejeicao para α = 0.05:

R0.05 ≡ (−∞;−c),

c : P (Z < −c) = 0.05 ⇔ 1− P (Z ≤ c) = 0.05 ⇔ Φ−1 (0.95) = 1.64

Entao R0.05 ≡ (−∞;−1.64)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se zobs =P − 0.15

0.15(1 − 0.15)/n∈ R0.05.

• Decisao:

zobs =1251000 − 0.15

0.15 (1− 0.15) /1000' −2.21 ∈ R0.05

Logo, rejeitar H0 ao nıvel de significancia 5%, indicando haver evidencias que a abstencao sejainferior a 15%.

Alternativamente poderıamos querer tomar a nossa decisao com base no p-value do teste. Vimosatras que zobs = −2.21. O p-value associado a este teste e dado por:

p = P (Z < −2.21 | H0) = P (Z > 2.21 | H0) = 1−Φ(2.21) = 1− 0.9864 = 0.0136

Como o p-value e inferior ao nıveis de significancia de 5% e 10% somos levados a rejeitar estahipotese nula a estes nıveis (nao se rejeitando contudo ao nıvel de significancia 1%).

2

Page 157: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 155

10.5 Testes de hipoteses para a variancia σ2 de uma populacao Nor-mal com media desconhecida

Suponhamos que observamos uma amostra aleatoria (X1, . . . ,Xn) de uma populacaoX ∼ N(µ, σ2),em que µ e desconhecido. Vamos nesta seccao considerar 3 hipoteses diferentes respeitantes aoparametro variancia populacional, σ2.

Teste bilateral

X Testamos aqui a hipotese de que o parametro variancia populacional σ2, da populacao acimadefinida, vale σ2

0 :

H0 : σ2 = σ2

0 vs H1 : σ2 6= σ2

0

X Vamos escolher a estatıstica de teste com base no estimador de σ2, S2, variancia amostral:

X2 =(n − 1)S2

σ20

sob H0

∼ χ2(n−1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado. Vamosescolhe-la para valores muito grandes e muito pequenos da estatıstica de teste, indicadores deuma desproporcao entre as variancias amostrais e populacionais, nao condizente com a hipotesenula - ver figura seguinte.

c1 c2

α/2 α/2

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (0; c1) ∪ (c2; +∞),

c1 : P (X2 < c1) =α

2⇔ c1 = F−1

χ2(n−1)

2

)

= χα2

c2 : P (X2 < c2) = 1− α

2⇔ c2 = F−1

χ2(n−1)

(

1− α

2

)

= χ1−α2

Entao Rα ≡ (0;χα2) ∪ (χ1−α

2; +∞)

Page 158: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 156

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se x2obs =(n− 1)s2

σ20

∈ Rα.

Exemplo 10.8 Consideremos novamente o exemplo da populacao dos pesos das formigas Solenop-sis, i.e. a populacao X ∼ N(µ, σ2). Vamos testar a hipotese de que a variancia populacional σ2

efectivamente vale 22, com base na amostra aleatoria dos 4 pesos recolhida, (8, 13, 9, 8.5).

• H0 : σ2 = 22 vs H1 : σ

2 6= 22

• Estatıstica de teste:

X2 =(4 − 1)S2

22=

3S2

4

sob H0

∼ χ2(4−1) ≡ χ2

(3)

• Regiao de rejeicao para α = 0.05:

R0.05 ≡ (0; c1) ∪ (c2; +∞),

c1 : P (X2 < c1) =0.05

2= 0.025 ⇔ c1 = F−1

χ2(3)

(0.025) = 0.216

c2 : P (X2 < c2) = 1− 0.05

2= 0.975 ⇔ c2 = F−1

χ2(3)

(0.975) = 9.348

Entao Rα ≡ (0; 0.216) ∪ (9.348;+∞)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se x2obs = 3s2/4 ∈ R0.05.

• Decisao:

Sendo s2 =1

n− 1

n∑

i=1

x2i − nx2

=1

3

386.25 − 4× 9.6252

= 5.229167,

entao

xobs =3× 5.229167

4= 3.921875 /∈ R0.05

Logo, nao rejeitar H0 ao nıvel de significancia 5%, vindo entao os dados confirmar a validadedesta hipotese.

2

Page 159: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 157

Teste unilateral direito

X Testamos aqui a hipotese de que o parametro variancia populacional σ2, da populacao anteri-ormente definida, e inferior ou igual a σ2

0 :

H0 : σ2 ≤ σ2

0 vs H1 : σ2 > σ2

0

Nota: Repare que o valor σ20 pertence a hipotese nula.

X Estatıstica de teste:

X2 =(n − 1)S2

σ20

sob H0

∼ χ2(n−1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado. Vaicorresponder aos valores maiores da estatıstica de teste - ver figura seguinte.

c

α

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (c; +∞),

c : P (X2 < c) = 1− α ⇔ c = F−1χ2(n−1)

(1− α) = χ1−α

Entao Rα ≡ (χ1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se x2obs =(n− 1)s2

σ20

∈ Rα.

Page 160: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 158

Teste unilateral esquerdo

X Finalmente estamos interessados em testar a hipotese de que o parametro variancia populacionalσ2, da populacao anteriormente definida, e superior ou igual a σ2

0:

H0 : σ2 ≥ σ2

0 vs H1 : σ2 < σ2

0

Nota: Repare que o valor σ20 pertence a hipotese nula.

X Estatıstica de teste:

X2 =(n − 1)S2

σ20

sob H0

∼ χ2(n−1)

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado. Vaicorresponder aos valores menores da estatıstica de teste - ver figura seguinte.

c

α

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (0; c),

c : P (X2 < c) = α ⇔ c = F−1χ2(n−1)

(α) = χα

Entao Rα ≡ (0;χα)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se x2obs =(n− 1)s2

σ20

∈ Rα.

Page 161: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 159

10.6 Testes de hipoteses para o pressuposto da normalidade de uma

populacao

Temos usado em diversas situacoes o pressuposto de que a populacao X, de onde retiramos anossa amostra aleatoria (X1, . . . ,Xn), e Normalmente distribuıda. Nesta seccao usamos a amostrapara testar esse pressuposto da Normalidade populacional:

X Hipoteses:

H0 : X ∼ N(·, ·) vs H0 : X N(·, ·)

Observamos que o teste desta hipotese pode necessitar a estimacao dos parametros que identifi-cam a Normal, µ e σ2, caso nao se tenha ideia a partida de quanto estes devem valer.

Este teste faz parte da classe mais vasta dos testes de ajustamento do Qui-quadrado.

Os dados observados (a amostra) sao divididos em k classes, como aprendemos na fazer nocapıtulo da estatıstica descritiva. Em cada classe i consideramos o numero de observacoes quelhe correspondem (a frequencia absoluta de cada classe), denotando esse numero aqui por Oi.Consideramos ainda o numero de observacoes que esperarıamos observar em cada uma das classesse a hipotese nula fosse verdadeira, denotando-o por Ei. Este numero e determinado como n×pi,em que pi e a probabilidade de uma observacao pertencer a classe i, caso a hipotese nula sejaverdadeira:

pi = P (X ∈ classe i|H0 verdadeira)

Assim, estatıstica de teste avalia se o que eu observei na classe i, Oi, se encontra proximo doque eu esperaria observar nessa classe se a hipotese nula fosse verdadeira, Ei:

X Estatıstica de teste:

X2 =

k∑

i=1

(Oi− Ei)2

Ei

sob H0

∼ χ2(k−p−1)

O numero de graus de liberdade da distribuicao por amostragem da estatıstica anterior e dadopelo numero de classes em que os dados foram divididos, k, menos o numero de parametros quefoi necessario estimar, p (num maximo de 2, caso seja necessario estimar dos dados tanto µ comoσ2), menos 1.

Regra 10.1 Depois de determinados os Ei, se os houver inferiores a 5, tipicamente correspon-dendo as classes dos extremos, essas classes devem ser agrupadas ate o correspondente novonumero esperado Ei (dado pelas somas dos correspondentes antigos E′

is) ultrapassar 5. Os cor-respondentes Oi’s devem nesse caso ser tambem somados, diminuindo naturalmente o valor donumero de classes k.

Page 162: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 160

X Definamos a regiao de rejeicao do teste, para um nıvel de significancia α, pre-especificado. Estavai corresponder a valores grandes da estatıstica de teste, indicando que o que eu observei seencontra longe daquilo que eu esperaria observar, caso a hipotese nula fosse verdadeira.

Assim defino a regiao de rejeicao, denotando-a por Rα, como:

Rα ≡ (c,+∞),

c : P (X2 < c) = 1− α ⇔ c = F−1χ2(k−p−1)

(1− α) = χ1−α

Entao Rα ≡ (χ1−α; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se x2obs ∈ Rα.

Exemplo 10.9 Os artigos produzidos em determinada fabrica sao sujeitos a um controle de qualidade,resultando num ındice de qualidade, X. De forma a avaliar essa qualidade recolheu-se uma amostraaleatoria de 46 artigos da producao, tendo-se medido os valores seguintes do referido ındice:

(100,110,122,132,99,96,88,75,45,154,153,161,142,99,111,105,133,142,150,153,121,126,117,97,105,117,125,105,94,90,80,50,55,102,122,136,75,104,109,108,134,135,111,78,89,154)

Use estes dados para testar, ao nıvel de significancia 5%, a hipotese de que este ındice tem dis-tribuicao Normal.

• H0 : X ∼ N(·, ·) vs H1 : X N(·, ·)Como nao sabemos os valores populacionais de µ e σ2, vamos estima-los dos dados:

µ = x =1

46

46∑

i=1

xi = 111.0652;

σ2 = s2 =1

46− 1

(

46∑

i=1

x2i − 46× x2

)

= 785.3068

O proximo passo e a divisao dos dados em classes e a determinacao dos correspondentes Oi eEi. Pela regra de Sturges o numero de classes a considerar e dado por:

k ≈ 1 +log(n)

log(2)= 1 +

log(46)

log(2)≈ 6.523562

Consideramos entao k = 7 classes. Seguidamente definimos os extremos das classes. A ampli-tude dos dados e dada por:

L = max(dados)−min(dados) = 161− 45 = 116

Page 163: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 161

Entao a amplitude de cada classe deve ser dada por:

l =L

k=

116

7≈ 16.57

Vamos aproximar este valor a 20, um numero mais redondo, e considerar as classes:

]−∞; 60] ]60; 80] ]80; 100] ]100; 120] ]120; 140] ]140; 160] ]160;+∞[

Devemos contar quantas observacoes caiem em cada um dos intervalos anteriores, para obter osvalores de Oi, e devemos determinar os valores de Ei = n× pi = 46× pi:

p1 = P (X ∈ classe 1|H0 verdadeiro) = P (X ≤ 60|H0 verdadeiro) =

= P

(

X − 111.0652√785.3068

≤ 60− 111.0652√785.3068

)

= P (Z ≤ −1.82) = P (Z ≥ 1.82) =

= 1− Φ(1.82) = 1− 0.9656 = 0.0344 ⇒ E1 = 46× 0.0344 = 1.5824

p2 = P (X ∈ classe 2|H0 verdadeiro) = P (60 < X ≤ 80|H0 verdadeiro) =

= P

(

60− 111.0652√785.3068

< Z ≤ 80− 111.0652√785.3068

)

= P (Z ≤ −1.11)− P (Z < −1.82) =

= (1−Φ(1.11)) − (1− Φ(1.82)) = 0.9656 − 0.8665 = 0.0991

⇒ E2 = 46× 0.0991 = 4.5586

p3 = P (X ∈ classe 3|H0 verdadeiro) = P (80 < X ≤ 100|H0 verdadeiro) =

= P

(

80− 111.0652√785.3068

< Z ≤ 100 − 111.0652√785.3068

)

= P (Z ≤ −0.39) − P (Z < −1.11) =

= (1−Φ(0.39)) − (1− Φ(1.11)) = 0.8665 − 0.6517 = 0.2148

⇒ E3 = 46× 0.2148 = 9.8808

p4 = P (X ∈ classe 4|H0 verdadeiro) = P (100 < X ≤ 120|H0 verdadeiro) =

= P

(

100− 111.0652√785.3068

< Z ≤ 120 − 111.0652√785.3068

)

= P (Z ≤ 0.32) − P (Z < −0.39) =

= Φ(0.32) − (1− Φ(0.39)) = 0.6255 − (1− 0.6517) = 0.2772

⇒ E4 = 46× 0.2772 = 12.7512

Page 164: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 162

p5 = P (X ∈ classe 5|H0 verdadeiro) = P (120 < X ≤ 140|H0 verdadeiro) =

= P

(

120− 111.0652√785.3068

< Z ≤ 140 − 111.0652√785.3068

)

= P (Z ≤ 1.03) − P (Z < 0.32) =

= Φ(1.03) − Φ(0.32) = 0.8485 − 0.6255 = 0.223

⇒ E5 = 46× 0.223 = 10.258

p6 = P (X ∈ classe 6|H0 verdadeiro) = P (140 < X ≤ 160|H0 verdadeiro) =

= P

(

140− 111.0652√785.3068

< Z ≤ 160 − 111.0652√785.3068

)

= P (Z ≤ 1.75) − P (Z < 1.03) =

= Φ(1.75) − Φ(1.03) = 0.9599 − 0.8485 = 0.1114

⇒ E6 = 46× 0.1114 = 5.1244

p7 = 1− p1 − p2 − p3 − p4 − p5 − p6 =

= 1− 0.0344 − 0.0991 − 0.2148 − 0.2772 − 0.223 − 0.1114 = 0.0401

⇒ E7 = 46× 0.0401 = 1.8446

i Classe Oi pi Ei

1 ]−∞; 60] 3 0.0344 1.58242 ]60; 80] 4 0.0991 4.55863 ]80; 100] 9 0.2148 9.88084 ]100; 120] 12 0.2772 12.75125 ]120; 140] 10 0.223 10.2586 ]140; 160] 7 0.1114 5.12447 ]160;+∞[ 1 0.0401 1.8446

Como vemos as classes dos extremos tem Ei’s inferiores a 5. Como tal vamos aglutinar a classe1 com a classe 2 e a classe 7 com a classe 6, somando os correspondentes valores de E′

is e Oi’s:

i Classe Oi pi Ei

1 ]−∞; 80] 7 0.1335 6.1412 ]80; 100] 9 0.2148 9.88083 ]100; 120] 12 0.2772 12.75124 ]120; 140] 10 0.223 10.2585 ]140;+∞[ 8 0.1515 6.969

Passo entao a ter k = 5 classes. Nao nos esquecamos que tivemos de estimar p = 2 parametros,µ e σ2. Entao:

• Estatıstica de teste:

Page 165: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 163

X2 =

k∑

i=1

(Oi− Ei)2

Ei

sob H0

∼ χ2(k−p−1) ≡ χ2

(5−2−1) ≡ χ2(2)

• Definamos a regiao de rejeicao do teste, para o nıvel de significancia 5%, R0.05, como:

R0.05 ≡ (c,+∞),

c : P (X2 < c) = 1− 0.05 = 0.95 ⇔ c = F−1χ2(2)

(0.95) = χ0.95 = 5.991

Entao R0.05 ≡ (5.991,+∞)

• Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia 5% se x2obs ∈ Rα.

• Decisao:

x2 =5∑

k=1

(Oi − Ei)2

Ei=

(7− 6.141)2

6.141+

(9− 9.8808)2

9.8808+

+(12− 12.7512)2

12.7512+

(10− 10.258)2

10.258+

(8− 6.969)2

6.969= 0.4019 /∈ R0.05

Logo, ao nıvel de significancia 5% nao rejeitamos a hipotese nula de que a distribuicao da populacaoe Normal.

2

10.7 Exercıcios Propostos

10.1 Uma fabrica de gelados afirma que a procura do gelado de chocolate no verao, por dia e emeuros, e uma v.a. Normalmente distribuıda com valor medio 200e e desvio padrao 40e.

Numa amostra aleatoria constituıda por 10 dias seleccionados ao acaso do perıodo de veraoverificou-se que x = 216e.

(a) Teste, ao nıvel de significancia 5%, se de facto o consumo medio de gelado de chocolate noverao e de 200epor dia.

(b) Teste, ao ao nıvel de significancia 5%, se de facto o consumo medio de gelado de chocolateno verao e menor do que 200epor dia.

Page 166: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 164

10.2 Um produtor de azeite afirma que a acidez media do seu azeite e de 0.9o. De forma a confirmar talfacto recolheu-se uma amostra aleatoria da sua producao de azeite, tendo-se medido os seguintesvalores de acidez:

0.9 0.8 0.7 1.1 0.9 0.9 1.0 0.7 1.5 1.1

Admitindo a Normalidade da acidez do azeite:

(a) Teste, ao nıvel de significancia 1%, se o produtor tem razao.

(b) Teste, ao ao nıvel de significancia 1%, se a acidez media e superior a 0.9o.

10.3 Um biologo pretende demonstrar que o peso medio de uma determinada especie de coelhos -coelhos anoes - e superior a 250g. Para tal seleccionou aleatoriamente 40 coelhos, tendo obtidouma media dos pesos de 255.3g e um desvio padrao de 30g. Teste se o biologo esta certo,assumindo a Normalidade dos pesos dos coelhos (use o p-value do teste).

10.4 A Ines recebe, para alem do seu salario, vencimento correspondente a 2 horas extra que deviafazer todos os dias. Contudo ela esta desconfiada que tem andado a trabalhar, em media, maisdo que 2 horas extra. Como a empresa onde trabalha regista sempre a hora de entrada e de saıdados seus funcionarios, ela seleccionou aleatoriamente 12 dias de trabalho passados e registou osseguintes valores relativos ao horario extra: x = 2.3h e s = 0.5h. Admitindo a Normalidade dotempo extra de trabalho, teste se as suas suspeitas se confirmam.

10.5 Uma companhia de seguros tem previsto no seu orcamento um total de 5000e/dia para pagaros premios dos seus segurados. De forma a confirmar se o valor medio dos premios pagos por diaesta bem previsto seleccionaram-se, de anos anteriores, 100 dias, tendo-se verificado x = 5625ee∑

(xi − x)2 = 6187500e2. Teste, ao nıvel de significancia 5%, se a previsao se adequa.

10.6 Numa fabrica de massas embalam-se pacotes de esparguete que deveriam ter peso medio de 500g.O peso dos pacotes e uma v.a. Normal com variancia σ2 = 225g2. De forma a confirmar o pesomedio destes pacotes, seleccionaram-se ao acaso 40 embalagens que tinham um peso medio de495g. Teste se o peso medio das embalagens e menor do que as 500g indicadas.

10.7 Seja X uma v.a. com distribuicao Normal de valor medio µ e desvio padrao σ. A partir de umaamostra de dimensao 30, retirada da populacao, obtiveram-se os seguintes resultados:

30∑

i=1

xi = 64.030∑

i=1

(xi − x)2 = 84.4

(a) Teste, ao nıvel de significancia 1%, as hipoteses H0 : µ = 2 vs H1 : µ > 2.

(b) Suponha que esta a testar a hipotese H0 : µ = 2 contra a hipotese H1 : µ = 2.5 e querejeita a hipotese nula se X30 > 2.3. Calcule as probabilidades dos erros de 1a e 2a especiedo teste, se σ = 1.

10.8 De forma a poder comparar o desempenho de 2 corredores de Formula 1, seleccionaram-seao acaso 15 corridas onde ambos participaram, tendo-se registado as seguintes diferencas depontuacao entre os dois corredores (corredor 1 - corredor 2):

Page 167: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 165

−1 − 2 0 − 3 − 1 1 2 − 3 − 3 − 1 − 4 − 4 1 − 6 − 8

Teste se o corredor 2 e em media melhor do que o corredor 1. Assuma a Normalidade dasdiferencas de pontuacao (recorra ao p-value do teste).

10.9 De forma a comparar a longevidade dos homens com a das mulheres, seleccionaram-se ao acaso50 pares de irmaos, um de cada sexo, ja falecidos, tendo-se registado uma media de longevidadefeminina de 85 anos e uma media de longevidade masculina de 84 anos. Assuma que tantoa longevidade masculina, X1, como a longevidade feminina, X2, seguem distribuicoes Normaiscom desvios padrao de 4 anos e 2 anos, respectivamente.

Teste, ao nıvel de significancia 1%, se ha diferencas de longevidades medias.

10.10 Uma amostra de 10 peixes foi apanhada de um lago A e as concentracoes de chumbo nos peixesfoi medida (em partes por milhao):

11.5, 10.8, 11.6, 9.4, 12.4, 11.4, 12.2, 11.0, 10.6, 10.8

Apanharam-se tambem 8 peixes num outro lago B e mediram-se as correspondentes concen-tracoes de chumbo:

11.8, 12.6, 12.2, 12.5, 11.7, 12.1, 10.4, 12.6

Assumindo que as concentracoes de chumbo nos peixes, em ambos os lagos, seguem distribuicoesNormais com variancias 0.09 e 0.16 para os lagos A e B, respectivamente, pode afirmar que oslagos estao igualmente contaminados com o elemento chumbo?

10.11 Numa operacao stop da brigada de transito, de 120 camioes TIR que foram parados, 42 iam comexcesso de peso. Com base nesta amostra aleatoria, teste a hipotese de que a proporcao destetipo de camioes, que circulam nas nossas estradas em situacao ilegal, ultrapassa os 30%. Useum nıvel de significancia de 10%.

10.12 Determinada desordem genetica no sangue pode ser prevista com base num teste de sanguemuito simples. De forma a ter uma nocao da proporcao de pessoas que na populacao possamvir a ter esta desordem, testaram-se 100 pessoas, seleccionadas ao acaso, para as quais 14 testesderam positivo. Efectue um teste de hipoteses, usando o p-value do teste para concluir, sobre sepercentagem de pessoas com tal desordem e inferior a 10%.

10.13 No fabrico de parafusos admite-se, relativamente aos seus comprimentos, uma variabilidademaxima de 0.5mm2. Recolheu-se uma amostra aleatoria de 20 parafusos que se verificou terems2 = 0.3. Admitindo a Normalidade do comprimento dos parafusos, teste, ao nıvel de sig-nificancia de 5% se a especificacao sobre a variabilidade do comprimento dos parafusos esta aser respeitada.

10.14 Com base na amostra aleatoria seguinte, teste H0 : σ = 1.3 vs H1 : σ 6= 1.3, a um nıvel designificancia de 1%:

2.0 3.2 5.0 1.8 3.4 2.6

Page 168: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 166

10.15 A resistencia de um determinado metal e dito ter uma variabilidade inferior a 0.01 ohm2. Testeesta hipotese, a um nıvel de significancia 10%, usando a seguinte amostra aleatoria de resistenciasmedidas para este metal:

0.14, 0.138, 0.143, 0.142, 0.144, 0.137

10.16 Teste a um nıvel de significancia 5% que a seguinte amostra aleatoria provem de uma distribuicaoNormal(3, 22):

1.14, 3.11, 3.55, 2.81, 6.28, 1.61, 4.36, 0.90, 0.81, −0.18, 2.08, 2.68, 2.12,−0.33, 2.57,

3.55, 1.81, 2.56, 5.56, 2.46, 4.20, 1.63, 4.21, 4.85, 4.24, 3.98, 1.40, 3.00, 2.01, 3.31

10.17 Pensa-se que a altura a que os eucaliptos chegam aos 20 anos e uma v.a. Normal de media2m. Para o confirmar seleccionou-se uma amostra aleatoria de 30 eucaliptos, tendo observadoas seguintes alturas:

0.2, 0.8, 3.6, 1.0, 0.2, 4.3, 3.1, 0.4, 3.3, 3.1, 3.2, 5.3, 1.7, 0.2, 2.8, 0.4, 0.5, 3.0, 1.2, 4.2, 4.8,

3.4, 2.1, 2.5, 2.4, 2.1, 0.8, 3.5, 1.7, 1.3

Teste, ao nıvel de significancia 1%, a conjectura referida.

10.18 Pensa-se que a pressao arterial nos homens segue uma distribuicao Normal de valor medio 14 evariancia 1. De forma a confirmar se assim e recolheu-se uma amostra aleatoria de 28 valores detensao arterial, que se agruparam em classes no quadro abaixo. O que pode concluir a um nıvelde confianca de 10%?

i Classe Frequencia observada

1 ]−∞; 13.5] 42 ]13.5; 14] 73 ]14; 14.5] 84 ]14.5; 15] 55 ]15;+∞[ 4

10.19 A quantidade de lixo (toneladas) produzida no concelho do Xeisal, por dia, e uma variavelaleatoria com distribuicao normal. De forma a avaliar o que se passa no concelho em relacao aesta variavel seleccionaram-se 15 dias ao acaso para os quais se registaram as correspondentesquantidades de lixo produzidas, resultando numa media de x = 100100 toneladas e num desviopadrao amostral s = 1117 toneladas.

(a) Teste, ao nıvel de significancia de 1%, se a variancia desta quantidade de lixo e inferior a1000000 toneladas2. Justifique o procedimento empregue.

(b) Assumindo agora que σ = 1000 teste a hipotese de que a quantidade media de lixo por diae inferior a 100000 toneladas. Use um nıvel de significancia de 5%. Justifique.

(Exercıcio de exame)

10.20 Determinado produtor de vinho afirma que a graduacao media do seu vinho e de 13o - assumaque a graduacao segue uma distribuicao normal. Seleccionaram-se aleatoriamente 5 garrafas daproducao tendo-se medido as correspondentes graduacoes (em o): 13.4 13.5 13.6 13.6 13.4.

Page 169: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 167

(a) Teste a hipotese de a graduacao media deste vinho ser de facto 13o, ao nıvel de significancia5%. Justifique todos os passos empregues.

(b) Diga o que entende por nıvel de significancia de um teste de hipoteses.

(c) O pressuposto da normalidade atras considerado foi questionado por alguem. Assim recolheu-se nova amostra aleatoria de 33 garrafas de vinho, tendo-se medido as correspondentesgraduacoes, agrupadas em classes na tabela abaixo. Use estes dados para testar a hipotesede a graduacao de vinho seguir uma distribuicao normal de media µ = 13.5o e desvio padraoσ = 1o, a um nıvel de significancia de 10%. Justifique e comente.

i Classe Frequencia observada

1 ]−∞; 11.5] 52 ]11.5;12.5] 83 ]12.5;13.5] 94 ]13.5;14.5] 65 ]14.5;+∞[ 5

(Exercıcio de exame)

10.21 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Se, com base numa determinada amostra, certa hipotese H0 for rejeitada a um nıvel designificancia 5% entao tambem o sera a um nıvel de significancia 10%.

(b) Suponha que para determinada media populacional µ conduzimos um teste de hipotesespara H0 : µ = 0.5 vs H1 : µ 6= 0.5 e que rejeitamos esta hipotese nula com um nıvel designificancia de 5%. Entao e impossıvel que a verdadeira media µ seja 0.5.

(c) O Teorema Limite Central e util quando se pretende fazer um teste de hipoteses sobreproporcoes.

(d) O nıvel de significancia de um teste e a probabilidade de a hipotese nula ser falsa.

(e) Pretendemos testar a hipotese nula de que determinado conjunto de dados provem de umapopulacao com distribuicao Normal. Assim, depois de dividirmos os dados em classes,contamos quantos dos elementos da amostra caem em cada uma dessas classes. A ideia doteste que vamos efectuar e entao comparar os valores observados com os que esperarıamosobservar, caso a hipotese nula fosse verdade. O numero esperado de casos para cada classee calculado pesando a dimensao da amostra pela correspondente proporcao de elementosque na referida populacao Normal se encontram nessa classe.

(f) Se o numero de observacoes numa amostra for aumentado de n para 2n entao o nıvel designificancia α de um teste de hipoteses para a media populacional, conduzido com basenessa amostra, diminui.

(Exercıcio de exame)

10.22 Pensa-se que a idade (em anos) dos indivıduos de determinada cidade segue uma distribuicaoNormal(45, 202). Para se confirmar esta suposicao seleccionou-se uma amostra aleatoria de 30indivıduos dessa cidade, tendo-se registado as respectivas idades e agrupado os elementos daamostra na seguinte tabela de frequencias:

Classes ≤15 ]15,30] ]30,45] ]45,60] >60

Idades 2 5 7 8 8

Page 170: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 168

Teste, ao nıvel de significancia de 5%, a conjectura referida.

(Exercıcio de exame)

Page 171: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 11

Regressao Linear Simples

Em muitos problemas praticos temos interesse em estabelecer relacoes entre certas variaveis. Pense-se,por exemplo, que os resultados de muitas reaccoes quımicas dependem da temperatura a que se daoas referidas reaccoes ou que a qualidade de um cimento depende da quantidade e qualidade da areiausada na sua confeccao. O conhecimento das relacoes entre as varias variaveis permite-nos predizer ovalor de umas variaveis em funcao das outras.

11.1 Regressao Linear Simples

Vamos estar aqui apenas interessados no caso em que temos uma unica variavel dita resposta oudependente, Y , que queremos ver explicada ou modelada por uma outra variavel dita explicativaou independente, x, atraves de uma relacao linear:

Y = β0 + β1 x

Sendo as variaveis Y e x relacionadas pela equacao anterior, conhecidos os valores de β0 e β1,podemos prever o valor de Y para qualquer valor de x. Contudo, na pratica, a equacao anterior evalida a menos de algumas flutuacoes aleatorias:

Y = β0 + β1 x+ ε, ε ∼ N(0, σ2)

Ao termo ε chamamos erro aleatorio e assumimos que tem distribuicao normal com media nula.Aos parametros β0 e β1 chamamos parametros da regressao. A este modelo designamos pormodelo de regressao linear simples. Os parametros de regressao, bem como a variancia do erroσ2, sao usualmente estimados dos dados. Note-se que, assumindo independencia entre os erros ε e avariavel explicativa x:

• E [Y |x] = E [β0 + β1 x+ ε|x] = β0 + β1 x+ E [ε] = β0 + β1 x+ 0 = β0 + β1 x

• V[Y |x] = V[β0 + β1 x+ ε|x] = V[ε] = σ2

• Y |x ∼ N(β0 + β1 x, σ2)

Observamos que o modelo de regressao linear simples pode tornar-se mais complexo, se houvernecessidade de incluir mais variaveis independentes no modelo. Por exemplo, o resultado de uma

169

Page 172: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 170

reaccao quımica pode nao depender apenas da temperatura mas tambem da pressao. Um modelo deregressao linear que inclui mais de uma variavel independente designa-se por modelo de regressaolinear multipla.

11.2 Estimadores dos Mınimos Quadrados dos Parametros de Regressao

Suponha que se observam um conjunto de n valores da variavel resposta Y - (Y1, . . . , Yn) - corres-pondendo aos valores de uma variavel independente x - (x1, . . . , xn) - e que se pretendem usar estesvalores para estimar os parametros de regressao de um modelo de regressao linear simples. Assumimosque os erros aleatorios εi, para cada elemento amostral Yi, sao independentes seguindo todos a mesmadistribuicao N(0, σ2) atras apresentada:

Yi = β0 + β1 xi + εi, εi ∼ N(0, σ2) independentes

Estamos interessados em determinar estimadores β0 de β0 e β1 de β1, de forma a obter a variavelresposta estimada Yi = β0 + β1 xi, para cada valor observado xi da variavel independente. Sendo Yi

a resposta observada, comecamos por considerar a soma dos quadrados que mede a distancia entre oobservado Yi e o estimado Yi:

SQ =n∑

i=1

(Yi − β0 − β1 xi)2

Usamos esta soma para, a partir dos dados, encontrar os referidos estimadores de β0 e β1. Tal econseguido minimizando a soma anterior com respeito a β0 e a β1, e por isso os estimadores resultantesdesignam-se por estimadores dos mınimos quadrados:

∂ SQ

∂β0= 0

∂ SQ

∂β1= 0

−2∑n

i=1(Yi − β0 − β1 xi) = 0

−2∑n

i=1 xi(Yi − β0 − β1 xi) = 0

∑ni=1 Yi = nβ0 + β1

∑ni=1 xi

∑ni=1 xiYi = β0

∑ni=1 xi + β1

∑ni=1 x

2i

(

Sendo Y =

∑ni=1 Yi

ne x =

∑ni=1 xin

)

Y = β0 + β1x

∑ni=1 xiYi = nβ0x+ β1

∑ni=1 x

2i

β0 = Y − β1x

∑ni=1 xiYi = nxY − nx2β1 + β1

∑ni=1 x

2i

β0 = Y − β1x

β1(∑n

i=1 x2i − nx2

)

=∑n

i=1 xiYi − nxY

β0 = Y − β1x

β1 =∑n

i=1 xiYi−nxY∑n

i=1 x2i−nx2

β0 = Y − β1x

β1 =SxYSxx

,

Page 173: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 171

sendo SxY =n∑

i=1

xiYi − nxY =n∑

i=1

(xi − x)(Yi − Y ) e Sxx =n∑

i=1

x2i − nx2 =n∑

i=1

(x1 − x)2.

Proposicao 11.1 Os estimadores dos mınimos quadrados de β0 e β1, correspondendo a um conjuntode dados (Yi, xi), i = 1, . . . , n, sao dados respectivamente por:

β0 = Y − β1x β1 =SxY

Sxx

Chamamos recta de regressao estimada a:

Y = β0 + β1 x

Nota: So podemos usar esta recta para fazer previsao da variavel resposta para valores de x queestejam contidos entre o mınimo e o maximo valores de x usados para a derivar.

11.3 Qualidade do Ajuste e Estimacao de σ2

Definicao 11.1 (Resıduos e Soma dos Quadrados dos Resıduos) Conhecidos os estimadoresdos parametros de regressao, podemos medir quao longe se encontram os valores estimados da variavelresposta, Yi, dos valores observados Yi. As quantidades ei = (Yi − Yi) =(Yi − β0 − β1 xi) chamamosresıduos. A sua soma de quadrados chamamos soma de quadrados dos resıduos:

SQR =n∑

i=1

n∑

i=1

e2i = (Yi − Yi)2 =

n∑

i=1

(Yi − β0 − β1 xi)2 = SY Y −

(

β1

)2Sxx,

com SY Y =

n∑

i=1

(Yi − Y )2 =

n∑

i=1

Y 2i − nY 2

Com base nos resıduos avaliamos a qualidade do ajuste da regressao linear simples, atraves de umaquantidade designada por coeficiente de determinacao, a seguir definida:

Definicao 11.2 (Coeficiente de Determinacao)

R2 = 1− SQR

SY Y= 1−

SY Y −(

β1

)2Sxx

SY Y=

(

β1

)2Sxx

SY Y

Page 174: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 172

Nota: Esta medida compara a soma de quadrados dos resıduos (SQR) do modelo de regressao linearsimples com a SQR do modelo de regressao linear simples com β1 = 0. A quantidade R2 varia entre0 e 1. Se R2 ≈ 0 dizemos que o modelo nao ajusta bem os dados ja que, nesse caso, a sua SQR estaproxima da SQR de um modelo com declive nulo, indicando nao haver relacao directa entre as variaveisresposta e independente. Caso contrario, se R2 ≈ 1, falamos de um bom ajuste do modelo aos dados.R2 e muitas vezes interpretado como sendo a proporcao de variacao da resposta Y explicada por x.

A quantidade SQR e ainda usada para estimar o valor da variancia do erro, σ2, na maioria doscasos desconhecida. Esta e estimada atraves de uma media corrigida dos quadrados dos resıduos:

σ2 =SQR

n− 2

Proposicao 11.2 (Propriedades de σ2)

X σ2 = SQRn−2 e estimador centrado de σ2;

XSQR

σ2 ∼ χ2n−2 .

A analise dos resıduos ei atras definidos e util nao so para validar a escolha da forma funcional lineardo modelo na explicacao do conjunto de dados em analise, mas tambem para confirmar a validadedos pressupostos efectuados para esse conjunto de dados, no que respeita a normalidade dos erros eda sua variancia constante (frequentemente atraves de metodos graficos como histogramas ou graficosde probabilidades normais desses resıduos). Mais frequentemente os resıduos sao investigados na suaforma normalizada, de forma a poderem ser comparados com a distribuicao normal reduzida.

Definicao 11.3 (Resıduos Padronizados ou Normalizados) No contexto da estimacao do mo-delo de regressao linear simples, as quantidades

di =ei√σ2

=ei

SQRn−2

chamamos resıduos padronizados ou normalizados.

11.4 Distribuicao dos Estimadores β0 e β1

11.4.1 Distribuicao de β1

Vamos aqui derivar a distribuicao por amostragem do estimador β1. Para isso comecamos porescrever este estimador com um aspecto ligeiramente diferente:

β1 =SxY

Sxx=

∑ni=1 xiYi − nxY

Sxx=

∑ni=1 xiYi − x

∑ni=1 Yi

Sxx=

∑ni=1(xi − x)Yi

Sxx

Page 175: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 173

Temos entao que β1 e dado como uma combinacao linear de variaveis aleatorias Normais inde-pendentes (Yi), seguindo entao ele proprio uma distribuicao Normal. Determinemos a sua media evariancia:

E [β1] = E

[∑ni=1(xi − x)Yi

Sxx

]

=

∑ni=1(xi − x)E [Yi]

Sxx=

∑ni=1(xi − x)(β0 + β1 xi)

Sxx=

=β0∑n

i=1(xi − x) + β1∑n

i=1(xi − x)xiSxx

=β0(nx− nx) + β1

(∑n

i=1 x2i − xnx

)

Sxx= β1

Logo, β1 e estimador centrado de β1.

V[β1] = V

[∑ni=1(xi − x)Yi

Sxx

]

= (Yi’s independentes)

=

∑ni=1(xi − x)2V [Yi]

S2xx

=

∑ni=1(xi − x)2σ2

S2xx

=σ2Sxx

S2xx

=σ2

Sxx

Em conclusao:

β1 ∼ N(

β1,σ2

Sxx

)

Voltamos a relembrar neste ponto que na maioria dos casos σ2, a variancia do erro, e um parametrodesconhecido, tendo de ser estimado por σ2 = SQR

n−2 . Consequentemente, querendo fazer inferencias

sobra o parametro β1, nao podemos usar a distribuicao de β1 atras, ja que ela depende de σ2. Teremosde antes de fazer uso do seguinte resultado:

T = β1−β1√

σ2

Sxx

∼ t(n−2)

11.4.2 Distribuicao de β0

Vamos agora derivar a distribuicao por amostragem do estimador β0. Comecamos por escreve-lode uma forma mais conveniente:

β0 = Y − β1x = Y − SxY

Sxxx =

Yi

n−∑

(xi − x)Yi

Sxxx =

YiSxx −∑

(xi − x)Yinx

n Sxx=

=

Yi

(∑

x2i − nx2)

−∑

(xi − x)Yinx

n Sxx=

Yi

(∑

x2i − nx2 − (nxix− nx2))

n Sxx=

=

Yi

(∑

x2i − nxix)

n Sxx

Entao tambem vemos que β0 e dado como uma combinacao linear de variaveis aleatorias Normaisindependentes (Yi), seguindo portanto tambem ele uma distribuicao Normal. Determinemos a suamedia e variancia:

Page 176: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 174

E [β0] = E

[

Yi

(∑

x2i − nxix)

n Sxx

]

=

E [Yi](∑

x2i − nxix)

n Sxx=

=

(β0 + xi β1)(∑

x2i − nxix)

n Sxx=

∑(

β0∑

x2i − β0nxix+ xi β1∑

x2i − xi β1nxix)

n Sxx=

=nβ0

x2i − β0nx(∑

xi) + (∑

xi) β1∑

x2i − (∑

x2i ) nβ1x

n Sxx=

=β0(

n∑

x2i − n2x2)

n Sxx=

β0(∑

x2i − nx2)

Sxx= β0

Assim, β0 e estimador centrado de β0.

V[β0] = V

[

Yi

(∑

x2i − nxix)

n Sxx

]

= (Yi’s independentes)

=

V[Yi](∑

x2i − nxix)2

n2 S2xx

=

σ2

(∑

x2i)2

+ n2x2i x2 − 2

(∑

x2i)

nxix

n2 S2xx

=

=σ2

n(∑

x2i)2

+ n2x2∑

x2i − 2(∑

x2i )nx∑

xi

n2 S2xx

=

=σ2(∑

x2i) ∑

x2i + nx2 − 2x∑

xi

n S2xx

=σ2(∑

x2i) ∑

x2i + nx2 − 2xnx

n S2xx

=

=σ2(∑

x2i) (∑

x2i − nx2)

n S2xx

=σ2∑

x2in Sxx

Em conclusao:

β0 ∼ N(

β0,σ2

x2i

n Sxx

)

Sendo σ2 desconhecida teremos de a estimar dos dados e de recorrer ao seguinte resultado parafazer inferencias sobre β0:

T = β0−β0√

σ2 ∑

x2i

n Sxx

∼ t(n−2)

11.5 Intervalos de Confianca e Testes de Hipoteses para os Parametrosde Regressao

Conhecendo as distribuicoes por amostragem dos estimadores dos parametros de regressao, estamosem condicoes de derivar intervalos de confianca e testes de hipoteses para estes parametros.

Page 177: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 175

11.5.1 Intervalos de Confianca e Testes de Hipoteses para β1

Intervalo de Confianca a (1− α)× 100% para β1

Construamos um IC(1−α)×100%(β1):

• Estatıstica pivot: T = β1−β1√

σ2

Sxx

∼ t(n−2);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < T < c) = 1− α ⇔ P (T < c)− P (T ≤ −c) = 1− α ⇔P (T < c)− P (T ≥ c) = 1− α ⇔ P (T < c)− (1− P (T < c)) = 1− α ⇔

P (T < c)− 1 + P (T < c) = 1− α ⇔ P (T < c) = 1− α

2⇔ c = F−1

t(n−2)

(

1− α

2

)

= t1−α/2

• Determinacao dos extremos do intervalo de confianca:

− c < T < c ⇔ −t1−α/2 < T < t1−α/2 ⇔ −t1−α/2 <β1 − β1√

σ2

Sxx

< t1−α/2 ⇔

− t1−α/2

σ2

Sxx< β1 − β1 < t1−α/2

σ2

Sxx⇔

− t1−α/2

σ2

Sxx− β1 < −β1 < t1−α/2

σ2

Sxx− β1 ⇔

β1 − t1−α/2

σ2

Sxx< β1 < β1 + t1−α/2

σ2

Sxx

• Assim, obtemos o seguinte intervalo de confianca:

IC(1−α)×100%(β1) ≡

β1 − t1−α/2

σ2

Sxx; β1 + t1−α/2

σ2

Sxx

Testes de hipoteses para β1

Podemos estar interessados em efectuar diversos testes sobre este parametro β1, tanto bilateraiscomo unilaterais. O teste em que mais frequentemente estaremos interessados e o teste bilateral sobrese o declive da recta de regressao, β1, e nulo, indicando um modelo de regressao linear nao adequadoao conjunto de dados em maos. Como tal vamos aqui apresentar esse teste, nao excluindo contudo apossibilidade de outros testes poderem ser efectuados.

X Hipoteses:

Page 178: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 176

H0 : β1 = 0 vs H1 : β1 6= 0

X Estatıstica de teste:

T =β1 − 0√

σ2

Sxx

sob H0

∼ t(n−2)

X Regiao de rejeicao do teste, para um nıvel de significancia α pre-especificado:

Rα ≡ (−∞;−c) ∪ (c; +∞),

c : P (T < c) =α

2+ (1− α) = 1− α

2⇔ c = F−1

t(n−2)

(

1− α

2

)

= t1−α2

Entao Rα ≡ (−∞;−t1−α2) ∪ (t1−α

2; +∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se tobs =β1√

σ2

Sxx

∈ Rα.

Note-se que, caso ja tivessemos anteriormente determinado um intervalo de confianca (1−α)×100%para β1, se o valor 0 estivesse contido em tal intervalo poderıamos concluir pela nao rejeicao da hipotesenula anterior, ao nıvel de significancia α.

11.5.2 Intervalos de Confianca e Testes de Hipoteses para β0

Intervalo de Confianca a (1− α)× 100% para β0

Construamos um IC(1−α)×100%(β0):

• Estatıstica pivot: T = β0−β0√

σ2 ∑

x2i

n Sxx

∼ t(n−2);

• Para um nıvel de confianca de (1− α)× 100%, escolha de c1 e c2 - escolhemos c1 = −c e c2 = c.

P (−c < T < c) = 1− α ⇔ P (T < c)− P (T ≤ −c) = 1− α ⇔P (T < c)− P (T ≥ c) = 1− α ⇔ P (T < c)− (1− P (T < c)) = 1− α ⇔

P (T < c)− 1 + P (T < c) = 1− α ⇔ P (T < c) = 1− α

2⇔ c = F−1

t(n−2)

(

1− α

2

)

= t1−α/2

Page 179: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 177

• Determinacao dos extremos do intervalo de confianca:

− c < T < c ⇔ −t1−α/2 < T < t1−α/2 ⇔ −t1−α/2 <β0 − β0√

σ2∑

x2i

n Sxx

< t1−α/2 ⇔

− t1−α/2

σ2∑

x2in Sxx

< β0 − β0 < t1−α/2

σ2∑

x2in Sxx

− t1−α/2

σ2∑

x2in Sxx

− β0 < −β0 < t1−α/2

σ2∑

x2in Sxx

− β0 ⇔

β0 − t1−α/2

σ2∑

x2in Sxx

< β0 < β0 + t1−α/2

σ2∑

x2in Sxx

• Assim, obtemos o seguinte intervalo de confianca:

IC(1−α)×100%(β1) ≡

β0 − t1−α/2

σ2∑

x2in Sxx

; β0 + t1−α/2

σ2∑

x2in Sxx

Testes de hipoteses para β0

Os testes de hipoteses sobre o parametro β0 podem ser tanto bilaterais como unilaterais, sendosempre baseados na distribuicao por amostragem anteriormente apresentada para β0.

11.6 Intervalos de Confianca e Testes de Hipoteses para a Recta deRegressao ou Resposta Media

No contexto do modelo de regressao linear simples, a resposta media para um valor especıfico davariavel independente x0 e dada por E[Y |x0] = β0 + β1x0, sendo um seu estimador pontual:

E[Y |x0] = β0 + β1x0

Este estimador e centrado, a sua variancia e dada por V (E[Y |x0]) = σ2[

1n + (x0−x)2

Sxx

]

e segue uma

distribuicao normal:

Z =E[Y |x0]− E[Y |x0]√

σ2[

1n + (x0−x)2

Sxx

]

∼ N(0, 1)

Estimando σ2 por σ2 = SQRn−2 no resultado acima obtemos a usual distribuicao t-student:

Page 180: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 178

T =E[Y |x0]− E[Y |x0]√

σ2[

1n + (x0−x)2

Sxx

]

∼ t(n−2).

Deste resultado podemos deduzir intervalos de confianca e construir testes de hipotese para E[Y |x0],tal como fizemos para β0 e β1.

11.7 Predicao

No contexto do modelo de regressao linear simples, a predicao de uma observacao futura Y0 cor-respondendo a um nıvel especıfico x0 da variavel independente e o seu estimador pontual:

Y0 = β0 + β1x0

O erro de predicao que lhe esta associado,

e0 = Y0 − Y0,

sendo dado por uma diferenca de duas quantidades normalmente distribuıdas e independentes, segue

uma distribuicao normal de media 0 e variancia V (e0) = V (Y0 − Y0) = σ2[

1 + 1n + (x0−x)2

Sxx

]

:

Z =Y0 − Y0

σ2[

1 + 1n + (x0−x)2

Sxx

]

∼ N(0, 1)

Estimando σ2 por σ2 = SQRn−2 no resultado acima obtemos a usual distribuicao t-student:

T =Y0 − Y0

σ2[

1 + 1n + (x0−x)2

Sxx

]

∼ t(n−2).

Deste resultado podemos deduzir intervalos de confianca e construir testes de hipotese para Y0, talcomo fizemos para β0 e β1.

11.8 Um exemplo

Exemplo 11.1 Os dados seguintes dizem respeito ao grau de endurecimento de um certo cimento, Y ,medido numa certa escala, para diferentes valores de temperatura, x, em oC:

i 1 2 3 4 5 6 7 8 9 10

xi 100 110 120 130 140 150 160 170 180 190Yi 45 52 54 63 62 68 75 76 92 88

Com estes dados construımos um grafico dos valores de x contra os valores de Y , do qual verifi-camos parecer existir uma relacao linear entre as duas variaveis:

Page 181: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 179

Yi

xi

5060

7080

90

100 120 140 160 180

Assumindo entao o modelo de regressao linear para estes dados, estimamos pelos mınimos quadra-dos os parametros de regressao:

β1 =

∑ni=1 xiYi − nxY∑n

i=1 x2i − nx2

=100 × 45 + 110 × 52 + . . . − 10xY

1002 + 1102 + . . .− 10x2=

101970 − 10 × 145 × 67.5

218500 − 10× 1452= 0.4964

β0 = Y − β1x = 67.5 − 0.4964 × 145 = −4.4727

Assim a recta de regressao estimada, disposta no grafico dos dados na figura seguinte, e dada por:

Y = −4.4727 + 0.4964 x

Estando interessados em estimar qual o nıvel de endurecimento (medio) do cimento para umatemperatura de 105oC basta fazer:

Y = −4.4727 + 0.4964 × 105 = 47.65

No entanto, nao podemos fazer analoga previsao para uma temperatura de 200oC, ja que a rectade regressao so e valida dentro da gama de temperaturas usadas para a estimar.

Vamos avaliar a qualidade do ajuste, determinando o coeficiente de determinacao, R2:

R2 =

(

β1

)2Sxx

SY Y=

(

β1

)2 (∑n

i=1 x2i − nx2

)

∑ni=1 Y

2i − nY 2

=(0.4964)2

(

218500 − 10× 1452)

47691 − 10 × 67.52= 0.955

Este valor indica um bom ajuste do modelo de regressao linear aos dados.Estimamos agora o parametro variancia do erro, σ2:

σ2 =SQR

n− 2=

1

n− 2

SY Y −(

β1

)2Sxx

= 11.9864

Testamos agora hipotese de o declive da recta de regressao β1 valer zero, usando um nıvel designificancia de 5%:

Page 182: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 180

Yi

xi

5060

7080

90

100 120 140 160 180

X Hipoteses:

H0 : β1 = 0 vs H1 : β1 6= 0

X Estatıstica de teste:

T =β1 − 0√

σ2

Sxx

sob H0

∼ t(n−2) ≡ t(10−2) ≡ t(8)

X Regiao de rejeicao:

R0.05 ≡ (−∞;−c) ∪ (c; +∞),

c : P (T < c) = 1− 0.05

2⇔ c = F−1

t(8)(0.975) = 2.306

Entao R0.05 ≡ (−∞;−2.306) ∪ (2.306;+∞)

X Regra de decisao do teste:

Rejeitar H0 ao nıvel de significancia α se tobs ∈ R0.05.

X Decisao:

tobs =0.4964

11.9864218500−10×1452

= 13.0231 ∈ R0.05

Logo rejeitamos a hipotese de que β1 = 0, ao nıvel de significancia 5%.

Vamos2

Page 183: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 181

11.9 Exercıcios Propostos

11.1 Determinada empresa esta interessada em contabilizar o tempo que o ar condicionado estaligado no verao, por dia, mediante a temperatura exterior (oC). Assim, seleccionaram-se 14 diasao acaso, para os quais se mediram as temperaturas (x) e se registarem o numero de horas deutilizacao do ar condicionado (Y):

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14

xi 29 28 29 35 26 25 32 31 34 27 33 33 32 28Yi 10.5 9.0 10.4 18.6 5.5 5.2 11.6 10.4 17.8 9.9 13.7 14.2 12.3 8.7

(a) Disponha os dados em grafico.

(b) Estime a recta de regressao linear simples. Refira quais os pressupostos efectuados. Dese-nhe-a no grafico anterior.

(c) Comente a qualidade da estimacao efectuada, com base no coeficiente de determinacao.

(d) Teste a hipotese de o verdadeiro declive da recta de regressao ser nulo. Comente o resultadoa luz da alınea anterior.

(e) Para uma temperatura exterior de 30oC qual o numero de horas que estima que o arcondicionado esteja a trabalhar? E para uma temperatura de 40oC?

11.2 Pretende-se modelar a velocidade do vento Y , medida em Km/h, com a altitude x a que se faza medicao (m). Para tal registaram-se, para 9 valores de altitude, os correspondentes valores davelocidade do vento:

i 1 2 3 4 5 6 7 8 9

xi 100 250 500 750 1000 1250 1500 1750 2000Yi 4 9 15 16 20 46 54 59 72

Y 2i = 14675 Y = 32.78

x2i = 12760000 x = 1011.11∑

Yixi = 427900

(a) Ajuste um modelo de regressao linear simples aos dados. O que pode dizer sobre a qualidadedo ajuste?

(b) Determine um intervalo de confianca a 95% para o verdadeiro declive da recta de regressao.

(c) Use o resultado da alınea anterior para testar a hipotese de que o verdadeiro declive darecta de regressao e nulo.

11.3 Pretende-se, se possıvel, modelar atraves de uma recta de regressao linear simples a quantidadede vidro Y produzido num ecoponto (Kg), usando como variavel independente x o numero dedias sem despejar o mesmo. Para tal, registaram-se os seguintes dados:

i 1 2 3 4 5 6 7 8

xi 2 3 4 5 10 15 20 25yi 100 150 250 320 650 810 1040 1480

(a) Escreva a recta de regressao estimada atraves do metodo dos mınimos quadrados. Achaque conseguiu um bom ajuste?

Page 184: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 182

(b) Teste a hipotese de o declive da recta de regressao ser nulo e construa um intervalo deconfianca a 95% para a ordenada na origem da recta de regressao.

(c) Qual o valor da quantidade de vidro produzida no ecoponto que preve ocorrer em 10 diassem o despejar. Seria possıvel calcular o mesmo para um perıodo de 35 dias?

11.4 Em determinada faculdade a associacao de estudantes esta interessada em modelar a media finalde curso dos seus alunos (Y ) com a nota de acesso a mesma faculdade, x, usando uma rectade regressao linear simples. Para tal seleccionaram ao acaso um conjunto de 10 alunos para osquais registaram os seguintes valores referentes a estas duas variaveis:

i 1 2 3 4 5 6 7 8 9 10

xi 12 18 14 16 11 19 20 17 13 15Yi 11 15 12 14 11 16 19 15 12 13

(a) Estime a referida recta de regressao linear simples e comente a sua qualidade.

(b) Teste, ao nıvel de significancia 5%, a hipotese de que as notas de entrada nao tem relacaodirecta com a media final de curso.

(c) Suponha que um caloiro entrou com media de 16 valores nesta faculdade. Preveja o seuvalor de media final de curso.

11.5 Determinado agricultor esta interessado em estudar se a quantidade de milho produzido nas suasterras esta directamente relacionado com a quantidade de precipitacao que ocorre nos meses deMaio a Julho. Assim, registou essa quantidade de precipitacao, em litros e por metro quadradode terreno, por 8 vezes distintas, tendo contabilizado os seguintes valores do milho produzido,tambem por metro quadrado de terreno:

i 1 2 3 4 5 6 7 8

xi 45 50 60 30 35 55 52 71Yi 2.8 3.3 3.6 2.9 3.0 3.5 3.8 3.5

Y 2i = 88.04 Y = 3.3

x2i = 21020 x = 49.75∑

Yixi = 1337.6

Use os dados anteriores para dar uma resposta ao agricultor.

11.6 Estamos interessados em avaliar os custos de manutencao por ano (Y), em e, dos carrosPOUPEX com a idade dos veıculos (x), em anos. Assim, para se relacionarem estas 2 variaveisatraves de um modelo de regressao linear, recolheram-se os seguintes dados:

i 1 2 3 4

Yi 200 320 450 490xi 1 2 4 7

Correspondendo a estes dados temos que:

4∑

i=1

Y 2i = 585000 Y = 365

4∑

i=1

x2i = 70 x = 3.5

4∑

i=1

Yixi = 6070 SQR = 8214.286

Page 185: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 183

(a) Estime os parametros de regressao. Em termos praticos o que indica o valor de β1?

(b) Critique a qualidade do ajuste.

(c) Teste a hipotese de o verdadeiro declive da recta de regressao ser nulo, a um nıvel designificancia 5%. Esperava o resultado obtido? Justifique.

(d) Quanto estima que va ter de custos de manutencao com o seu carro POUPEX neste anoque se avizinha, agora que o seu carro faz 6 anos?

11.7 Pretende-se averiguar se existe uma relacao directa entre a proximidade com campos de futebolda residencia de casais e a taxa de divorcio. Assim registaram-se, em 5 locais seleccionados aoacaso, o correspondente numero de estadios de futebol num raio de 50Km (x) e a respectiva taxade divorcio por 1000 habitantes registada nessas localidades (Y):

No de campos de futebol, xi 0 1 2 5 6

Taxa de divorcio (por 1000 habitantes), Yi 2.2 2.5 3.5 4.1 4.8

5∑

i=1

xi = 14;

5∑

i=1

x2i = 66;

5∑

i=1

Yi = 17.1;

5∑

i=1

Y 2i = 63.19;

5∑

i=1

Yixi = 58.8; SQR = 0.2585075.

(a) Ajuste uma recta de regressao linear a estes dados. Que pode dizer da qualidade do ajuste?

(b) Diga por suas palavras como interpreta o valor de β1 obtido.

(c) Teste a hipotese do verdadeiro valor declive da recta de regressao, β1, ser nulo, a um nıvelde significancia 10%. O resultado esta de acordo com a qualidade do ajuste discutida em(a)?

(d) Numa localidade com 3 estadios de futebol na sua proximidade (menos de 50Km) quantopreve que valha a correspondente taxa de divorcio?

(Exercıcio de exame)

11.8 Uma empresa que produz fornos electricos esta interessada em avaliar se os seus fornos estao bemcalibrados, no sentido em que atingem correctamente as temperaturas para as quais sao progra-mados. Assim seleccionou-se aleatoriamente um conjunto de 12 fornos, que foram programadospara diversas temperaturas, x, e para os quais se mediram as correspondentes temperaturasefectivamente alcancadas, Y - valores em oC:

x 100 120 140 160 180 200 220 240 260 280 300 320

Y 105 114 142 163 178 205 224 236 258 282 300 319

12∑

i=1

Yi = 2526

12∑

i=1

Y 2i = 588184

12∑

i=1

xi = 2520

12∑

i=1

x2i = 586400

12∑

i=1

Yixi = 587220

R2 = 0.9976 σ = 3.71

(a) Estime atraves de uma recta de regressao linear simples a relacao entre a temperaturaefectiva dos fornos e a temperatura para que estes foram programados.

(b) O que pode dizer sobre a qualidade da estimacao efectuada na alınea anterior?

Page 186: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 184

(c) Justifique de forma sucinta se o declive da recta de regressao aqui usada pode ser consideradosignificativamente distinto de zero e quais as consequencias praticas da sua conclusao.

(d) Interprete o valor obtido do declive da recta de regressao e justifique se este valor esta ounao de acordo com as expectativas da empresa fabricante dos fornos.

(Exercıcio de exame)

11.9 Diga, justificando, se as seguintes afirmacoes sao verdadeiras ou falsas:

(a) Foi efectuado um estudo para modelar o peso ganho pelos adultos em Kg (Y ) com a suaidade em anos (x). Uma amostra aleatoria de 100 adultos, com idades compreendidasentre 50 e 80 anos, foi seleccionada e a seguinte recta de regressao linear foi estimada:Yi = 75 + 0.5xi. De acordo com este modelo, e assumindo que temos um bom ajuste,podemos afirmar que um qualquer adulto aumenta 10Kg dos 50 para os 60 anos.

(b) Ainda referente ao estudo do peso descrito na alınea anterior podemos afirmar que a rectade regressao linear aı estimada permanece aproximadamente valida para todos os indivıduosda faixa etaria dos 5 aos 10 anos.

(c) Em certas locais ha uma forte associacao entre as concentracoes de ozono x (ppm) e aconcentracao do chamado carbono secundario Y (µg/m3). De forma a estudar esta asso-ciacao recolheram-se, para 16 locais aleatoriamente seleccionados, dados sobre estes doispoluentes, tendo-se estimado por mınimos quadrados a seguinte recta de regressao linear:

Yi = 0.998 + 93.377xi

R2 = 0.712, σ2 = 15.1,

16∑

i=1

x2i − nx2 = 0.03

Podemos entao afirmar, com um nıvel de significancia de 5%, que o declive da recta esignificativamente distinto de zero, confirmando as nossas expectativas.

(d) Pensou-se num modelo de regressao linear simples para explicar a temperatura atmosferica(Y ), em oC, em funcao da pressao atmosferica (x), em bar. Assim, seleccionaram-se ao acaso20 dias e registaram-se os valores destas duas quantidades, tendo-se estimado a seguinterecta de regressao linear:

Yi = −75 + 100xi (R2 = 0.95)

Sabendo que√

σ2∑n

i=1 x2i − nx2

= 5.636,

posso entao afirmar que:

(d1) A um nıvel de significancia de 5% o declive da recta e nulo.

(d2) A conclusao expressa na alınea anterior permite-me dizer que o modelo proposto naoe razoavel para os fenomenos em causa.

(e) Num modelo de regressao linear o ponto (x, Y ) pertence a recta de regressao estimada.

Page 187: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 185

(Exercıcio de exame)

11.10 Pretende-se, se possıvel, modelar atraves de uma recta de regressao simples o consumo de com-bustıvel, Y , de um automovel em funcao da sua velocidade de circulacao, x. Para tal registaram-se os valores de consumo de combustıvel para um mesmo percurso de 100Km percorrido a difer-entes velocidades:

i 1 2 3 4 5 6 7 8

xi 50 60 70 80 90 100 110 120

yi 5.22 6.25 6.85 8.36 8.09 10.16 11.17 11.57

x = 85, Y = 8.46,∑

x2i = 62000,∑

Y 2i = 610.43,

Yixi = 6145.5, SQR = 1.15

(a) Ajuste um modelo de regressao linear simples aos dados. Que pode dizer sobre a qualidadedo ajuste?

(b) Diga por suas palavras como interpreta o valor estimado do declive da recta acima consid-erada. O sinal desta estimativa esta de acordo com as suas expectativas? Porque?

(c) Determine um intervalo de confianca a 95% para o verdadeiro declive da recta de regressao.Comente o resultado face a qualidade do ajuste concluıda na alınea (a).

(Exercıcio de exame)

11.11 Determinado economista esta interessado em averiguar se os salarios se relacionam linearmentecom o grau de educacao das pessoas, medido em anos de escolaridade. Assim ele seleccionoualeatoriamente um certo numero de pessoas, tendo registado para cada uma delas o seu salariomensal bruto em e, Y , e o seu correspondente numero de anos de escolaridade, x (que na amostrase verificou variar entre 7 e 21 anos).

Com os dados recolhidos o economista procedeu a estimacao, pelo metodo dos mınimos quadra-dos, da recta de regressao linear Yi = β0+β1xi+εi, i = 1, . . . , n, com os habituais pressupostos,tendo obtido o seguinte:

β0 = −1003.269 V (β0) =σ2

x2i

n (∑

x2i−nx2)

= 1288.738 tobs =β0−β0

σ2 ∑

x2i

n (∑

x2i−nx2)

= −27.95

β1 = 139.817 V (β1) =σ2

∑ni=1 x

2i−nx2 = 5.832225 tobs =

β1−β1√

σ2∑n

i=1x2i−nx2

= 2.415

R2 = 0.9716 σ = 83.27 SQR = 693389.29

(a) Comente a qualidade do ajuste obtido.

(b) Teste, a um nıvel de significancia de 10%, a hipotese de o declive da recta de regressao sernulo. Comente.

(c) De acordo com este modelo qual o ganho de mais um ano de educacao?

(d) Quanto preve que ganhe um indivıduo com a escolaridade obrigatoria (= 9 anos de ed-ucacao)? E um licenciado (=17 anos de educacao)?

(Exercıcio de exame)

Page 188: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 12

Exercıcios variados

12.1 Num determinado aquario encontram-se 4 peixinhos dourados e 6 vermelhos para venda.

(a) O Sr. Ze vai comprar 2 desses peixinhos, nao tendo preferencia pela cor. Assim, selecciona-se aleatoriamente um conjunto de 2 peixes. Qual a distribuicao da v.a. X que representao numero de peixes dourados que calham a este cliente?

(b) Chegado a casa, os 2 filhos do Sr. Ze comecam a discutir quem escolhe primeiro o seupeixinho, antes mesmo de os verem. Decidem pois que, se pelo menos 1 dos peixes fordourado, o filho mais velho pode escolher primeiro. Caso contrario, escolhe primeiro o filhomais novo. Represente Y a v.a. que indica se foi o filho mais velho a escolher (Y = 1) ounao (Y = 0). Determine a funcao de probabilidade de Y . Identifique esta distribuicao.

(c) As v.a.’s X e Y sao independentes? Justifique adequadamente.

(Exercıcio de exame)

12.2 O tempo de espera (em minutos) por um autocarro e uma v.a. T com a seguinte funcao densidadede probabilidade:

f(t) =

1/2, 0 < t < 11/4, 2 < t < 40, caso contrario

(a) Determine a funcao de distribuicao da v.a. T (Sugestao: esboce primeiro o grafico de f(t)).

(b) Determine o tempo medio e o tempo mediano de espera pelo autocarro.

(c) Qual e a probabilidade de esperar menos de 1 minuto pelo autocarro, sabendo que ja estoua espera ha 0.5 minutos?

(d) Durante o ano tenho de apanhar este autocarro 100 vezes. Qual e o numero medio de vezes,nesse ano, em que espero menos de meio minuto?

(Exercıcio de exame)

12.3 A variavel aleatoriaX representa o tempo de espera (em horas) num determinado servico publico.A funcao densidade probabilidade desta variavel e a seguinte:

f(x) =

a, 0 ≤ x ≤ 22a, 2 < x ≤ 40, caso contrario

186

Page 189: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 187

(a) Determine a constante a, justificando.

(b) Determine a probabilidade de eu esperar mais de duas horas neste servico sabendo que jaestou a espera ha meia hora.

(c) Calcule e interprete o valor esperado do tempo de espera neste servico.

(d) Supondo que eu tenho de ir a este servico umas 10 vezes por ano, em dias aleatoriamentedeterminados, qual a probabilidade de em metade destes dias eu esperar mais de meia horade cada vez?

(Exercıcio de exame)

12.4 O tempo (em horas) que o tecnico Ze demora a compor um televisor e uma variavel aleatoria Xcuja funcao densidade probabilidade e dada por:

f(x) =

3x2, 0 < x < 10, c.c.

(a) Diga o que entende por funcao distribuicao. Deduza a funcao distribuicao da variavelaleatoria X.

(b) Qual a probabilidade de o tecnico Ze demorar mais de meia hora a compor um televisor,sabendo que ja o esta a compor ha 15 minutos?

(c) Se o tecnico Ze tem 10 televisores para compor qual a probabilidade de ele demorar menosde 15 minutos no arranjo individual de pelo menos 9 desses televisores?

(Exercıcio de exame)

12.5 O tempo (em horas) que os alunos da disciplina de Probabilidades e Estatıstica demoram aresolver um exame desta disciplina e uma variavel aleatoria X com a seguinte funcao densidadeprobabilidade:

f(x) =

0.5x, 0 ≤ x ≤ 20, caso contrario

(a) Diga o que entende por funcao densidade probabilidade e qual a sua utilidade.

(b) Deduza a funcao distribuicao do tempo de resolucao do exame, X.

(c) Sabendo que determinado aluno ja esta a resolver o exame ha mais de uma hora, qual aprobabilidade de ele resolver o exame em menos de uma hora e meia?

(d) Qual o tempo medio de resolucao dos exames desta disciplina?

(e) Numa sala de 40 alunos qual a probabilidade de que todos eles demorem menos de umahora e meia a resolver o exame? Refira eventuais pressupostos que tenha de fazer pararesponder a esta questao.

(Exercıcio de exame)

12.6 A quantidade de cimento (m3) que determinada betoneira debita por minuto e uma variavelaleatoria X com a seguinte funcao densidade probabilidade:

f(x) =

15 , 0 ≤ x ≤ 50, caso contrario

Page 190: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 188

(a) Qual a probabilidade desta betoneira debitar mais de 4 m3 de cimento em determinadominuto, sabendo que ja debitou mais de 2 m3?

(b) Qual a quantidade media e a quantidade mediana de cimento debitado por esta betoneirapor minuto? Comente.

(c) Considere que determinado empreiteiro paga o cimento fornecido pela betoneira de acordocom a velocidade a que este e depositado - muito rapido e equivalente a ter cimento muitolıquido e de pouca qualidade; muito lento e equivalente a cimento com muita areia e depouca qualidade. Assim, se em determinado minuto a betoneira:

• debitar menos de 2m3 de cimento, o empreiteiro paga este cimento a 1.5e por m3;

• debitar entre 2m3 e 4m3 (inclusivamente) de cimento, o empreiteiro paga este cimentoa 2.5e por m3;

• debitar mais de 4m3 de cimento, o empreiteiro paga este cimento a 1e por m3.

Determine a funcao de probabilidade da variavel aleatoria Y que representa o preco porm3 de cimento a que o empreiteiro o paga e determine o seu valor esperado e o seu desviopadrao.

(Exercıcio de exame)

12.7 A variavel aleatoria X representa o peso (em dezenas de Kg) dos troncos de eucalipto que chegama determinada fabrica de papel, a qual corresponde a seguinte funcao densidade probabilidade:

f(x) =

(x−5)2

18 , 2 ≤ x ≤ 80, caso contrario

(a) Determine a funcao distribuicao de X.

(b) Calcule a probabilidade de determinado eucalipto, que se sabe ter mais de 5 dezenas de Kg,pesar mais de 6 dezenas de Kg.

(c) Calcule duas medidas de localizacao do peso dos eucaliptos (como, por exemplo, o pesomedio dos eucaliptos).

(d) Para uma remessa de 100 eucaliptos calcule a probabilidade de mais de metade pesaremmais de 5 dezenas de Kg cada.

(Exercıcio de exame)

12.8 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

Moda, media e mediana de uma variavel aleatoria X com distribuicao Normal sao medidassempre iguais.

12.9 O consumo diario de agua de um laboratorio, em m3, e uma variavel aleatoria com funcaodensidade:

f(x) =

13 , 0 < x ≤ 1;

32x3 , 1 < x ≤ 3;

0, outros valores de x;

Page 191: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 189

(a) Determine a funcao de distribuicao desta variavel aleatoria.

(b) Calcule a probabilidade do consumo ser inferior a 0.5m3, num dia em que o consumo einferior a 1m3.

(c) Define-se a despesa diaria com agua em centimos, Y , atraves da formula Y = X3. Calculeo valor medio desta despesa diaria.

(d) Qual a probabilidade de, em 2 dos 5 dias uteis duma semana, se registar um consumo diarioinferior a 1m3?

(Exercıcio de exame)

12.10 Represente a variavel aleatoria X a proporcao de reclamacoes resolvidas por mes, em determi-nado servico pos-venda, a qual corresponde a seguinte funcao densidade probabilidade:

f(x) =

2x, 0 ≤ x ≤ 10, caso contrario

(a) Determine a funcao distribuicao de X.

(b) Determine P (X ≤ 0.5|X > 0.25).

(c) Considere a variavel aleatoria Y = exp(X). Determine E [X − Y ].

(d) Determine a probabilidade de em todos os meses de determinado ano (=12 meses) se teremconseguido resolver pelo menos 90% de todas as reclamacoes recebidas.

(Exercıcio de exame)

12.11 Suponha que as variaveis aleatorias X, Y e W tem medias de 7, 2 e 5, respectivamente, e desviospadrao de 1 , 2 e 0.5, respectivamente. Sabe-se ainda que cov(X,W ) = 1.

(a) Qual a media e a variancia da variavel aleatoria T = 2X −W + 1?

(b) Seja V = X +Y +1. Suponha que sabe que V(V ) = 2. Quanto vale cov(X,Y )? X e Y saovariaveis aleatorias independentes?

(c) Suponha agora que X e Y se distribuem normalmente, sendo independentes. Determine aprobabilidade de X ser maior que pelo menos o dobro de Y .

(Exercıcio de exame)

12.12 Certa doenca nao fatal para as ovelhas afecta contudo a sua producao de leite. Suponha que otempo X, em semanas, necessario a recuperacao de uma ovelha afectada e uma variavel aleatoriacom a seguinte funcao densidade de probabilidade:

f(x) =

0 , x ≤ 1

3

x4, x > 1

A consequente perda desta doenca para o agricultor (em u.m., unidades monetarias) e dada pelavariavel aleatoria Y = 10 + 20X.

(a) Determine o valor medio e a variancia de Y .

Page 192: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 190

(b) Suponha que o governo decidiu subsidiar os agricultores com ovelhas afectadas por estadoenca. Para uma ovelha afectada e recuperada no tempo X, o governo paga uma quanti-dade W (em u.m.) dada por: W = 30 se X < 2 e W = 30 + k se X ≥ 2, sendo k e umaconstante positiva.

i) Determine E [W ], em funcao de k. Qual o valor de k que garante que E[W ] = E[Y ]?Para que nos interessa conhecer este valor de k?

ii) Para o valor de k determinado na alınea anterior, deduza a funcao distribuicao davariavel aleatoria W .

(Exercıcio de exame)

12.13 O tempo de vida (em anos) de uma especie particular de abetos, Abies balsamea, e uma variavelaleatoria X com a seguinte funcao distribuicao:

F (x) =

0 , x < 01− e−0.25x , x ≥ 0

(a) Usando a funcao distribuicao dada:

(i) Calcule P (1 < X < 2).

(ii) Determine a mediana do tempo de vida desta especie de arvores.

(b) Determine a funcao densidade probabilidade de X.

(c) Qual o tempo medio de vida destas arvores?

(d) Calcule a probabilidade de uma destas arvores durar mais de 5 anos, sabendo que ja ultra-passou os 3 anos.

(e) Numa floresta destas arvores, com 150 abetos, qual a probabilidade de apenas 40 delasultrapassarem os 5 anos de vida?

(Exercıcio de exame)

12.14 Um tecnico de seguranca rodoviaria garante que apenas 60% dos condutores de automoveis usamcinto de seguranca dentro das cidades.

(a) Indique, justificando, a distribuicao da variavel aleatoria X que contabiliza o numero decondutores que usam cinto de seguranca dentro da cidade, num total de 2 condutores.

(b) Calcule a probabilidade de, numa amostra de 2 condutores, haver exactamente 1 que naousa o cinto de seguranca.

(c) Como e sabido a gravidade dos acidentes rodoviarios prende-se usualmente com o uso ounao de cinto de seguranca. Assim, vamos considerar o par aleatorio constituıdo por X(numero de condutores que usam cinto de seguranca dentro da cidade numa amostra de2 condutores) e Y - numero de condutores, nessa amostra de 2, que ja tiveram acidentesconsiderados graves. Este par aleatorio tem a seguinte funcao de probabilidade conjunta:

X \ Y 0 1 2

0 0.01 0.051 0.08 0.302

0.39 0.4 0.21 1

Page 193: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 191

i. Complete a funcao de probabilidade conjunta, justificando.

ii. Qual a probabilidade de, em dois condutores que se sabe usarem sempre cinto deseguranca, nenhum deles ter tido acidentes considerados graves?

iii. Qual a probabilidade, de em dois condutores que se sabe nunca usarem cinto de segu-ranca, ambos terem tido acidentes considerados graves?

iv. De que forma e que as respostas as duas alıneas anteriores lhe permitem concluir seexiste independencia das variaveis X e Y ?

v. Sabendo que E[Y 2] = 1.24 determine V(X+Y).

(Exercıcio de exame)

12.15 Considere as v.a.’s X e Y independentes, tais que X ∼ Binomial(2, 0.6) e Y ∼ Uniforme(2).

(a) Construa a tabela da funcao de probabilidade conjunta do par (X,Y ).

(b) Calcule P (X > Y ).

(c) Indique, justificando convenientemente, os valores de E[XY ] e cov(X,Y ).

12.16 Considere as v.a.s X e Y , que seguem as distribuicoes X ∼Poisson(3) e Y ∼Binomial(5,0.6).Admita ainda que Cov(X,Y ) = 0.5.

(a) As variaveis X e Y sao independentes? Justifique.

(b) Calcule E [X − 2Y ] e V (X − 2Y ).

(c) Calcule o coeficiente de correlacao entre X e Y e comente sobre a eventual relacao linearentre as variaveis.

(Exercıcio de exame)

12.17 Uma loja vende de 0 a 3 televisoes (TVs) de alta definicao por dia. Quando vende uma TVo vendedor tenta persuadir o cliente a adquirir uma garantia alargada para a mesma. DenoteX o numero de TVs vendidas num dia e represente Y o correspondente numero de garantiasalargadas vendidas. A funcao de probabilidade conjunta de (X,Y ) segue-se:

X\Y 0 1 2 3

0 0.2 0 0 01 0.25 0.25 0 02 0.05 0.1 0.05 03 0.01 0.04 0.04 0.01

(a) Determine P (X = x) e P (Y = y), as funcoes de probabilidade marginais de X e de Y ,respectivamente.

(b) Determine a funcao de probabilidade condicionada de Y sabendo que X = 1. Identifiqueesta distribuicao.

(c) Determine a covariancia entre X e Y .

(d) O numero de TVs vendidas e independente do numero de garantias vendidas? Como e quepoderia usar as duas alıneas anteriores para responder a esta questao?

(Exercıcio de exame)

Page 194: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 192

12.18 Represente X a variavel aleatoria que indica o sexo de uma pessoa seleccionada ao acaso napopulacao (X = 0 corresponde a uma pessoa do sexo masculino e X = 1 a uma pessoa do sexofeminino). Represente Y outra variavel aleatoria que representa a opiniao sobre o aumento dotempo de licenca de maternidade para 6 meses (Y = 0 corresponde a uma opiniao a favor eY = 1 a e uma opiniao contra) de uma qualquer pessoa, na populacao. A correspondente funcaode probabilidade conjunta segue-se:

X\Y 0 1

0 0.15 0.201 0.25 0.40

1

Escolhendo ao acaso uma pessoa desta populacao:

(a) Qual a probabilidade dessa pessoa ser do sexo masculino ou ser a favor do aumento dotempo de licenca de maternidade?

(b) Dado que essa pessoa e a favor do aumento do tempo da licenca de maternidade qual aprobabilidade de que seja do sexo masculino?

(c) Determine o coeficiente de correlacao entre X e Y .

(d) Conclua quando a independencia de X e Y , por dois processos diferentes (pode-se basearnas alıneas anteriores).

(Exercıcio de exame)

12.19 Numa bomba de gasolina cada cliente abastece-se de uma quantidade aleatoria de combustıvelX que se sabe ter uma distribuicao Uniforme em [10,40] litros. Admita que por dia se abastecemnesta bomba 300 clientes e que cada litro de combustıvel proporciona uma receita de 75 centimos.

(a) Qual a receita media proporcionada por cada cliente? E qual a receita media diaria desteposto de abastecimento?

(b) Qual a probabilidade de, num certo dia, haver mais de 60 clientes a abastecer menos de 15litros de gasolina (cada)?

(c) Suponha que aos clientes sao distribuıdos cartoes - com 1 ponto para abastecimentos ate15 litros, com 2 pontos para abastecimentos entre 15 litros e 30 litros e com 3 pontos paraabastecimentos superiores a 30 litros.

(c1) Qual a percentagem de clientes que recebem 2 pontos?

(c2) Qual o numero medio de pontos distribuıdos diariamente?

(Exercıcio de exame)

12.20 O total de tempo (em minutos) gasto pelo Ze desde que sai de casa ate que chega ao empregopode ser dividido em 3 componentes:

• T1, o tempo dispendido desde que sai de casa ate entrar no autocarro;

• T2 , o tempo gasto na viagem do autocarro;

• T3 , o tempo que decorre desde que sai do autocarro ate entrar no emprego.

Page 195: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 193

As variaveis aleatorias T1, T2 e T3 sao independentes com distribuicao N(8, 12), N(20, 22) eN(6, 12) , respectivamente.

(a) Determine a probabilidade de o tempo total gasto pelo Ze, desde que sai de casa ate quechega ao emprego, exceder os 40 minutos. Justifique convenientemente.

(b) Num ano de trabalho (=240 dias uteis) qual a probabilidade do Ze, em pelo menos metadedesses dias, demorar menos de 20 minutos no trajecto de autocarro ? Justifique conve-nientemente.

(c) Quanto vale a cov(T1, T2)? Porque?

(Exercıcio de exame)

12.21 Diga, justificando, se a seguinte afirmacao e verdadeira ou falsa:

Supondo que um intervalo de confianca a 95% para a media de uma populacao e dado porIC95%(µ) ≡ (0.02; 0.15), entao podemos afirmar, com um nıvel de significancia de 10%, que essamedia e diferente de zero.

12.22 O tempo de reaccao (segundos) a um determinado medicamento estimulante, X, e normalmentedistribuıdo. De forma a se poderem estimar os parametros da sua distribuicao observaram-seesses tempos de reaccao para 10 pacientes, seleccionados ao acaso, tendo-se registado os seguintesvalores:

10∑

i=1

xi = 110 s

10∑

i=1

x2i = 1354 s2

(a) Com base nesta amostra, estime pontualmente o tempo medio de reaccao a este medica-mento e o seu desvio padrao.

(b) Deduza e encontre um intervalo de confianca a 95% para o tempo medio do tempo dereaccao. Comente e justifique todos os pressupostos empregues.

(c) Teste, a um nıvel de significancia 5%, a hipotese de o desvio padrao deste tempo de servicoser superior a 5 segundos. Justifique convenientemente todos os passos dados.

(Exercıcio de exame)

12.23 A durabilidade dos rolamentos ROLIV para veıculos motorizados, medido em milhares de Kms,segue uma distribuicao normal. De forma a poder estimar a durabilidade media destes rolamen-tos, o engenheiro Manecas testou 10 rolamentos ROLIV, tendo observado as seguintes valoresde durabilidades (em milhares de Kms):

54, 45, 39, 40, 38, 37, 34, 36, 35, 33 correspondendo a

10∑

i=1

xi = 391;

10∑

i=1

x2i = 15641.

(a) Indique um estimador pontual para a durabilidade media. Diga uma propriedade desteestimador. Calcule, para a amostra recolhida, qual a correspondente estimativa da dura-bilidade media.

(b) Deduza um intervalo de confianca a 95% para a durabilidade media e escreva em portuguescorrente o que e que ele representa.

Page 196: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 194

(c) Qual deveria ser o tamanho da amostra a seleccionar de forma a que a amplitude do intervalode confianca a 95% para a durabilidade media fosse inferior a 1 milhar de Kms. Nota:Assuma, a partida, que o referido tamanho amostral e superior a 30.

(d) Teste ao nıvel de significancia de 1% se a variancia da durabilidade deste tipo de rolamentose inferior a 25 (milhares de Kms)2. Justifique o procedimento empregue.

(Exercıcio de exame)

12.24 De forma avaliar o coeficiente de inteligencia medio (QI) da classe dos gestores empresariaisseleccionou-se uma amostra aleatoria de 100 gestores, aos quais se mediram os seus valores deQI, tendo resultado numa media de 101. Sabe-se que o desvio padrao da populacao dos QI e de10.

(a) De que forma se pode estimar pontualmente o coeficiente de inteligencia medio destaclasse de profissionais?

(b) Deduza um intervalo de confianca a 96% para o coeficiente de inteligencia medio dosgestores. Indique os pressupostos efectuados. Explique porque e preferıvel esta formade estimacao a considerada na alınea anterior.

(c) Determine qual deve ser a dimensao da amostra de forma a que a amplitude do intervalode confianca determinado na alınea anterior se reduza para metade.

(d) Usando um nıvel de significancia de 5% teste a hipotese de o desvio padrao da populacaodos QI valer efectivamente 10, sabendo que a amostra aleatoria atras recolhida de QIsresulta num desvio padrao de 12. Indique os pressupostos que tiver de fazer.

(Exercıcio de exame)

12.25 A quantidade de lixo produzido, por semana, em cada lar da cidade LIMCITY (em Kg) e umavariavel aleatoria X, de distribuicao Normal com desvio padrao 10Kg.

(a) Estamos interessados em estimar pontualmente a media da quantidade de lixo produzidosemanalmente em cada lar desta cidade. Explique como o podemos fazer.

(b) Queremos agora estimar a media da quantidade de lixo produzido semanalmente em cadalar desta cidade atraves de um intervalo de confianca a 95%, com base numa amostraaleatoria de dimensao n seleccionada da populacao:

(i) Deduza tal intervalo de confianca, justificando convenientemente.

(ii) Qual deve ser o tamanho da amostra aleatoria a utilizar de forma a que o intervalo deconfianca que deduziu acima tenha uma amplitude inferior a 5Kg.

(c) Numa outra cidade vizinha, a SUJCITY, a quantidade de lixo domestico produzido por se-mana e uma variavel aleatoria Y , de distribuicao Normal com desvio padrao 15Kg. Sabemosque as quantidades de lixo produzido nas duas cidades sao independentes.

Estamos interessados em testar a hipotese de a media da quantidade de lixo produzidosemanalmente em LIMCITY ser identica a media da quantidade de lixo produzido sem-analmente em SUJCITY. Para tal, numa qualquer semana, seleccionaram-se aleatoriamente25 lares de LIMCITY tendo-se registado um total de

∑25i=1 xi = 750Kg de lixo produzido.

Seleccionaram-se tambem 20 lares de SUJCITY, numa semana qualquer, tendo-se registadoum total de lixo produzido de

∑20i=1 yi = 800Kg. Teste a hipotese formulada, usando um

nıvel de significancia de 10%, justificando convenientemente todos os passos empregues.

Page 197: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 195

(d) Num teste de hipoteses para a diferenca de medias, como o efectuado na alınea anterior, qualo efeito de se diminuir o nıvel de significancia do teste? Existe vantagem nessa diminuicao?

(Exercıcio de exame)

12.26 O Sr. Ze gaba-se de conseguir, atraves do seu olfacto, detectar se ha ou nao excesso de monoxidode carbono (MO) na sua garagem.

(a) Em 100 dias seleccionados ao acaso verificou-se, atraves de um aparelho de medicao de MO,que o Sr. Ze acertou o seu veredicto sobre a quantidade de MO na sua garagem em 89 dasvezes.

Usando estes dados, deduza e determine um intervalo de confianca a 98% para a verdadeiraproporcao das vezes que o Sr. Ze acerta neste seu veredicto. Comente o resultado. Comopoderia obter um intervalo de confianca mais preciso?

(b) Mais do que emitir este veredicto o Sr. Ze gaba-se de conseguir, atraves do seu olfacto,indicar a verdadeira concentracao de MO na sua garagem. Assim, em 6 dias seleccionadosao acaso, registaram-se as diferencas entre o valor avancado pelo Sr. Ze e o verdadeiro valorregistado pelo aparelho de medicao (ppm):

1 5 6 2 3 4

(i) Estime pontualmente o desvio padrao destas diferencas.

(ii) Teste, usando um nıvel de significancia de 5%, se o desvio padrao destas diferencase inferior a 2 (percebendo desta forma se o Sr. Ze tem uma prestacao homogenea).Indique eventuais pressupostos que tenha de fazer.

(iii) Explique o que entende por nıvel de significancia de um teste.

(Exercıcio de exame)

12.27 A empresa LIMPEX garante que produz detergente lıquido com uma viscosidade media de 8Pa.s (pascal segundo) a 25oC. Uma associacao de defesa do consumidor decidiu analisar essedetergente para verificar se tal afirmacao e correcta. Com esse objectivo, recolheu uma amostrade 32 embalagens de detergente (cada uma proveniente de um lote diferente), da qual obteveuma viscosidade media de 8.02 Pa.s e um desvio padrao de 0.24 Pa.s.

(a) Estime pontualmente a media e o desvio padrao da viscosidade deste detergente.

(b) Estara a empresa a enganar os consumidores? Justifique a resposta atraves de um testeestatıstico, realizado ao nıvel de significancia de 1%. Justifique detalhadamente todos ospassos que empregar. Determine ainda o “p-value” do teste realizado.

(c) Discuta a pertinencia do seguinte: supondo que na alınea anterior nao rejeitamos a hipotesenula aı formulada entao isso significa que provamos que essa hipotese e verdadeira.

(d) Deduza e determine um intervalo de confianca a 90% para o desvio padrao da viscosidadedeste detergente. Indique eventuais pressupostos que tiver de fazer.

(Exercıcio de exame)

12.28 A empresa PELEX comercializa produtos feitos em pele de vaca e ovelha. Esta empresa criouum ındice de satisfacao dos seus clientes, X, que se distribui normalmente. De forma a poderavaliar se este ındice ultrapassa o valor medio de excelencia 25, seleccionaram-se ao acaso 16clientes para os quais se determinou o valor do referido ındice, tendo resultado em:

Page 198: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 196

16∑

i=1

xi = 416

16∑

i=1

(xi − x)2 = 3603.7

(a) Estime pontualmente o ındice de satisfacao medio e indique duas propriedades docorrespondente estimador.

(b) Teste, usando estes dados, a pretensao de excelencia da empresa. Detalhe todos os passosque der e conclua recorrendo ao “p-value” do teste.

(c) Diga como poderıamos validar o pressuposto de que este ındice segue distribuicao normal.

(d) A empresa esta ainda interessada em saber qual a proporcao de clientes que compra apenasartigos de pele de vaca. Como tal seleccionou aleatoriamente 120 clientes tendo verificadoque, destes, 45 so compravam artigos destes. Deduza e calcule um intervalo de confiancaa 95% para a referida proporcao.

(Exercıcio de exame)

12.29 A populacao das estaturas dos alunos da FCT, em metros, segue uma distribuicao normal.Recolheu-se a seguinte amostra aleatoria de estaturas de 40 alunos desta faculdade:

1.79 1.80 1.72 1.82 1.57 1.78 1.78 1.66 1.78 1.80 1.75 1.74 1.60 1.77 1.82 1.82 1.75 1.66

1.84 1.77 1.78 1.78 1.69 1.78 1.52 1.72 1.84 1.65 1.71 1.79 1.76 1.70 1.63 1.71 1.70 1.64

1.59 1.63 1.74 1.71,

correspondendo a uma media amostral de 1.73 e a um desvio padrao amostral de 0.08.

(a) Diga o que entende por estimador pontual e estimativa pontual. Estime pontualmente, combase nesta amostra, as verdadeiras estatura media populacional e variancia populacional.

(b) Deduza um intervalo de confianca a 92% para a estatura media populacional.

(c) Assuma agora que conhece o desvio padrao populacional, σ = 0.1m. Qual deve ser adimensao da amostra para que a amplitude de um intervalo de confianca a 92% para amedia seja no maximo 0.05m?

(d) Teste a hipotese de que a verdadeira proporcao de alunos com estatura superior ou iguala 1.82m nesta populacao, digamos p, e maior que 0.2 (20%). Use um nıvel de significanciade 5% e justifique o procedimento empregue.

(Exercıcio de exame)

12.30 Foram efectuados estudos em Los Angeles com o objectivo de determinar a concentracao demonoxido de carbono (CO) perto de vias rapidas. Para isso recolheu-se uma amostra de 20pequenos volumes de ar, para os quais se determinaram a respectiva concentracao de CO (empartes por milhao, ppm), usando um espectrometro. Tais medicoes resultaram numa media devalores de 100.5ppm com variancia de 27.5ppm2, tendo-se verificado que em 5 das medicoes aconcentracao observada ultrapassava os 110ppm!

(a) Teste a hipotese de a concentracao esperada de CO ser superior a 110ppm, indicando even-tuais pressupostos que tenha de fazer. Use um nıvel de significancia de 10% e justifiqueconvenientemente o procedimento empregue.

Page 199: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 197

(b) Deduza um intervalo de confianca a 95% para a variancia da concentracao de CO napopulacao. Indique os pressupostos necessarios.

(c) Responda, sem efectuar qualquer calculo ou deducao, quais as diferencas que esperaque existam entre o intervalo de confianca pedido na alınea anterior e um intervalo deconfianca a 99% para a variancia populacional da concentracao. Justifique.

(d) Estime pontualmente a proporcao de vezes que a concentracao de CO ultrapassa 110ppm.Indique outra forma de estimacao que poderia usar para esta proporcao.

(Exercıcio de exame)

Page 200: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 13

Solucoes dos exercıcios propostos

Capıtulo 1

1.1 (a)

Classe Freq. rel. Freq. rel. acum.i f∗

i F ∗i

0 0.06 0.061 0.19 0.242 0.32 0.573 0.26 0.824 0.12 0.945 0.06 1.00

(b) 57%; 2 erros.

(c) x = 2.37 erros; s = 1.24 erros; c.v. = 52.4%.

1.2 (a) Natureza discreta. No entanto agrupamos os dados em classes intervalares, visto os dadostomarem muitos valores distintos.

Classe Freq. abs. Freq. abs. acum. Freq. rel. Freq. rel. acum.i fi Fi f∗

i F ∗i

[170;255] 9 9 0.45 0.45]255;340] 6 15 0.30 0.75]340;425] 4 19 0.20 0.95]425;510] 0 19 0.00 0.95]510;595] 0 19 0.00 0.95]595;680] 1 20 0.05 1.00

(b) Sim, o valor 680.

(c) x = 287.05; Me = 277; Mo = 300; Q1 = 205; Q3 = 303.

(d) s = 113.97; c.v. = 39.7%.

(e) A aparente assimetria destes dados deve-se a presenca do outlier atras mencionado.

198

Page 201: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 199

1.3 (a)

Classe Freq. rel. Freq. rel. acum.i f∗

i F ∗i

]6.0;7.0] 0.11 0.11]7.0;8.0] 0.11 0.22]8.0;9.0] 0.06 0.28]9.0;10.0] 0.22 0.50]10.0;11.0] 0.22 0.72]11.0;12.0] 0.22 0.94]12.0;13.0] 0.06 1.00

(b) x = 9.9s; Me = 10.25s; Mo = 7.75s; Q1 = 8.30s; Q3 = 11.60s.

(c) s = 1.83s; c.v. = 18.45%.

1.4 (b) Nao.

(c) Por exemplo x = 24.5 anos; Me = 22.9 anos e s = 9.88 anos; c.v. = 40.4%.

1.5 (a)

Classe Freq. rel. Freq. rel. acum.i f∗

i F ∗i

]580;1100] 0.36 0.36]1100;1620] 0.33 0.69]1620;2140] 0.08 0.78]2140;2660] 0.08 0.86]2660;3180] 0.06 0.92]3180;3700] 0.03 0.94]3700;4220] 0.06 1.00

(b) 36 %.

(c) x = 1604.22e; Me = 1245e; Duas modas, 1100e e 1790e; Q1 = 1040e; Q3 = 1790e;s = 895.27e.

(d) Sk = 1.204. Enviesamento para a direita.

1.6 (a)

Classe, i fi Fi f∗i F ∗

i

[160;175] 5 5 0.20 0.20]175;190] 8 13 0.32 0.52]190;205] 5 18 0.20 0.72]205;220] 4 22 0.16 0.88]220;235] 2 24 0.08 0.96]235;250] 1 25 0.04 1.00

(c) x = 192.28; Me = 188; Tres modas: 160; 164; 181.

1.7 (a) Por exemplo:

Classe, i fi Fi

[0;8] 6 6]8;16] 7 13]16;24] 11 24]24;32] 3 27]32;40] 2 29]40;48] 1 30

(c) Por exemplo, x = 18.5 min; Me = 18 min; 5 min e 18 min sao os valores que se repetemmais vezes.

Page 202: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 200

Capıtulo 2

2.1 (a) Se os dados nao forem distinguıveis:

Ω=(1,1),(1,2),(1,3),(1,4),(2,2),(2,3),(2,4),(3,3),(3,4),(4,4); S = P(Ω).

Se os dados forem distinguıveis:

Ω=(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2)(3,3),(3,4), (4,1),(4,2),(4,3),(4,4);S = P(Ω).

(b) Se os dados nao forem distinguıveis:

”Sair um unico 4”→ (1,4), (2,4), (3,4);”Sair pelo menos um 4”→ (1,4), (2,4), (3,4), (4,4);”Sair no maximo um 4”→ (1,1), (1,2),(1,3),(1,4),(2,2),(2,3),(2,4),(3,3),(3,4);Se os dados forem distinguıveis:

”Sair um unico 4”→ (1,4), (2,4), (3,4), (4,1), (4,2), (4,3);”Sair pelo menos um 4”→ (1,4), (2,4), (3,4), (4,1), (4,2), (4,3), (4,4);”Sair no maximo um 4”→ (1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3).

2.2 2730.

2.3 (a) 384.

(b) 1152.

(c) 2880.

(d) 1152.

2.4 (a) 207360.

(b) 8709120.

2.5 455.

2.6 (a) 3003.

(b) 1120.

(c) 560.

(d) 225.

2.8 (a) 1/6.

(b) 1/2.

(c) 1/3.

2.9 (a) 1/10.

(b) 1/4.

(c) 1/40.

(d) 13/40.

2.10 (a) 5.85×10−7.

(b) 0.70.

(c) 0.06.

Page 203: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 201

(d) 4.72×10−9; 1.18×10−9.

2.11 P(ımpar)=1/3; P(par)=2/3.

2.12 (a) 2/7.

(b) 1/7.

(c) 6/7.

2.13 (a) 2.19 × 10−6.

(b) 2.79 × 10−6.

(c) 1.48 × 10−5.

2.14 (a) 16 .

(b) 13 .

(c) 12 .

2.15 P (A ∪B ∪ C) = 5/8.

2.16 P (A−B) = 1/3; P (A ∪B) = 5/6; P (A ∪ B) = 2/3; P (A ∩B) = 1/6; P (A ∪ B) = 5/6.

2.17 (a) 0.7.

(b) 0.3.

2.18 (a) 2/5.

(b) 1/5.

(c) 4/15.

(d) 7/15.

2.19 (a) 0.5; 0.375.

(b) 0.55.

2.20 (a) 0.475.

(b) 0.147.

2.21 (a) 0.88.

(b) 0.511(6).

2.22 (a) 0.65248.

(b) 0.998.

2.23 (a) 0.60.

(b) 0.40.

2.24 0.8.

2.26 0.02304.

2.27 (a) 0.0005.

(b) 0.0495.

Page 204: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 202

(c) 0.0595.

2.28 Verdade. Basta que A e B sejam acontecimentos incompatıveis.

2.29 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Verdade.

P (A ∪B ∪C) = P (A) + P (B) + P (C)− P (A ∩B)− P (A ∩ C)− P (B ∩ C) +

+ P (A ∩B ∩ C) = (Porque A ⊆ B ⊆ C)

= P (A) + P (B) + P (C)− P (A)− P (A)− P (B) + P (A) = P (C).

(b) Falso. P(“PROVA”)=Casos favoraveisCasos possıveis

= 1A23

5= 1

23×22×21×20×19 .

(c) Falso. P (B|A) = P (B∩A)P (A)

= P (B−A)1−P (A) = P (B)−P (A∩B)

1−P (A) = 0.25.

(d) Verdade. P(“3 exames em dias consecutivos”)=Casos favoraveisCasos possıveis

= 3C3

5= 3

10 .

(e) Verdade.

P(“Defeito grave”|“Defeito”)=P (“Defeito grave”∩“Defeito”)

P(“Defeito”)=

P(“Defeito grave”)P(“Defeito”)

=225825

=

14 .

(f) Falso.

E - “Estudar”; Ps - “Passar”;

P (E) = 0.80; P (Ps|E) = 0.85; P (P s|E) = 1

P (E|P s) = 0.625.

(g) Falso. P (A ∩ B) = P (A ∪B) = 1− P (A ∪B) = 1− x+ y.

(h) Falso. P(“Soma menor que 3”)=Casos favoraveisCasos possıveis

= 2C6

2= 2

15 .

(i) Verdade. Assumindo que os sorteios se processam de forma independente temos que:

P(“Ganhar pelo menos 1 premio”)=1-P(“Nao ganhar nenhum premio”)=1 −(

99100

)20 '0.182.

(j) Falso.

Li - “Venda da loja i”, i = 1, 2, 3; D - “Dıvida incobravel”;

P (L1) = P (L2) e P (L3) = 2P (L1). Como P (L1) + P (L2) + P (L3) = 1, entao P (L1) =P (L2) =

14 e P (L3) =

12

P (D|L1) = 0.06; P (D|L2) = 0.10; P (D|L3) = 0.12

P (D) = 0.1.

(k) Falso.

P(“Em 5 pessoas escolhidas ao acaso todas terem sangue tipo A”)=Casos favoraveisCasos possıveis

=

C125

C255

' 0.0149.

(l) Falso.

Ps - “Passar”; S - “Subornar”;

P (Ps|S) = 0.6; P (Ps|S) = 0.8; P (S) = P (S) = 12

P (S|Ps) ' 0.57.

Page 205: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 203

(m) Verdade. Assumindo que as devolucoes se processam de forma independente temos que:

P(“No maximo ser devolvido 1 par de aliancas em 10 vendidos”)=P(“Ser devolvido 0 ou 1par de aliancas em 10 vendidos”)=C10

0 × 0.10 × 0.910 + C101 × 0.11 × 0.910 ' 0.74.

(n) Verdade.

A - “Piriquito amarelo”; V - “Piriquito verde”; M - “Piriquito malhado”; C- “Comer”;

P (A) = P (V ) = P (M) = 13

P (C|A) = 0.3; P (C|V ) = 0.2; P (C|M) = 0.1

P (A|C) = 0.5.

(o) Falso.

L - “Profissional liberal”; I - “Pagar os impostos voluntariamente”;

P (L) = 0.7; P (I|L) = 0.6 ⇔ P (I|L) = 0.4; P (I|L) = 0.9 ⇔ P (I |L) = 0.1

P (L|I) ' 0.903.

(p) Falso.

P(“pelo menos um caramelo, pelo menos um bombom recheado com cerejas, pelo menosuma trufa e pelo menos um chocolate de passas em 5 doces seleccionados ao acaso”)=Casos favoraveisCasos possıveis =

C51×C5

1×C51×C5

1×C461

C505

' 0.014.

(q) Verdade.

A - “Botoes da maquina A”; B - “Botoes da maquina B”; C - “Botoes da maquinaC”; D - “Botao defeituoso”;

P (A) = 0.15;P (B) = 0.25;P (C) = 0.6;

P (D|A) = 0.05; P (D|B) = 0.07; P (D|C) = 0.04

P (B|D) ' 0.36.

(r) Falso.

E - “Efeitos secundarios”; C - “Crianca”;

P (E|C) = 0.2; P (E|C) = 0.1;

P (C) = 0.15

P (C|E) ' 0.74.

(s) Verdade. Porque P (A ∩ B) = P (A)P (B) os acontecimentos sao independentes. ComoP (A ∩B) 6= 0 entao os acontecimentos nao sao incompatıveis.

(t) Falso.

A - “Aviao atrasa”; C - “Chove”;

P (A|C) = 0.6; P (A|C) = 0.2;

P (C) = 0.4

P (A) = 0.64.

(u) Falso.

P(“1 aluno ter recebido o enunciado A, 2 alunos terem recebido o enunciado B e 3 alunos

terem recebido o enunciado C, em 6 alunos seleccionados ao acaso de 45”)= Casos favoraveisCasos possıveis

=

C101 ×C15

2 ×C203

C456

' 0.15.

(v) Falso.

G1 - “Grava o vıdeo 1”; G2 - “Grava o vıdeo 2”;

Page 206: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 204

P (G1) = 0.7; P (G2) = 0.6

Assumindo independencia entre o comportamento dos vıdeos temos que:

P(“Nao ver o jogo”)= P (G1 ∩ G2) = P (G1)P (G2) = 0.12.

(w) Falso.

E - “Estagiario recrutado na FCT”; AC - “Aceder a cargos de chefia”;

P (AC) = 0.2;

P (AC|E) = 0.75; P (AC|E) = 0.15;

P (AC) = 1− P (AC) = 0.73 mas P (E|AC ' 0.56).

(x) Falso.

M - “Crianca do sexo masculino”; C - “Crianca canhota”;

P (M) = 0.5 P (C) = 0.2;

Como M e C sao acontecimentos independentes, P (C|M) = P (C) = 0.2.

2.30 (a) P(“Acertar no numero correcto”)=Casos favoraveisCasos possıveis

= 110×10 = 0.01.

(b) P (A∪B) = P (A)+P (B)−P (A∩B) ⇔ P (A∩B) = 0.12. Consequentemente, P (A∩B) =P (A)P (B), pelo que A e B sao acontecimentos independentes.

2.31 (a) S - “Ano seco”; MS - “Ano muito seco”; N - “Ano normal”;

Pj - “Prejuızo significativo”;

P (Pj|S) = 0.5; P (Pj|MS) = 0.9; P (Pj|N) = 0.1;

P (S) = 0.4; P (MS) = 0.2; P (N) = 0.4

P (Pj) = 0.42.

(b) P (N |Pj) ' 0.095

2.32 (a) A - “Atacante”; M - “Medio”; D - “Defesa”;

G - “Golo de penalty”;

P (A) = 830 ; P (M) = 12

30 ; P (D) = 1030 ;

P (G|A) = 34 ; P (G|M) = 1

2 ; P (G|D) = 15

P (G) = 715 .

(b) P (M |G) = 37

2.33 V - “Maca verde”; A - “Maca amarela”; E - “Maca encarnada”;

D - “Maca danificada”;

P (V ) = 0.1; P (A) = 0.4; P (E) = 0.5;

P (D|V ) = 0; P (D|E) = 0.5; P (D|A) = 0.2

P (A|D) ' 0.24

2.34 (a) Q - “Profissional qualificado”;

RP - “Resolucao de problema inesperado”;

P (RP |Q) = 0.96; P (RP |Q) = 0.78;

P (Q) = 6−26 ; P (Q) = 2

6

P (Q|RP ) ' 0.71.

Page 207: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 205

(b) n - numero de operacionais qualificados na equipe.

Determinacao de n tal que P (RP ) = 0.9:

P (Q) = nn+2 ; P (Q) = 2

n+2 ;

P (RP ) = 0.9 ⇔ P (RP |Q)P (Q) + P (RP |Q)Q) = 0.9 ⇔ 0.96 × nn+2 + 0.78 × 2

n+2 = 0.9 ⇔n = 4.

2.35 R - “Rua estar equipada com radar”;

C - “Jose usar a rua C”;

D - “Jose usar a rua D”;

P (R) = 14 ;

P (C|R) = 12 ; P (C|R) = 1

8 ;

P (D|R) = 14 ; P (D|R) = 1

8 ;

Porque o Jose nunca usa as duas ruas em simultaneo:

P (C ∪D) = P (C) + P (D) = 38 .

Capıtulo 3

3.1 (a) p=0.3; q=0.2.

(b)

F (x) =

0, x < 00.3, 0 ≤ x < 10.5, 1 ≤ x < 20.7, 2 ≤ x < 31, x ≥ 3

3.2 (a) i) 1/4.

ii) 1/12.

iii) 5/12.

iv) 1/4.

(b)

X

1 2 4 5 61/6 1/12 1/4 1/12 5/12

(c) Nao.

(d) 5/9.

3.3 (a) 0.4.

(b) 0.25.

3.4 (a)

Y

−20000 −10000 0 10000 200000.25 0.30 0.25 0.10 0.10

Page 208: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 206

(b)

Z

−30000 −15000 0 15000 300000.25 0.30 0.25 0.10 0.10

3.5 P (X = x) = 0.4× 0.6x−1, x = 1, 2, 3, . . .

3.6 (a) k=1.

(b)

F (x) =

0, x < −1(x+1)2

2 , −1 ≤ x < 0

1− (x−1)2

2 , 0 ≤ x < 11, x ≥ 1

(c) 1/2.

(d) 1/4.

3.7 (a) k =√2/2.

(b)

F (x) =

0, x < 0

2x2, 0 ≤ x <√2/2

1, x ≥√2/2

(c) 7/72.

3.8 (a) 0.3834.

(b) 0.6321.

(c) 0.3679.

3.9 (a)

F (x) =

0, x < 012 −

cos(x)2 , 0 ≤ x < π

1, x ≥ π

(b) a = π2 - mediana.

(c)√3−

√2√

3−1' 0.434.

3.10 (a)

F (x) =

0, x < 03x2 − 2x3, 0 ≤ x < 1

1, x ≥ 1

(b)

L

1.5 4.0 8.5 11.50.5 0.472 0.02075 0.00725

3.11 Verdade. Como a funcao distribuicao se define a custa da probabilidade acumulada F (x) =P (X ≤ x), x ∈ R, o seu contradomınio esta sempre contido no conjunto [0, 1], limitado. (Asprobabilidades sao quantidades que variam entre 0 e 1, inclusive).

Page 209: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 207

Capıtulo 4

4.1 (a)

X

0 1 20.25 0.65 0.10

(b) 0.1(3).

(c) 0.85 cafes; 0.3275.

4.2 E [X] = 3/2; V (X) = 3/4; E [X3] = 27/4; E[

11+X

]

= 15/32; E [X2] = 3.

4.3 Vp(X) = −p2

4 + p8 + 63

64 , mınima para p = 0 ou p = 1/2.

4.4 (a)

X

0 2500 250000.9989 0.001 0.0001

(b) 0.9989.

(c) 0.0011.

(d) E [X] = 5u.m., V (X) = 68725u.m.2 e c.v.(X) = 5243.09%

4.5 Comprar a B.

4.6 (a)

f(x) =

0, x < 0xe−x, x ≥ 0

(b) E [X] = 2; V(X) = 2.

4.7 E [X] = 3/2; E [X − 1] = 1/2; V (X) = 5/12; E [X(X − 1)] = 7/6; E [eX ] ' 5.489; me = 3/2;c.v.(X) = 43.03%.

4.8 (a) k=1/2.

(b) π/2.

(c) π2/2− 2.

(d) 0.

(e) 25π2/4− 50.

4.10 (a) 0.08.

(b) 0.95.

(c) E [X] = 4h; me = 2.77h; mo = 0h; V(X) = 16h2; c.v.(X) = 100%.

(d) E [X] = 6h; me = 4.16h; mo = 0h; V(X) = 36h2; c.v.(X) = 100%.

4.11 (a) 1/3.

(b) E[X] = 1.5h.

(c) E[40 + 3√X] ' 43.5e.

Page 210: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 208

4.12 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Verdade.

X

5 6 7 100.4 0.2 0.3 0.1

⇒ E[X] = 6.3.

(b) Falso. Esta situacao e possıvel. Apenas indica que muitos alunos tiveram notas muito baixas(50% tem notas ≤ 4 valores), mas houve ainda notas grande o suficiente para “puxar” amedia para os 9 valores.

(c) Falso. A variancia de uma variavel aleatoria, sendo definida como E [(X−E [X])2], e semprenao negativa, desde que exista.

(d) Verdade. A media, sendo o centro de massa dos pontos a que corresponde, verifica-se serproxima para os valores observados das duas variaveis (algures entre 0 e 5). Quanto avariancia, verifica-se que os pontos observados da variavel X2 estao muito mais dispersosem torno da sua media (variando entre -10 e 10) enquanto que os pontos observados daoutra variavel sao muito menos dispersos em torno da sua media(entre 0 e 5). Entao aosprimeiros pontos deve corresponder uma maior variancia.

4.13 (a)

X

−5 103/4 1/4

(b) E[X] = −1.25e. Nao deve aceitar jogar pois em media perde 1.25e.

4.14 (a) 14 .

(b) P (Y ≤ 1) = P (X2 ≤ 1) = P (−1 ≤ X ≤ 1) = 13 .

(c) E [Y ] = 4; V(Y ) = 19.2.

Capıtulo 5

5.1 (a)

X

1 2 31/2 3/8 1/8

Y

2 4 65/16 7/16 1/4

(b) Nao.

(c) 11/16; 5/8.

(d) E [X] = 13/8; E [Y ] = 31/8; V (X) = 31/64; V (Y ) = 143/64; Cov(X,Y ) = 5/64; V (X +Y ) = 23/8.

5.2 (a) 0.30.

(b)

X + Y

1 2 3 40.2 0.45 0.15 0.2

Page 211: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 209

5.3 (a)

X\Y 0 1 2 3 P (X = x)

0 0.12 0.06 0.18 0.24 0.61 0.08 0.04 0.12 0.16 0.4

P (Y = y) 0.2 0.1 0.3 0.4 1

(b) E [X] = 0.4; E [Y ] = 1.9; σX ' 0.49; σY ' 1.14.

(c) 0.

5.4 (a)

X\Y 0 1

0 0 0.2 0.21 0.2 0.1 0.32 0.15 0.15 0.33 0.15 0.05 0.2

0.5 0.5 1

(b) 0.7.

(c) 0.4.

(d) Nao sao independentes.

5.5 (a) k=1/4.

(b) a=4.

(c) 3/2.

5.6 (a)

X\Y 0 1

0 0.72 0.06 0.781 0.08 0.14 0.22

0.8 0.2 1

(b) Nao e independente.

(c) 0.06.

(d) P (X + Y < 2) = 0.86.

5.7 (a)

X\Y 0 1

0 0.50 0.05 0.551 0.25 0.1 0.352 0.05 0.05 0.1

0.8 0.2

(b) 50%, 55%, 80%. Nao ha independencia.

(c) 0.34.

5.8

X\Y 0 1 2

0 0.35 0.14 0.21 0.71 0.15 0.06 0.09 0.3

0.5 0.2 0.3 1

5.9 (a)√2/2.

(b) 10σ2.

(c) −σ2.

5.11 (a) k=2/3.

Page 212: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 210

(b)

f(x) =

23 (x+ 1), 0 < x < 1

0, c.c.f(y) =

23

(

12 + 2y

)

, 0 < y < 10, c.c.

(c) Nao.

(d) 13/75.

(e) P (X < Y ) = 5/9.

(f) 0.18.

5.12 (a) k=1/2.

(b) Nao.

5.13 (a) Falso. Pode acontecer que duas variaveis nao sejam independentes mas tenham covariancianula. O recıproco e que nao pode acontecer.

(b) Falso. A covariancia pode ser negativa. Por exemplo, sendo X uma variavel aleatoria,cov(X,−X) = −cov(X,X) = −V(X) ≤ 0 (ja que V(X) ≥ 0).

5.14 (a) Falso. cov(X,X) = V(X) = σ2.

(b) Falso. cov(Y1, Y2) = cov(X1+X2, 2X1) = 2cov(X1,X1)+2cov(X2,X1) = 2V(X1)+0 = 2σ2.(Nota: Porque X1 e X2 sao independentes entao cov(X2,X1) = 0).

(c) Verdade. Porque X e Y sao variaveis aleatorias independentes, P (X = x|Y = 2) = P (X =

x) =

0.82, x = 02× 0.2× 0.8, x = 10.22, x = 2

(d) Falso. ρ(X,Y ) = cov(X,Y )√V (X)V (Y )

⇔ ρ(X,Y )cov(X,Y ) =

V (X)V (Y ), podendo esta raiz (e por isso o

quociente) tanto ser maior como menor que 1.

5.15 (a)

X\Y 0 1 2

0 1/2 1/12 1/12 2/31 0 1/4 1/12 1/3

1/2 1/3 1/6

(b) 0.

(c)

X

0 12/3 1/3

F (x) = P (X ≤ x) =

0, x < 02/3, 0 ≤ x < 11, x ≥ 1

(d) E [X] = 1/3; E [Y ] = 2/3.

(e) cov(X,Y ) = 7/36. Sendo positiva significa que as variaveis estao positivamente associadase nao podem ser independentes.

Page 213: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 211

5.16 (a)

F (x) = P (X ≤ x) =

0, x < 00.25, 0 ≤ x < 10.75, 1 ≤ x < 21, x ≥ 2

(b) 0.75.

(c) P (X ≤ 1|Y = 1) = 0.75. Como esta probabilidade iguala P (X ≤ 1), tal parece indicarhaver independencia entre X e Y .

(d) 3; 0.5; 1.26 (porque X e Y sao independentes).

5.17 (a) 0.3; 0.

(b)

X\Y 6 7 8 9

1 0.4 0 0 0 0.42 0 0.3 0 0 0.33 0 0 0.2 0 0.24 0 0 0 0.1 0.1

0.4 0.3 0.2 0.1 1

(c) 1. Era de esperar este resultado ja que X e Y se relacionam atraves de uma recta.

(d) 2 pacientes; 50%.

5.18 (a) 0.75. Perdem-se muitos faxes!

(b) 1.4 faxes; 0.45 faxes. O numero medio de faxes enviado e quase o triplo do numero defaxes recebidos - perdem-se, em media, muitos faxes!

(c) ρ(X,Y ) ' 0.24. Fraca associacao linear positiva.

(d) 0.125.

(e) X e Y nao sao independentes ja que, por exemplo, a correlacao entre ambas nao e nula.

5.19 (a)

X\Y 0 1 2

0 1/9 1/9 0 2/91 2/9 1/9 1/9 4/92 0 2/9 1/9 3/9

1/3 4/9 2/9 1

X

0 1 22/9 4/9 3/9

Y

0 1 21/3 4/9 2/9

(b) Nao sao independentes ja que nao acontece que para ∀(x, y), P (X = x, Y = y) = P (X =x)P (Y = y). Basta escolher, por exemplo, x = 2 e y = 0 para verificar isso mesmo.

(c) P (X > Y ) = 49 .

(d) 13 .

(e) cov(X,Y ) = 1981 .

Page 214: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 212

5.20 (a)

X\Y 0 1 2

0 0.3 0.2 0.1 0.61 0.1 0.1 0.0 0.22 0.1 0.0 0.1 0.2

0.5 0.3 0.2 1

X

0 1 20.6 0.2 0.2

Y

0 1 20.5 0.3 0.2

(b) P (X > 0|Y = 0) = 0.4.

(c) ρ(X,Y ) ' 0.128. Associacao linear positiva fraca.

(d)

X + Y

0 1 2 40.3 0.3 0.3 0.1

Capıtulo 6

6.1 0.6164.

6.2 (a) 0.1297.

(b) 0.8295.

(c) 0.4357.

(d) 8.5 praias.

6.3 (a) 0.1291.

(b) 0.3874.

6.4 (a) 0.1074.

(b) 1.024 × 10−7.

(c) 0.8926.

6.5 0.1035; 1.25 respostas; 0.9682 respostas.

6.6 (a) 0.0769.

(b) 0.2025.

(c) 0.2794.

(d) 2.5 copos; 1.5411 copos.

6.7 P (X = x) = C4x

(

23

)x (13

)4−x, x = 0, 1, 2, 3, 4.

6.8 0.0748 (soma de Binomiais independentes).

6.9 0.0351 (distribuicao aproximada).

6.10 0.0090 (distribuicao aproximada).

6.11 0.032 (assume-se independencia entre lancamentos do dardo).

Page 215: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 213

6.12 0.0294.

6.14 (a) 0.2846.

(b) 0.2699.

(c) 0.8752.

(d) 0.1248.

(e) 1.9 chamadas; 1.3774 chamadas.

6.15 0.2636; 0.1041.

6.16 (a) 3.9754 × 10−31 ' 0.

(b) 0.0024.

(c) 70 visitas; 11.95%.

6.17 0.1137.

6.18 Assumindo distribuicao Poisson:

(a) 0.0988.

(b) 0.1219.

6.19 (a) 0.066.

(b) Seja Y o prejuızo do armazem, por mes e por empregado (e).

Y

0 0.4 0.8 1.20.223 0.335 0.251 0.191

E [Y ] = 0.564e σ = 0.414e

6.20 0.9084 (distribuicao aproximada); 4 enganos.

6.21 0.0097 (distribuicao aproximada).

6.22 0.271; 0.323 (distribuicao aproximada).

6.23 (a) X ∼ Uniforme[9, 12]; 10.5h; 0.866h.

(b) 9.3h.

(c) 0.0412.

6.24 (a) X ∼ Uniforme[0, 1]:

f(x) =

1, x ∈ [0, 1]0, c.c.

(b) 0.2.

(c) 0.5m; 57.735%.

(d) 0.2.

Page 216: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 214

6.25 (a)

F (x) =

0, x < 0

1− e−x/3, x ≥ 0

(b) 0.1889.

(c) 0.3679.

(d) 0.3679 = P (X > 3) - Propriedade da falta de memoria da exponencial.

(e) 100%.

6.26 (a) 0.7769.

(b) 100h; 100h.

(c) 7.4227 × 10−7.

6.28 (a) 0.8944.

(b) 0.2266.

(c) 0.9544.

6.29 (a) 10.1898.

(b) 12.9475.

(c) 2.7719.

6.30 (a) 32.56%.

(b) 68.26%.

(c) 23.52.

(d) 62 pessoas.

6.31 17.28m.

6.32 (a) 0.051Kg.

(b) 0.023.

6.33 6.92.

6.34 1.968m.

6.35 (a) 5.1984 × 10−4.

(b) 0.5.

(c) 0.9868.

6.36 (a) 0.6877.

(b) 0.9172.

(c) 0.7764.

6.37 (a) 0.692.

(b) -1.761.

(c) 0.868.

Page 217: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 215

6.38 (a) 18.31.

(b) 3.94.

6.39 (a) P (3 < X < 7) = 0.9544.

(b) h : P (Y > h) = 0.025 ⇔ h = 13.92.

(c) P (X +W > Y ) = 0.7486.

6.41 Falso.

X - Numero de porcos rosa no conjunto dos 4 porcos seleccionados;

X ∼ Hiperg(100, 100(1 − p), 4);

P (X = 2) =C100−100p2 C100p

2

C1004

=100(1 − p)(99 − 100p)p(100p − 1)

33× 49× 97.

6.42 (a) 0.423.

(b) 3.44 × 10−5.

(c) i. F (y) =

0, y < 01− e−3y, y ≥ 0

ii. 0.050.

iii. 1/3 dias; 1/3 dias.

6.43 (a) 0.4.

(b) i. 0.1587.

ii. Nao sao independentes.

(c) Y - numero de vezes que se verifica A em 10 provas;

Y ∼ Bin(10, P (A) = 0.9938);

P (Y ≥ 9) ' 0.9983.

6.44 (a) A cada v.a. esta associada uma funcao, a funcao distribuicao, que, em cada ponto, retornaa probabilidade de a v.a. ser menor ou igual que esse ponto.

F (t) =

0, t < 0

1− e−t10 t ≥ 0

(b) 0.05.

6.45 (a) 0.32 (32%).

(b) Y - Numero de barras defeituosas nas 10 inspeccionadas;

Y ∼ Hiperg(100, 32, 10);

W - quantidade de dinheiro realizado na venda;

50× 100 100 × 100P (Y ≥ 1) P (Y = 0)

E [W ] ' 5085e.

Page 218: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 216

(c) 0.5 (Assumindo que os comprimentos das duas barras sao independentes).

6.46 Cov(W,U) = σ2X − σ2

Y . Se σ2X 6= σ2

Y e ambas as variancias forem diferentes de zero entao possoafirmar que, nesse caso, W e U sao dependentes. Caso contrario nao posso afirmar nada.

6.47 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Verdade. X ∼ Hiperg(25, 15, 3) pelo que E [X] = 3 × 1525 e Y ∼ Hiperg(25, 10, 3) pelo que

E [Y ] = 3× 1025 . Entao E [X − Y ] = E [X]− E [Y ] = 0.6.

(b) Verdade. Calculo.

(c) Falsa. X ∼ Geo(0.1).

(d) Falsa. X ∼ Hiperg(5000, 80, 70). No entanto esta distribuicao esta nas condicoes de seraproximada pela Binomial que e dada no enunciado, ja que n

N < 0.1.

6.48 (a) 7.301.

(b) 0.9992.

(c) 0.5.

6.49 (a) R.

(b) P (X < −1) = 0.1587.

(c) P (−1 < X < 1) = 0.6826.

(d) i) P (X < 0) = 0.5.

ii) P (∑10

i=1 Xi < 0) = 0.5.

6.50 f(x) nao e funcao densidade porque∫ +∞−∞ f(x)dx = 1

2 .

Capıtulo 7

7.1 0.0038.

7.2 0.0113.

7.3 0.4602.

7.4 0.9382.

7.5 (a) 0.1587.

(b) 0.0456.

7.6 0.0985.

7.7 0.0636. 0.5636.

7.8 0.8555.

7.9 (a) 0.2389.

(b) 0.3212.

7.10 (a) 0.5878.

Page 219: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 217

(b) 0.0112.

7.11 0.0004.

7.12 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Falso. X - tempo de abertura de uma qualquer porta (s); X ∼ Exp( 130 );

Y - No de portas (nas 300) que se abrem em menos de 10s; Y ∼ Bin(300, p), p = P (X <10) ' 0.28345;

P (Y > 70) ' 0.9732 (distribuicao aproximada).

(b) Verdade. Xi - altura (cm) a que salta a pulga i;

P (∑100

i=1 Xi > 1000) ' 0.5.

(c) Verdade. Xi - no de chocolates vendidos no dia i;

P (∑60

i=1 Xi ≤ 180) ' 0.5.

(d) Falso. Y - no de premios pago pela seguradora (em 2500 produtores segurados);

Assumindo independencia entre os pagamentos, Y ∼ Bin(2500, 0.01).

P (Y ≤ 10) ' 0.0013 (distribuicao aproximada).

(e) Verdade. Xi - no de estrelas cadentes observadas das 21h as 22h no dia i;

P (∑183

i=1 Xi > 913) ' 0.53.

Capıtulo 8

8.1 (a) µ = 1.85, σ2 = 1.4275

(b) X1 e X2 tem a mesma distribuicao de probabilidade de X. Ambos tem media µ = 1.85 evariancia σ2 = 1.4275.

(c) µ = x = 1.6, σ2 = s2 = 2.0(4), SEX = 0.4522.

8.2 (b) θ2 e melhor, pois tem menor variancia (V (θ2) = 0.38σ2) que θ1 (V (θ1) = 0.5σ2). Nao saoconsistentes.

(c) E [X ] = σ2

n + µ2 6= µ.

8.3 E consistente

8.4 (a) E centrado.

(b)λ

n

(

p2 +(1− p)2

2

)

; Variancia mınima para p = 13 .

(c) E consistente.

8.5 0.9429.

8.6 (a) 0.95.

(b) 385.

8.7 0.0023.

8.8 0.9974.

Page 220: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 218

8.9 0.1038.

8.10 (a) 0.409.

(b) 0.9938.

8.11 0.0122.

8.12 0.399.

8.13 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Falso. Por exemplo de X for a media de uma amostra aleatoria (X1, . . . ,Xn) de uma

populacao Normal com σ2 desconhecido, T = X−µS/

√n∼ t(n−1).

(b) Falso. X e melhor estimador que X1 porque, apesar de ambos serem estimadores centradosde λ, V (X) ≤ V (X1) e, alem disso, X e estimador consistente de λ enquanto que X1 naoe.

8.14 X .

8.15 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Falso. Atraves do T.L.C. consegue-se a distribuicao aproximada de X mas esta e normal.A sua distribuicao exacta nao se consegue saber.

(b) Falso. Um estimador centrado e preferıvel a um nao centrado porque, contrariamente aonao centrado, em media esse estimador vale o parametro que estima.

(c) Verdade.

E [P ] = E[

Xn

]

= 1nE [X] = 1

nnp = p (P e estimador centrado de p);

V(P ) = V(

Xn

)

= 1n2V(X) = 1

n2np(1− p) = p(1−p)n

n→∞→ 0 (P e estimador consistente de p);

(d) Falso. X ∼ N(4, 22/5), Y ∼ N(4, 12/5), X independente de Y , X − Y ∼ N(4 − 4, 22/5 +12/5);

P (X > Y ) = 0.5.

(e) Verdade. T e dado como uma combinacao linear de v.a.’s (independentes) normais e comotal segue distribuicao normal.

(f) Falso. SEX = σ2

n 6= σ2, n 6= 1.

(g) Verdade. Para fazer testes de hipotese sobre proporcoes utiliza-se uma estatıstica de testecuja distribuicao aproximada e derivada com recurso ao TLC (acrescentar a explicacao detal - ver sebenta).

(h) Falso. T1 ja que e o unico estimador de µ que e centrado e consistente. T2 nao e estimadorcentrado de µ e T3, apesar de centrado, nao e consistente. T1 e mais eficiente que T3 poistem menor erro quadratico medio. Note-se contudo que T1 pode ou nao ser mais eficienteque T2.

(i) Falso. Uma caracterıstica numerica de uma amostra e um estimador, que serve para estimarparametros (que sao caracterısticas numericas da populacao).

(j) Verdade. Se conhecemos a media de uma populacao nao precisamos fazer conjecturas sobreela (a nao ser por motivos didacticos!).

Page 221: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 219

(k) Verdade. A variabilidade de X e dada por V (X) = σ2

n . Dobrando o n esta variabilidadereduz-se para metade.

(l) Falso.

E [T1] = θ; E [T2] = θ;

Sendo a e b constantes arbitrarias, E [aT1 + bT2] = aE [T1] + bE [T2] = aθ + bθ 6= θ, generi-camente.

(m) Falso. T e estimador centrado de λ mas nao consistente.

Capıtulo 9

9.1 (a) IC90%(µ) ≡ (312.67; 327.33).

(b) 4304; 173.

9.2 (a) IC90%(µ) ≡ (29.3; 42.70); IC95%(µ) ≡ (27.64; 44.36).

(b) IC90%(µ) ≡ (33.7; 38.3); IC95%(µ) ≡ (33.2; 38.8).

9.3 IC99%(µ) ≡ (0.042; 0.26).

9.4 Assumo n > 30 - n ≥ 158.

9.5 IC95%(µ) ≡ (21.04; 23.16).

9.6 IC99%(µ) ≡ (9.273; 10.727).

9.7 191.7; n = 50.

9.8 (a) IC95%(µ) ≡ (0.955; 1.445)

(b) Assumo normalidade. IC95%(µ) ≡ (0.51; 1.69).

9.9 IC95%(µ) ≡ (1.23; 1.37).

9.10 IC90%(µ1 − µ2) ≡ (3.37; 8.63).

9.11 IC95%(µ1 − µ2) ≡ (0.044; 0.156).

9.12 IC98%(p) ≡ (0.09; 0.27).

9.13 (a) P=0.06.

(b) n=6068 (usando P da alınea anterior para estimar a variancia de P).

9.14 IC99%(σ2) ≡ (0.075; 0.573).

9.15 IC95%(σ2) ≡ (990.57; 9384.00); IC95%(σ) ≡ (31.47; 96.87).

9.16 Verdade. Nas condicoes do problema a estatıstica dada segue uma distribuicao N(0, 1) e, naodependendo a sua distribuicao por amostragem de nenhum parametro desconhecido, e umaestatıstica pivot.

9.17 (a) Z = X−µ1/

√n∼ N(0, 1).

(b) IC88%(µ) ≡ (9.10; 9.90).

(c) n = 60.

Page 222: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 220

9.18 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Verdade. A amplitude dos I.C. para a media varia de forma inversa com o tamanho daamostra, ja que esta amplitude e sempre proporcional ao erro padrao de X, SEX , (ou noerro padrao estimado), que por sua vez varia inversamente com o tamanho amostral.

(b) Falso. A amostra deve ser de dimensao superior a 1076.

9.19 (a) x = 35 meses.

(b) IC98%(µ) ≡ (32.7; 37.3).

(c) Esperamos que o verdadeiro tempo medio de residencia nas suas moradas actuais das pes-soas desta cidade esteja compreendido entre 32.7 meses e 37.3 meses - temos uma grandeconfianca que assim e.

(d) Por exemplo aumentando o tamanho amostral - o que diminui a amplitude do IC, aumen-tando assim a precisao da estimacao.

(e) IC90%(σ) ≡ (5.3; 7.7).

9.20 (a) µ = x = 1.5% σ2 = s2 = 0.8.

(b) IC95%(µ) ≡ (0.56; 2.44). Como este I.C. abrange valores acima de 1% tal indica que pos-sivelmente temos em maos uma situacao preocupante.

(c) n = 308.

Capıtulo 10

10.1 (a) H0 : µ = 200 vs H1 : µ 6= 200; R0.05 ≡ (−∞;−1.96)∪(1.96;+∞); zobs = 1.26; Nao rejeitarH0 a 5%.

(b) H0 : µ ≥ 200 vs H1 : µ < 200; R0.05 ≡ (−∞;−1.64); zobs = 1.26; Nao rejeitar H0 a5%. Os dados nao evidenciam que o consumo medio de gelado de chocolate seja menor que200e/dia.

10.2 (a) H0 : µ = 0.9 vs H1 : µ 6= 0.9; R0.01 ≡ (−∞;−3.25)∪ (3.25;+∞); tobs = 0.802; Nao rejeitarH0 a 1%.

(b) H0 : µ ≤ 0.9 vs H1 : µ > 0.9; R0.01 ≡ (2.821;+∞); tobs = 0.802; Nao rejeitar H0 a 1%,pelo que os dados nao evidenciam que a acidez media seja superior a 0.9.

10.3 H0 : µ ≤ 250 vs H1 : µ > 250; zobs = 1.12; p = P (Z > zobs|H0 verdadeira) = 0.1314; Naorejeitar H0 aos usuais nıveis de significancia, pelo que os dados nao indiciam que o biologo tenharazao.

10.4 H0 : µ ≤ 2 vs H1 : µ > 2; tobs = 2.08; p = P (T > tobs|H0 verdadeira) ∈]0.025; 0.05[; Logorejeitar H0 a 5% e 10%, pelo que os dados indicam que Ines parece ter razao.

10.5 H0 : µ = 5000 vs H1 : µ 6= 5000; R0.05 ≡ (−∞;−1.96) ∪ (1.96;+∞); zobs = 25; Rejeitar H0 a5%, indicando os dados um desajuste no referido premio medio.

10.6 H0 : µ ≥ 500 vs H1 : µ < 500; zobs = −2.108; p = P (Z < zobs|H0 verdadeira) = 0.0174Rejeitar H0 a 5% e 10%, pelo que os dados evidenciam que o peso medio dos pacotes deva serinferior a 500g.

Page 223: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 221

10.7 (a) R0.01 ≡ (2.462;+∞); tobs = 0.428; Nao rejeitar H0 a 1%.

(b) α =P(erro 1o especie)=0.0505; β=P(erro 2o especie)=0.1357.

10.8 H0 : µ ≥ 0 vs H1 : µ < 0; tobs = −3.035; p = P (T < tobs|H0 verdadeira) ∈]0.001; 0.005[;Rejeitar H0 aos usuais nıveis de significancia, evidenciando os dados que o corredor 2 e melhorque o corredor 1 em media.

10.9 H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 6= 0; R0.01 ≡ (−∞;−2.57) ∪ (2.57;+∞); zobs = −1.58; Naorejeitar H0 a 1%.

10.10 H0 : µA − µB = 0 vs H1 : µA − µB 6= 0; zobs = −4.8; p = P (|Z| > |zobs| |H0 verdadeira) ' 0;Rejeitar H0 aos usuais nıveis de significancia, significando que os dados evidenciam diferentescontaminacoes medias.

10.11 H0 : p ≤ 0.3 vs H1 : p > 0.3; R0.10 ≡ (1.28;+∞); zobs = 1.20; Nao rejeitar H0 a 10%,significando que os dados evidenciam que a proporcao de camioes infractores nao ultrapassa os30%.

10.12 H0 : p ≥ 0.1 vs H1 : p < 0.1; zobs = 1.33; p = P (Z < zobs|H0 verdadeira) = 0.9082; Nao rejeitarH0 aos usuais nıveis de significancia, significando que os dados evidenciam que a percentagemde possuidores desta desordem na populacao nao e inferior a 10%.

10.13 H0 : σ2 ≤ 0.5 vs H1 : σ2 > 0.5; R0.05 ≡ (30.14;+∞); x2obs = 11.4; Nao rejeitar H0 a 5%, peloque a especificacao parece estar a ser cumprida.

10.14 H0 : σ2 = 1.32 vs H1 : σ2 6= 1.32; R0.01 ≡ (0; 0.412) ∪ (16.75;+∞); x2obs = 4.02; Nao rejeitarH0 a 1%.

10.15 H0 : σ2 ≥ 0.01 vs H1 : σ2 < 0.01; R0.10 ≡ (0; 1.610); x2obs = 0.0039; Rejeitar H0 a 10%, peloque os dados evidenciam uma variabilidade inferior a 0.01.

10.16 H0 : X ∼ N(3, 4) vs H1 : X N(3, 4)

Classes Oi pi Ei = 30pi]−∞; 0.77]]0.77; 1.87]

27

90.13140.1529

3.9424.587

8.529

]1.87; 2.97]]2.97; 4.07]

86

0.20770.2134

6.2316.402

]4.07; 5.17]]5.17;+∞]

52

70.15670.1379

4.7014.137

8.838

Logo k = 4 e X2 ∼ χ24−0−1; R0.05 ≡]7.815;+∞[; x2obs = 0.936. Nao rejeitar H0 a 5%.

10.17 H0 : X ∼ N(2, σ2) vs H1 : X N(2, σ2)

s = 1.483817.

Classes Oi pi Ei = 30pi]−∞; 1.05] 9 0.2611 7.833]1.05; 1.90]]1.90; 2.75]

44

0.2110.2229

6.336.687

]2.75; 3.60]]3.60; 4.45]]4.45;+∞]

922

130.16490.09060.0495

4.9472.7181.485

9.15

Logo k = 4 e X2 ∼ χ24−1−1; R0.01 ≡]9.21;+∞[; x2obs = 3.73. Nao rejeitar H0 a 1%.

Page 224: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 222

10.18 H0 : X ∼ N(14, 1) vs H1 : X N(14, 1)

Classes Oi pi Ei = 28pi]−∞; 13.5] 4 0.3085 8.638]13.5; 14] 7 0.1915 5.362]14; 14.5] 8 0.1915 5.362]14.5; 15]]15;+∞[

54

90.14980.1587

4.19444.4436

8.638

Logo k = 4 e X2 ∼ χ24−0−1; R0.10 ≡]6.251;+∞[; x2obs = 4.3. Nao rejeitar H0 a 10%.

10.19 (a) H0 : σ2 ≥ 1000000 vs H1 : σ2 < 1000000; R0.01 ≡ (0; 4.66); x2obs = 17.47; Nao rejeitar H0

a 1%, pelo que os dados evidenciam uma variabilidade nao inferior a 1000000.

(b) H0 : µ ≥ 100000 vs H1 : µ < 100000; R0.05 ≡ (−∞;−1.64); zobs = 0.387; Nao rejeitar H0

a 5%, pelo que os dados nao evidenciam que a media de lixo produzido por dia seja inferiora 100000T.

10.20 (a) H0 : µ = 13 vs H1 : µ 6= 13; R0.05 ≡ (−∞;−2.776) ∪ (2.776;+∞); tobs = 11.18; RejeitarH0 a 5%, pelo que os dados nao evidenciam que o produtor tenha razao.

(b) O nıvel de significancia de um teste de hipoteses estatıstico e o tamanho do erro do tipo I,ou seja, a probabilidade de rejeitar uma hipotese nula sendo ela verdadeira.

(c) H0 : X ∼ N(13.5, 1) vs H1 : X N(13.5, 1)

Classes Oi pi Ei = 33pi]−∞; 11.5]]11.5; 12.5[

58

130.02280.1359

0.75244.4847

5.2371

]12.5; 13.5] 9 0.3413 11.2629]13.5; 14.5] 6 0.3413 11.2629]14.5;+∞[ 5 0.1587 5.2371

Logo k = 4 e X2 ∼ χ24−0−1; R0.10 ≡]6.251;+∞[; x2obs = 14.43. Rejeitar H0 a 10%.

10.21 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Verdade. Tendo sido H0 rejeitado a 5% significa que o valor observado da estatıstica doteste pertencia a correspondente regiao de rejeicao. Aumentando o nıvel de significancia doteste aumenta tambem a zona de rejeicao, incluindo a anterior. Assim o valor observadoda estatıstica do teste pertence tambem a nova regiao de rejeicao, levando-nos igualmentea rejeitar H0 a este novo nıvel de significancia.

(b) Falso. Ao teste efectuado corresponde uma probabilidade de 0.05 de rejeitarmos a hipotesenula sendo ela verdadeira. Assim pode acontecer que µ valha efectivamente 0.5, apesar denos termos rejeitado esta hipotese.

(c) Verdade. Os testes de hipoteses para a proporcao assentam na estatıstica de teste Z =P−p√

p(1−p)/n, cuja distribuicao por amostragem e aproximada a custa do T.L.C. (ver capıtulo

8).

(d) Falso. O nıvel de significancia de um teste estatıstico e a probabilidade de rejeitar umahipotese sabendo que ela e verdadeira.

(e) Verdade. Esse e o procedimento empregue no teste a normalidade de uma populacao.

(f) Falso. α e independente do tamanho amostral.

Page 225: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 223

10.22 H0 : X ∼ N(45, 202) vs H1 : X N(45, 202)

Classes Oi pi Ei = 30pi]−∞; 15]]15; 30]

25

70.06680.1598

2.0044.794

6.798

]30; 45] 7 0.2734 8.202]45; 60] 8 0.2734 8.202]60;+∞[ 8 0.2266 6.798

Logo k = 4 e X2 ∼ χ24−0−1; R0.05 ≡]7.815;+∞[; x2obs = 0.40. Nao rejeitar H0 a 5%.

Capıtulo 11

11.1 (b) Y = −24.027 + 1.171x.

(c) R2 = 0.8849. Bom ajuste.

(d) H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−2.179) ∪ (2.179;+∞); tobs = 9.61; Rejeitar H0

a 5%, o que esta de acordo com (c).

(d) Y30 = 11.103h. Para 40o nao e possıvel estimar.

11.2 (a) Y = −4.04902 + 0.03642x; R2 = 0.9432, bom ajuste.

(b) IC95%(β1) ≡ (0.0284; 0.0444).

(c) Rejeitar H0 a 5%.

11.3 (a) Y = 10.63 + 56.13x; R2 = 0.986, bom ajuste.

(b) H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−2.447) ∪ (2.447;+∞); tobs = 20.54; RejeitarH0 a 5%.

IC95%(β0) ≡ (−77.95; 99.21).

(c) Y10 = 571.9Kg. Para 35 dias nao e possıvel estimar.

11.4 (a) Y = 1.4 + 0.8x; R2 = 0.92, bom ajuste.

(b) H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−2.306) ∪ (2.306;+∞); tobs = 9.38; Rejeitar H0

a 5%, pelo que os dados evidenciam haver relacao directa entre a nota de acesso e a mediafinal de curso.

(c) Y16 = 14.2 valores.

11.5 Y = 2.31275+0.01984x; R2 = 0.52, ajuste nao muito bom, pelo que nao parece que o agricultoresteja correcto.

11.6 (a) β1 = 45.71; β0 = 205.00.

(b) R2 = 0.8423, bom ajuste.

(c) H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−4.303) ∪ (4.303;+∞); tobs = 3.269; Naorejeitar H0 a 5%. Nao seria de esperar dado o alto valor observado de R2.

(d) Y6 = 479.26e.

11.7 (a) Y = 2.28 + 0.41x; R2 = 0.9451, bom ajuste.

(b) O aumento de um campo de futebol na vizinhanca resulta num aumento de 0.41 na taxade divorcio por 1000 habitantes.

Page 226: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 224

(c) H0 : β1 = 0 vs H1 : β1 6= 0; R0.10 ≡ (−∞;−2.353) ∪ (2.353;+∞); tobs = 7.186; RejeitarH0 a 10%.

(d) Y3 = 3.51 por 1000 habitantes.

11.8 (a) Y = 2.12 + 0.99x.

(b) R2 = 0.9976, bom ajuste.

(c) H0 : β1 = 0 vs H1 : β1 6= 0; tobs = 63.975; p = P (|T | > |tobs| |H0 verdadeira) ' 0; RejeitarH0 aos usuais nıveis de significancia, pelo que as temperaturas programadas parecem estara ser importantes na explicacao das temperaturas efectivas.

(d) Aumentando a temperatura da programacao em 1o aumenta tambem a temperatura efectivado forno em cerca de 1o tambem, o que esta de acordo com as expectativas do fabricante.

11.9 Nota: O que se segue sao solucoes muito abreviadas! No exame pretendem-se justificacoes maiscompletas.

(a) Falso. Para esta variacao de idades, ambas compreendidas entre 50 e 80 anos, 4x = 10anos, corresponde uma variacao de peso de 4Y = 0.5 × 10 = 5Kg.

(b) Falso. A recta so e valida para idades compreendidas dentro da gama de valores de idadesusadas para derivar a recta.

(c) Verdade. H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−2.145) ∪ (2.145;+∞); tobs = 4.16;Rejeitar H0 a 5%.

(d1) Falso. H0 : β1 = 0 vs H1 : β1 6= 0; R0.05 ≡ (−∞;−2.101) ∪ (2.101;+∞); tobs = 17.74;Rejeitar H0 a 5%.

(d2) Falso. A conclusao de que o declive da recta e significativamente distinto de zero vemajudar a confirmar a adequacao do modelo aos dados, vindo ao encontro da conclusao quese retira do elevado valor de R2.

(f) Verdade. Y = β0 + β1x, com β0 = Y − β1x. Entao Yx = (Y − β1x) + β1x = Y .

11.10 (a) Y = 0.49 + 0.09x; R2 = 0.9696, bom ajuste.

(b) Aumentando a velocidade de circulacao por 1 aumenta o consumo de combustıvel por 0.09.O sinal positivo do declive da recta estimada esta de acordo com as nossa expectativas deque a maiores velocidades correspondem maiores consumos.

(c) IC95%(β1) ≡ (0.077; 0.11). Nao contem o zero, vindo ao encontro da conclusao retirada naalınea (a) de que tınhamos um bom ajuste.

11.11 (a) R2 = 0.9716, bom ajuste.

(b) H0 : β1 = 0 vs H1 : β1 6= 0; n− 2 = 100; R0.10 ≡ (−∞;−1.66) ∪ (1.66;+∞); tobs = 57.89;Rejeitar H0 a 10%.

(c) 139.817e (desde que o numero de anos de escolaridade se encontre entre 7 e 21).

(d) Y9 = 255.084e; Y17 = 1373.62e.

Capıtulo 12

12.1 (a) X ∼ Hiperg (10, 4, 2).

(b) Y

0 113

23

; Y ∼ Bern(23)

Page 227: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 225

(c) X e Y seriam independentes se P (X = x, Y = y) = P (X = x)P (Y = y) , ∀ (x, y).

Contudo P (X = 0, Y = 0) = P (X = 0) = 13 6= 1

9 = P (X = 0)P (Y = 0).

Como os valores de Y dependem dos valores observados de X, as v.a.’s nao sao indepen-dentes.

12.2 (a) F (t) =

0, t < 0t/2, 0 ≤ t < 11/2, 1 ≤ t < 2t/4, 2 ≤ t < 41, t ≥ 4

(b) E [T ] = 1.75 minutos;me : F (me) = 1/2: Todos os valores de t em [1,2] minutos satisfazem esta condicao.

(c) P (T < 1 |T ≥ 0.5) = 13 .

(d) X - no vezes, de entre 100, em que espero menos de meio minuto;X ∼ Bin (100, p), p = P (T < 0.5) = 1

4 .E [X] = 100× 1

4 = 25 vezes.

12.3 (a) 16 .

(b) P (X > 2 |X ≥ 0.5) = 811 .

(c) E [X] = 73 ' 2.3 horas.

13.1 Y - no dias, de entre 10, em que espero mais de meia hora;Y ∼ Bin (10, p), p = P (X > 0.5) = 11

12 .P (Y = 5) ' 0.00066.

12.4 (a) F (x) =

0, x ≤ 0x3, 0 < x < 11, x ≥ 1

(b) P (X > 0.5 |X ≥ 0.25) ' 0.89.

(c) Y -no televisores, de entre 10, em que o tecnico Ze demora menos de 15 minutos a arranjar;Y ∼ Bin (10, p), p = P (X < 0.25) = 0.015625.P (Y ≥ 9) ' 5.47 × 10−16.

12.5 (b) F (x) =

0, x < 0x2/4, 0 ≤ x < 21, x ≥ 2

(c) P (X < 1.5 |X > 1) ' 0.42.

(d) E [X] = 1.3 horas.

(e) Y - no de alunos que, de entre 40, demoram menos uma hora e meia a resolver o exame;Y ∼ Bin (40, p), p = P (X < 1.5) = 0.5625.P (Y = 40) ' 1.01 × 10−10.

12.6 X ∼ Unif [0, 5]

(a) P (X > 4 |X > 2) ' 0.33.

(b) E (X) = 2.5m3/minuto; me = 2.5m3/minuto.

Page 228: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 226

(c) Y

1 1.5 2.5P (X > 4) P (X < 2) P (2 ≤ X ≤ 4)

1 1.5 2.515

25

25

E (Y ) = 1.8e; σY = 0.6e.

12.7 (a) F (x) =

0, x < 2

1/2 + (x− 5)3 /54, 2 ≤ x < 81, x ≥ 8

(b) P (X > 6 |X > 5) ' 0.96.

(c) E [X] = 5, porque a densidade e simetrica em torno de 5;me = 5 porque a densidade e simetrica em torno de 5.

(d) Y - no eucaliptos, de entre 100, cujo tronco pesa mais de 5 dezenas de Kg;Y ∼ Bin (100, p), p = P (X > 5) = 0.5.

Pelo T.L.C., Ya∼ N(100× 0.5, 100 × 0.5 × (1− 0.5)), donde P (Y > 50)

a' 0.5.

12.8 Verdade. Tal e consequencia da distribuicao normal ser simetrica em torno da sua media (oumoda ou mediana).

12.9 (a) F (x) =

0, x < 0x3 , 0 ≤ x < 11312 − 3

4x2 , 1 ≤ x < 31, x ≥ 3

(b) P (X < 0.5 |X < 1) = 0.5.

(c) E [Y ] = E[

X3]

' 3.083 centimos.

13.1 Y -no de dias, de entre 5, com consumo diario inferior a 1m3;Y ∼ Bin (5, p), p = P (X < 1) = 1

3 .P (Y = 2) ' 0.33.

12.10 (a) F (x) =

0, x < 0x2, 0 ≤ x < 11, x ≥ 1

(b) 0.2.

(c) −43 .

(d) W - no de meses, de entre 12, em que se resolvem pelo menos 90% das reclamacoes;W ∼ Bin (12, p), p = P (X ≥ 0.9) = 0.19.P (W = 12) ' 2.21 × 10−9.

12.11 (a) E [T ] = 10; V (T ) = 0.25.

(b) cov (X,Y ) = −3/2.X e Y nao sao v.a.’s independentes porque cov (X,Y ) 6= 0.

(c) P (X > 2Y ) = P (X − 2Y > 0) = 0.7673, porque X − 2Y ∼ N (3, 17).

12.12 (a) E [Y ] = E [10 + 20X] = 10 + 20E [X] = 40.

V (Y ) = V (10 + 20X) = 202V (X) = 300.

(b) W

30 30 + kP (X < 2) P (X ≥ 2)

30 30 + k7/8 1/8

Page 229: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 227

(i) E [W ] = 30 + k8 ;

k = 40; Interessa-nos conhecer k para estipular qual devera ser o valor da indemnizacaode forma a que, em media, os agricultores tenham a sua perda compensada.

(ii) FW (w) =

0, w < 307/8, 30 ≤ w < 1101, w ≥ 110

12.13 (a) (i) ' 0.1723.

(ii) me : F (me) = 1/2 ⇔ me = ln (2)/0.25 ' 2.773.

(b) f (x) =

0, x < 00.25 e−0.25x, x ≥ 0

(c) E [X] = 4.

(d) P (X > 5 |X > 3) ' 0.607.

(e) Y -no de abetos, de entre 150, cujo tempo de vida ultrapassa os 5 anos;Y ∼ Bin (150, p), p = P (X > 5) ' 0.2865.P (Y = 40) ' 0.0635

12.14 (a) X ∼ Bin (2, 0.6).

(b) P (X = 1) = 0.48.

(c) (i) Dado que P (X = 1) = 0.48 e P (X = 0) = 0.16,

X\Y 0 1 2

0 0.01 0.05 0.10 0.161 0.08 0.30 0.10 0.482 0.30 0.05 0.01 0.36

0.39 0.40 0.21 1

(ii) P (Y = 0 |X = 2) ' 0.83.

(iii) P (Y = 2 |X = 0) 0.625.

(iv) Se fossem independentes P (Y = 0) = P (Y = 0 |X = 2), por exemplo, o que nao acon-tece.

(v) V(X) = 0.48, V (Y ) = 0.5676, cov (X,Y ) = −0.344;V (X + Y ) = V (X) + V (Y ) + 2cov (X,Y ) = 0.3596.

12.15 (a) Porque X e Y sao independentes, P (X = x, Y = y) = P (X = x)P (Y = y), ∀(x, y):X\Y 1 2

0 0.08 0.08 0.161 0.24 0.24 0.482 0.18 0.18 0.36

1/2 1/2

(b) 0.18.

(c) Porque X e Y sao independentes cov(X,Y ) = 0.Porque X e Y sao independentes E [XY ] = E [X]E [Y ]=1.8, pois E [X] = 2× 0.6 e E [Y ] =2+12 .

12.16 (a) Nao sao independentes pois se fossem a sua covariancia teria de ser nula.

(b) -3; 5.8.

Page 230: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 228

(c) ρ(X,Y ) ' 0.26. Fraca associacao linear positiva.

12.17 (a) X

0 1 2 30.2 0.5 0.2 0.1

Y

0 1 2 30.51 0.39 0.09 0.01

(b) P (Y = y |X = 1) = P (X=1,Y=y)P (X=1) = 0.5, y = 0, 1.

(Y |X = 1)

0 10.5 0.5

Distribuicao Bernoulli(0.5).

(c) 0.38.

(d) Como cov (X,Y ) 6= 0 entao X e Y nao sao v.a.’s independentes.

Se X e Y fossem independentes, P (Y = y |X = 1) = P (Y = y) , ∀ y, o que nao acontece.

12.18 (a) P (X = 0 ∪ Y = 0) = P (X = 0) + P (Y = 0)− P (X = 0, Y = 0) = 0.6.

(b) P (X = 0 |Y = 0) = 0.375.

(c) 0.0428.

(d) Porque ρ (X,Y ) 6= 0 entao X e Y nao sao v.a.’s independentes.

Se X e Y fossem independentes, por exemplo, P (X = 0 |Y = 0) = P (X = 0), o que naoacontece.

12.19 (a) 18.75e 5625.00e.

(b) 0.0606 (distribuicao aproximada).

(c)(c1) 50%.

(c2) 650.

12.20 (a) 0.0071.

(b) 0.5517 (distribuicao aproximada).

(c) 0, porque as variaveis sao independentes.

12.21 Podemos afirmar, com 5% de significancia, que a media e diferente de zero, logo tambem podemosafirmar, com 10% de significancia, que a media e diferente de zero.

12.22 (a) µ = x = 11 σ = s = 4.

(b) IC95% ≡ (8.139, 13.861).

(c) H0 : σ ≤ 5 vs H1 : σ > 5; R0.05 ≡ (16.92,+∞); x2obs = 5.76; Nao rejeitar H0 a 5%, pelo queos dados nao evidenciam um desvio padrao populacional superior a 5.

12.23 (a) µ = X . Estimador centrado de µ. µ = x = 39.1.

(b) IC95% (µ) ≡ (34.62, 43.58).

(c) Para n > 30, Z =√n X−µ

Sa∼ N (0, 1).

n > 602.54 ⇔ n ≥ 603.

(d) H0 : σ2 ≥ 25 vs H1 : σ

2 < 25; R0.01 ≡ (0, 2.088); x2obs = 14.116; Nao rejeitar H0 a 1%, peloque os dados nao evidenciam que a variancia seja inferior a 25.

12.24 (a) µ = x = 101.

(b) IC96% (µ) ≡ (98.95, 103.05).

Page 231: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 229

(c) 400

13.1 H0 : σ = 10 vs H1 : σ 6= 10; R0.05 ≡ (0, 74.22) ∪ (129.6,+∞); x2obs = 142.56; Rejeitar H0 a5%, pelo que os dados evidenciam que o desvio padrao e diferente de 10.

12.25 (a) µ = X .

(b) (i) IC95% (µX) ≡(

X − 1.96 10√n, X + 1.96 10√

n

)

.

(ii) n > 61.47 ⇔ n ≥ 62.

(c) H0 : µX = µY vsH1 : µX 6= µY ; R0.1 ≡ (−∞,−1.64)∪(1.64,+∞); zobs = −2.56; Rejeitar H0

a 10%, pelo que os dados evidenciam diferencas significativas entre as quantidades mediasde lixo produzido nas duas cidades.

(d) Diminui-se o tamanho da regiao de rejeicao, pelo que se rejeita menos.

12.26 (a) IC98% (p) ≡ (0.82, 0.96)

Aumentando a dimensao da amostra.

(b) (i) σ = s ' 1.87.

(ii) H0 : σ ≥ 2 vs H1 : σ < 2; R0.05 ≡ (0, 1.145); x2obs = 4.375; Nao rejeitar H0 a 5%, peloque os dados nao evidenciam que o desvio padrao seja inferior a 2.

(iii) α = P (Rejeitar H0 |H0 e verdadeira).

12.27 (a) µ = x = 8.02; σ = s = 0.24.

(b) H0 : µ = 8 vs H1 : µ 6= 8; R0.01 ≡ (−∞,−2.57) ∪ (2.57,+∞); zobs = 0.47; Nao rejeitar H0

a 1%, pelo que os dados nao evidenciam que a viscosidade media seja diferente de 8.

p = 0.6384.

(c) Nao. So com 1% de probabilidade de erro.

(d) IC90% (σ) ≡ (0.199, 0.304).

12.28 (a) µ = x = 26; X e estimador centrado e consistente de µ.

(b) H0 : µ ≤ 25 vs H1 : µ > 25; tobs = 0.258; p = 0.4; Nao rejeitar H0 aos habituais nıveis designificancia, pelo que os dados nao evidenciam que o ındice ultrapasse o valor medio deexcelencia.

(c) Usando, por exemplo, um teste de ajustamento do qui-quadrado a normalidade da pop-ulacao X.

(d) IC95% (p) ≡ (0.288, 0.462).

12.29 (a) µ = x = 1.73; σ2 = s2 = 0.0064.

(b) IC92% (µ) ≡ (1.71, 1.75).

(c) n ≥ 49.

(d) H0 : p ≤ 0.20 vs H1 : p > 0.20; R0.05 ≡ (1.64,+∞); zobs = −1.19; Nao rejeitar H0 a 5%,pelo que os dados nao evidenciam que a proporcao de alunos com estatura superior ou iguala 1.82m seja superior a 20%.

12.30 (a) Admita-se que a populacao X-concentracao de CO (ppm) tem distribuicao Normal; H0 :µ ≤ 110 vs H1 : µ > 110; R0.1 ≡ (1.328,+∞); tobs = −8.102; Nao rejeitar H0 a 10%, peloque os dados nao evidenciam que a concentracao esperada seja superior a 110ppm.

(b) IC95%

(

σ2)

≡ (15.91, 58.66).

Page 232: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 230

(c) O intervalo de 99% de confianca tera maior amplitude.

(d) p = P = 5/20 = 0.25.

Alternativamente (ou complementarmente) poderia fazer estimacao intervalar.

Page 233: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 14

Formulario

P (X = x) = 1n P (X = x) =

CMx CN−M

n−x

CNn

P (X = x) = Cnx px (1− p)n−x

x = 1, . . . , n x = max (0, n −N +M) , . . . ,min (n,M) x = 0, . . . , n

E [X] = n+12 E [X] = nM

N E [X] = np

V(X) = n2−112 V (X) = n M

N2(N−1)(N −M)(N − n) V (X) = np(1− p)

P (X = x) = p(1− p)x−1 P (X = x) = e−λλx

x! f(x) = 1b−a f(x) = λ e−λx

x = 1, 2, . . . x = 0, 1, . . . a ≤ x ≤ b x > 0

E [X] = 1p E [X] = λ E [X] = a+b

2 E [X] = 1λ

V(X) = 1−pp2

V(X) = λ V(X) = (b−a)2

12 V(X) = 1λ2

f(x) = 1√2πσ

exp

− (x−µ)2

2σ2

, x ∈ R E [X] = µ V(X) = σ2

Continua na pagina seguinte

231

Page 234: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 232

Z = X−µσ/

√n∼ N(0, 1) T = X−µ

S/√n∼ t(n−1) Z = X−µ

S/√n

a

∼ N(0, 1) Z = X−µσ/

√n

a

∼ N(0, 1)

S2 = 1n−1

(Xi − X)2 = 1n−1

(∑

X2i − nX2

)

Z = P−p√p(1−p)/n

a

∼ N(0, 1)

Z = (X1−X2)−(µ1−µ2)√

σ21

n1+

σ22

n2

∼ N(0, 1) X2 = (n−1)S2

σ2 ∼ χ2(n−1) X2 =

k∑

i=1

(Oi − Ei)2

Ei

a

∼ χ2(k−p−1)

SY Y =

n∑

i=1

(Yi − Y )2 =

n∑

i=1

Y 2i − nY 2 Sxx =

n∑

i=1

(x1 − x)2 =

n∑

i=1

x2i − nx2

SxY =

n∑

i=1

(xi − x)(Yi − Y ) =

n∑

i=1

xiYi − nxY Yi = β0 + β1xi + εi β1 =SxY

Sxx

β0 = Y − β1x

SQR = SY Y −(

β1

)2

Sxx σ2 = SQR

n−2 T = β1−β1√

σ2

Sxx

∼ t(n−2) T = β0−β0√

σ2∑

x2i

nSxx

∼ t(n−2)

R2 = 1− SQR

SY Y=

(β1)2Sxx

SY Y

Page 235: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 15

TabelasValores da Funcao Distribuicao da Normal Reduzida

Φ(z) = P (Z ≤ z) =

∫ z

−∞

e−t2

2

√2π

dt

z

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141

0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517

0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879

0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852

0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133

0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621

1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830

1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015

1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177

1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441

1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545

1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633

1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706

1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857

2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890

2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916

2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936

2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952

2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964

2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974

2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981

2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986

3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993

3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995

3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997

3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

Tabela produzida no software R

233

Page 236: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilidades e Estatıstica Isabel Natario 234

Valores da Funcao Distribuicao da T-Student

n \ q 0.600 0.700 0.750 0.800 0.850 0.900 0.925 0.950 0.975 0.990 0.995 0.999 0.99951 0.325 0.727 1.000 1.376 1.963 3.078 4.165 6.314 12.71 31.82 63.66 318.3 636.62 0.289 0.617 0.816 1.061 1.386 1.886 2.282 2.920 4.303 6.965 9.925 22.33 31.603 0.277 0.584 0.765 0.978 1.250 1.638 1.924 2.353 3.182 4.541 5.841 10.21 12.924 0.271 0.569 0.741 0.941 1.190 1.533 1.778 2.132 2.776 3.747 4.604 7.173 8.6105 0.267 0.559 0.727 0.920 1.156 1.476 1.699 2.015 2.571 3.365 4.032 5.893 6.8696 0.265 0.553 0.718 0.906 1.134 1.440 1.650 1.943 2.447 3.143 3.707 5.208 5.9597 0.263 0.549 0.711 0.896 1.119 1.415 1.617 1.895 2.365 2.998 3.499 4.785 5.4088 0.262 0.546 0.706 0.889 1.108 1.397 1.592 1.860 2.306 2.896 3.355 4.501 5.0419 0.261 0.543 0.703 0.883 1.100 1.383 1.574 1.833 2.262 2.821 3.250 4.297 4.78110 0.260 0.542 0.700 0.879 1.093 1.372 1.559 1.812 2.228 2.764 3.169 4.144 4.587

11 0.260 0.540 0.697 0.876 1.088 1.363 1.548 1.796 2.201 2.718 3.106 4.025 4.43712 0.259 0.539 0.695 0.873 1.083 1.356 1.538 1.782 2.179 2.681 3.055 3.930 4.31813 0.259 0.538 0.694 0.870 1.079 1.350 1.530 1.771 2.160 2.650 3.012 3.852 4.22114 0.258 0.537 0.692 0.868 1.076 1.345 1.523 1.761 2.145 2.624 2.977 3.787 4.14015 0.258 0.536 0.691 0.866 1.074 1.341 1.517 1.753 2.131 2.602 2.947 3.733 4.07316 0.258 0.535 0.690 0.865 1.071 1.337 1.512 1.746 2.120 2.583 2.921 3.686 4.01517 0.257 0.534 0.689 0.863 1.069 1.333 1.508 1.740 2.110 2.567 2.898 3.646 3.96518 0.257 0.534 0.688 0.862 1.067 1.330 1.504 1.734 2.101 2.552 2.878 3.610 3.92219 0.257 0.533 0.688 0.861 1.066 1.328 1.500 1.729 2.093 2.539 2.861 3.579 3.88320 0.257 0.533 0.687 0.860 1.064 1.325 1.497 1.725 2.086 2.528 2.845 3.552 3.850

21 0.257 0.532 0.686 0.859 1.063 1.323 1.494 1.721 2.080 2.518 2.831 3.527 3.81922 0.256 0.532 0.686 0.858 1.061 1.321 1.492 1.717 2.074 2.508 2.819 3.505 3.79223 0.256 0.532 0.685 0.858 1.060 1.319 1.489 1.714 2.069 2.500 2.807 3.485 3.76824 0.256 0.531 0.685 0.857 1.059 1.318 1.487 1.711 2.064 2.492 2.797 3.467 3.74525 0.256 0.531 0.684 0.856 1.058 1.316 1.485 1.708 2.060 2.485 2.787 3.450 3.72526 0.256 0.531 0.684 0.856 1.058 1.315 1.483 1.706 2.056 2.479 2.779 3.435 3.70727 0.256 0.531 0.684 0.855 1.057 1.314 1.482 1.703 2.052 2.473 2.771 3.421 3.69028 0.256 0.530 0.683 0.855 1.056 1.313 1.480 1.701 2.048 2.467 2.763 3.408 3.67429 0.256 0.530 0.683 0.854 1.055 1.311 1.479 1.699 2.045 2.462 2.756 3.396 3.65930 0.256 0.530 0.683 0.854 1.055 1.310 1.477 1.697 2.042 2.457 2.750 3.385 3.646

31 0.256 0.530 0.682 0.853 1.054 1.309 1.476 1.696 2.040 2.453 2.744 3.375 3.63332 0.255 0.530 0.682 0.853 1.054 1.309 1.475 1.694 2.037 2.449 2.738 3.365 3.62233 0.255 0.530 0.682 0.853 1.053 1.308 1.474 1.692 2.035 2.445 2.733 3.356 3.61134 0.255 0.529 0.682 0.852 1.052 1.307 1.473 1.691 2.032 2.441 2.728 3.348 3.60135 0.255 0.529 0.682 0.852 1.052 1.306 1.472 1.690 2.030 2.438 2.724 3.340 3.59136 0.255 0.529 0.681 0.852 1.052 1.306 1.471 1.688 2.028 2.434 2.719 3.333 3.58237 0.255 0.529 0.681 0.851 1.051 1.305 1.470 1.687 2.026 2.431 2.715 3.326 3.57438 0.255 0.529 0.681 0.851 1.051 1.304 1.469 1.686 2.024 2.429 2.712 3.319 3.56639 0.255 0.529 0.681 0.851 1.050 1.304 1.468 1.685 2.023 2.426 2.708 3.313 3.55840 0.255 0.529 0.681 0.851 1.050 1.303 1.468 1.684 2.021 2.423 2.704 3.307 3.551

45 0.255 0.528 0.680 0.850 1.049 1.301 1.465 1.679 2.014 2.412 2.690 3.281 3.52050 0.255 0.528 0.679 0.849 1.047 1.299 1.462 1.676 2.009 2.403 2.678 3.261 3.49660 0.254 0.527 0.679 0.848 1.045 1.296 1.458 1.671 2.000 2.390 2.660 3.232 3.46070 0.254 0.527 0.678 0.847 1.044 1.294 1.456 1.667 1.994 2.381 2.648 3.211 3.43580 0.254 0.526 0.678 0.846 1.043 1.292 1.453 1.664 1.990 2.374 2.639 3.195 3.41690 0.254 0.526 0.677 0.846 1.042 1.291 1.452 1.662 1.987 2.368 2.632 3.183 3.402100 0.254 0.526 0.677 0.845 1.042 1.290 1.451 1.660 1.984 2.364 2.626 3.174 3.390120 0.254 0.526 0.677 0.845 1.041 1.289 1.449 1.658 1.980 2.358 2.617 3.160 3.373150 0.254 0.526 0.676 0.844 1.040 1.287 1.447 1.655 1.976 2.351 2.609 3.145 3.357∞ 0.253 0.524 0.674 0.842 1.036 1.282 1.440 1.645 1.960 2.326 2.576 3.090 3.291

Tabela produzida no software R

Page 237: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Probabilid

adeseEstatıstica

IsabelNatario

235

Valores da Funcao Distribuicao da Qui-quadrado

n \ q 0.005 0.010 0.025 0.050 0.100 0.250 0.500 0.600 0.700 0.800 0.850 0.900 0.925 0.950 0.975 0.990 0.995 0.999 0.9995 n \ q

1 4 × 10−5 2 × 10−4 0.001 0.004 0.016 0.102 0.455 0.708 1.074 1.642 2.072 2.706 3.17 3.841 5.024 6.635 7.880 10.83 12.12 12 0.010 0.020 0.051 0.103 0.211 0.575 1.386 1.833 2.408 3.219 3.794 4.605 5.181 5.991 7.378 9.210 10.60 13.82 15.20 23 0.072 0.115 0.216 0.352 0.584 1.213 2.366 2.946 3.665 4.642 5.317 6.251 6.905 7.815 9.348 11.34 12.84 16.27 17.73 34 0.207 0.297 0.484 0.711 1.064 1.923 3.357 4.045 4.878 5.989 6.745 7.780 8.496 9.488 11.14 13.28 14.86 18.47 20.00 45 0.412 0.554 0.831 1.145 1.610 2.675 4.351 5.132 6.064 7.290 8.115 9.236 10.01 11.07 12.83 15.09 16.75 20.52 22.11 56 0.676 0.872 1.237 1.635 2.204 3.455 5.348 6.211 7.231 8.558 9.446 10.64 11.47 12.59 14.45 16.81 18.55 22.46 24.10 67 0.989 1.239 1.690 2.167 2.833 4.255 6.346 7.283 8.383 9.803 10.75 12.02 12.88 14.07 16.01 18.48 20.28 24.32 26.02 78 1.344 1.646 2.180 2.733 3.490 5.071 7.344 8.350 9.524 11.03 12.03 13.36 14.27 15.51 17.53 20.09 21.95 26.12 27.87 89 1.735 2.088 2.700 3.325 4.168 5.899 8.343 9.414 10.66 12.24 13.29 14.68 15.63 16.92 19.02 21.67 23.59 27.88 29.67 910 2.156 2.558 3.247 3.940 4.865 6.737 9.342 10.47 11.78 13.44 14.53 15.99 16.97 18.31 20.48 23.21 25.19 29.59 31.42 1011 2.603 3.053 3.816 4.575 5.578 7.584 10.34 11.53 12.90 14.63 15.77 17.28 18.29 19.68 21.92 24.72 26.76 31.26 33.14 1112 3.074 3.571 4.404 5.226 6.304 8.438 11.34 12.58 14.01 15.81 16.99 18.55 19.60 21.03 23.34 26.22 28.30 32.91 34.82 1213 3.565 4.107 5.009 5.892 7.042 9.299 12.34 13.64 15.12 16.98 18.20 19.81 20.90 22.36 24.74 27.69 29.82 34.53 36.48 1314 4.075 4.660 5.629 6.570 7.790 10.17 13.34 14.69 16.22 18.15 19.41 21.06 22.18 23.68 26.12 29.14 31.32 36.12 38.11 1415 4.601 5.229 6.262 7.261 8.547 11.04 14.34 15.73 17.32 19.31 20.60 22.31 23.45 25.00 27.49 30.58 32.80 37.70 39.72 1516 5.142 5.812 6.908 7.962 9.312 11.91 15.34 16.78 18.42 20.47 21.79 23.54 24.72 26.30 28.85 32.00 34.27 39.25 41.31 1617 5.697 6.408 7.564 8.672 10.09 12.79 16.34 17.82 19.51 21.61 22.98 24.77 25.97 27.59 30.19 33.41 35.72 40.79 42.88 1718 6.265 7.015 8.230 9.390 10.86 13.68 17.34 18.87 20.60 22.76 24.16 25.99 27.22 28.87 31.53 34.81 37.16 42.31 44.43 1819 6.844 7.633 8.907 10.12 11.65 14.56 18.34 19.91 21.69 23.90 25.33 27.20 28.46 30.14 32.85 36.19 38.58 43.82 45.97 1920 7.434 8.260 9.590 10.85 12.44 15.45 19.34 20.95 22.77 25.04 26.50 28.41 29.69 31.41 34.17 37.57 40.00 45.31 47.50 2021 8.034 8.897 10.28 11.59 13.24 16.34 20.34 21.99 23.86 26.17 27.66 29.62 30.92 32.67 35.48 38.93 41.40 46.80 49.01 2122 8.643 9.542 10.98 12.34 14.04 17.24 21.34 23.03 24.94 27.30 28.82 30.81 32.14 33.92 36.78 40.29 42.80 48.27 50.51 2223 9.260 10.20 11.69 13.09 14.85 18.14 22.34 24.07 26.02 28.43 29.98 32.01 33.36 35.17 38.08 41.64 44.18 49.73 52.00 2324 9.886 10.86 12.40 13.85 15.66 19.04 23.34 25.11 27.10 29.55 31.13 33.20 34.57 36.42 39.36 42.98 45.56 51.18 53.48 2425 10.52 11.52 13.12 14.61 16.47 19.94 24.34 26.14 28.17 30.68 32.28 34.38 35.78 37.65 40.65 44.31 46.93 52.62 54.95 2526 11.16 12.20 13.84 15.38 17.29 20.84 25.34 27.18 29.25 31.79 33.43 35.56 36.98 38.89 41.92 45.64 48.29 54.05 56.41 2627 11.81 12.88 14.57 16.15 18.11 21.75 26.34 28.21 30.32 32.91 34.57 36.74 38.18 40.11 43.19 46.96 49.64 55.48 57.86 2728 12.46 13.56 15.31 16.93 18.94 22.66 27.34 29.25 31.39 34.03 35.71 37.92 39.38 41.34 44.46 48.28 50.99 56.89 59.30 2829 13.12 14.26 16.05 17.71 19.77 23.57 28.34 30.28 32.46 35.14 36.85 39.09 40.57 42.56 45.72 49.59 52.34 58.30 60.73 2930 13.79 14.95 16.79 18.49 20.60 24.48 29.34 31.32 33.53 36.25 37.99 40.26 41.76 43.77 46.98 50.89 53.67 59.70 62.16 3031 14.46 15.66 17.54 19.28 21.43 25.39 30.34 32.35 34.60 37.36 39.12 41.42 42.95 44.99 48.23 52.19 55.00 61.10 63.58 3132 15.13 16.36 18.29 20.07 22.27 26.30 31.34 33.38 35.66 38.47 40.26 42.58 44.13 46.19 49.48 53.49 56.33 62.49 65.00 3233 15.82 17.07 19.05 20.87 23.11 27.22 32.34 34.41 36.73 39.57 41.39 43.75 45.31 47.40 50.73 54.78 57.65 63.87 66.40 3334 16.50 17.79 19.81 21.66 23.95 28.14 33.34 35.44 37.80 40.68 42.51 44.90 46.49 48.60 51.97 56.06 58.96 65.25 67.80 3435 17.19 18.51 20.57 22.47 24.80 29.05 34.34 36.47 38.86 41.78 43.64 46.06 47.66 49.80 53.20 57.34 60.27 66.62 69.20 3536 17.89 19.23 21.34 23.27 25.64 29.97 35.34 37.50 39.92 42.88 44.76 47.21 48.84 51.00 54.44 58.62 61.58 67.99 70.59 3637 18.59 19.96 22.11 24.07 26.49 30.89 36.34 38.53 40.98 43.98 45.89 48.36 50.01 52.19 55.67 59.89 62.88 69.35 71.97 3738 19.29 20.69 22.88 24.88 27.34 31.81 37.34 39.56 42.05 45.08 47.01 49.51 51.17 53.38 56.90 61.16 64.18 70.70 73.35 3839 20.00 21.43 23.65 25.70 28.20 32.74 38.34 40.59 43.11 46.17 48.13 50.66 52.34 54.57 58.12 62.43 65.48 72.05 74.73 3940 20.71 22.16 24.43 26.51 29.05 33.66 39.34 41.62 44.16 47.27 49.24 51.80 53.50 55.76 59.34 63.69 66.77 73.40 76.10 4045 24.31 25.90 28.37 30.61 33.35 38.29 44.34 46.76 49.45 52.73 54.81 57.50 59.29 61.66 65.41 69.96 73.17 80.08 82.88 4550 27.99 29.71 32.36 34.76 37.69 42.94 49.33 51.89 54.72 58.16 60.35 63.17 65.03 67.50 71.42 76.15 79.49 86.66 89.56 5060 35.53 37.48 40.48 43.19 46.46 52.29 59.33 62.13 65.23 68.97 71.34 74.40 76.41 79.08 83.30 88.38 91.95 99.60 102.7 6070 43.28 45.44 48.76 51.74 55.33 61.70 69.33 72.36 75.69 79.71 82.26 85.53 87.68 90.53 95.02 100.4 104.2 112.3 115.6 7080 51.17 53.54 57.15 60.39 64.28 71.14 79.33 82.57 86.12 90.40 93.10 96.58 98.86 101.9 106.6 112.3 116.3 124.8 128.3 8090 59.20 61.75 65.65 69.13 73.29 80.62 89.33 92.76 96.52 101.1 103.9 107.6 110.0 113.1 118.1 124.1 128.3 137.2 140.8 90100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 102.9 106.9 111.7 114.7 118.5 121.0 124.3 129.6 135.8 140.2 149.4 153.2 100120 83.85 86.92 91.57 95.70 100.6 109.2 119.3 123.3 127.6 132.8 136.1 140.2 143.0 146.6 152.2 159.0 163.6 173.6 177.6 120150 109.1 112.7 118.0 122.7 128.3 138.0 149.3 153.8 158.6 164.3 168.0 172.6 175.6 179.6 185.8 193.2 198.4 209.3 213.6 150200 152.2 156.4 162.7 168.3 174.8 186.2 199.3 204.4 210.0 216.6 220.7 226.0 229.5 234.0 241.1 249.4 255.3 267.5 272.4 200

Tabela produzida no software R

Page 238: PROBABILIDADES E ESTAT´ISTICA ISABEL NATARIO´ · distribuicao dos dados em classes e pelo no calculo de medidas resumo que os descrevam de forma fiel. A forma de analisar os dados

Capıtulo 16

Bibliografia sugerida (ordem alfabetica)

• Guimaraes e Cabral(1997). Estatıstica. McGraw-Hill.

• Kvanli (1988). Statistics. West Publishing Company.

• Montgomery e Runger (2002). Applied Statistics and Probability for Engineers. Wiley.

• Mood, Graybill e Boes (1974). Introduction to the Theory of Statistics. McGraw-Hill.

• Paulino e Branco (2005). Exercıcios de Probabilidade e Estatıstica. Escolar Editora.

• Rohatgi (1976). An Introduction to Probability Theory and Mathematical Statistics. Wiley.

• Sokal e Rohlf (1995). Biometry. Freeman.

• Tiago de Oliveira (1990). Probabilidades e Estatıstica: Conceitos, Metodos e Aplicacoes, vol. I,II. McGraw-Hill.

236