apostila de estatística aplicada à química

Upload: alexandre-drummer

Post on 12-Jul-2015

1.790 views

Category:

Documents


0 download

TRANSCRIPT

MI ISTRIO DA EDUCAO U IVERSIDADE FEDERAL DO PIAU CE TRO DE CI CIAS DA ATUREZA DEPARTAME TO DE QUMICA

ESTATSTICA APLICADA QUMICA

Prof. Dr. Alexandre Araujo de Souza

Teresina PI 2010-2

SUMRIOASSUNTO 1. Conceitos Fundamentais em Estatstica. Organizao de dados quantitativos. Estatstica descritiva. Populao e amostra. Distribuies de frequncias. Tabelas. Grficos. Histogramas. Medidas de tendncia central e de disperso: mdia, mediana, moda, varincia, desvio-padro. Freqncia relativa e probabilidade. 2. Aplicao da Matemtica Estatstica. Varivel aleatria. Distribuies de probabilidade. A distribuio normal. Esperana. Varincia. Distribuio amostral das mdias. Estatstica inferencial. Teste de hipteses. Hiptese nula. Testes unilaterais e bilaterais. Erros do tipo I e do tipo II. Nvel de significncia. Teste Z. Teste t. Teste F. Intervalos de confiana. 3. Mtodos Grficos e Numricos. Diagramas de disperso. Correlao linear. Coeficiente de correlao de Pearson, r. Coeficiente de determinao, r2. Teste de hipteses sobre a correlao. Regresso linear simples. Mtodo dos mnimos quadrados. Anlise de resduos. 4. Fontes de Erro em Anlise Qumica. Algarismos significativos. Erro e desvio de uma medida. Exatido e preciso. Tipos de erros: determinados e indeterminados. Preciso de uma medida. Limite de confiana da mdia. Propagao de erros. Rejeio de resultados: teste Q. Amostragem. Padronizao. Calibrao. Validao. Certificao da qualidade. CARGA HORRIA

04 h

12 h

04 h

10 h

Captulo 1. Conceitos Fundamentais em Estatstica.

Introduo

Estatstica a cincia que faz uso efetivo dos dados numricos relativos a grupos de indivduos ou experimentos. Nesse sentido, ela trata de todos os aspectos, incluindo no s a coleta, organizao, anlise e interpretao dos dados, mas tambm o planejamento da coleta de dados. Importante dizer que todos os mtodos estatsticos baseiam-se na teoria das probabilidades. A Estatstica bastante til para orientar a tomada de decises baseada na anlise de um nmero muito grande de dados, tal como pesquisas de opinio pblica e de mercado. A palavra estatstica tambm pode ser usada para significar o prprio conjunto de dados, ou as grandezas a ele associadas, tais como a mdia e o desvio-padro. Assim, num conjunto de dados, podemos dizer que a mdia uma estatstica. A etimologia, ou origem da palavra Estatstica, mostra que ela deriva da palavra Estado. De fato, a expresso em Latim Moderno, statisticum collegium (conselho de Estado) e a palavra em Italiano, statista (homem de Estado, Poltico), fizeram com que o filsofo alemo Gottfried Achenwall (1719-1772) introduzisse o termo em Alemo, Statistik, em 1749, significando anlise dos dados sobre o Estado. Assim, a Estatstica foi originalmente desenvolvida para resolver questes de Estado, tais como taxas de nascimento e de mortalidade, impostos, heranas, fortunas, etc. Apesar de sua origem peculiar, a Estatstica hoje utilizada nas mais diversas reas. Ela est presente nas teorias mais fundamentais da Fsica Moderna, como a Mecnica Quntica, e hoje se sabe que a natureza das partculas fundamentais governada por leis estatsticas. Nas reas de Sade, a Estatstica conhecida como Bioestatstica. O nome pode ser diferente, mas os mtodos so os mesmos, sendo apenas as aplicaes especficas para as reas de Sade. A Qumica utiliza bastante a Estatstica, em suas diversas reas. Entretanto, a rea que mais faz uso da Estatstica a Qumica Analtica. Nesse sentido, a compreenso da teoria de erros e da obteno de retas de regresso, pelo mtodo dos mnimos quadrados, esto entre os pontos mais relevantes. Reconhecer os tipos de erros em anlises qumicas, saber como a propagao dos erros e como eles afetam o resultado de suma importncia para o qumico. As retas de regresso so bastante usadas nas curvas de calibrao, empregadas em diversas tcnicas de anlises quantitativas.

Populao e Amostra

Populao o conjunto de todos os elementos, ou resultados, do grupo em que estamos interessados em estudar alguma caracterstica. Um exemplo so todos os brasileiros do sexo feminino. Elas constituem uma populao, caso queiramos estudar alguma caracterstica delas, por exemplo, a estatura. Outro exemplo, se formos fabricantes de postes de concreto para iluminao e tivermos de testar a resistncia ruptura dos postes, para atender s normas tcnicas, ento toda a produo ser a nossa populao. Repare que, coletar os dados de uma populao, muitas vezes invivel, pois o custo muito alto, como no caso da pesquisa com todas as brasileiras. Em outros casos, a coleta de dados da populao destruiria toda a populao, como no caso dos postes de concreto para iluminao. O ensaio de resistncia trao danifica os postes. No sensato realizar esse experimento na populao, pois se trata de toda a sua produo. Uma populao pode ser finita ou infinita. Nos casos acima, as populaes so finitas. Se uma moeda jogada uma nica vez, a populao, P constituda pelo conjunto de todos os resultados possveis, ou seja, P = {cara;coroa}. Se uma moeda jogada duas vezes, a populao, P constituda pelo conjunto de todos os resultados possveis, ou seja, P = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}. Nesses dois exemplos, as populaes so finitas. No primeiro caso, a populao tem 21 = 2 (dois) elementos. No segundo caso, a populao tem 22 = 4 (quatro) elementos. Entretanto, considere uma moeda sendo jogada vrias vezes, indefinidamente. A cada jogada, d cara ou coroa. A populao, nesse caso infinita, pois consiste nas infinitas possibilidades de resultados possveis. Se uma moeda for jogada n vezes, o tamanho da populao ser dado por 2n.Exerccio Resolvido. Se uma moeda for jogada trs vezes (n=3), primeiro calcule o tamanho da populao e depois escreva o conjunto de resultados P que representa a populao. Resoluo: Tamanho da populao = 23 = 8 (oito) P = {cara/cara/cara; cara/cara/coroa; cara/coroa/cara; coroa/cara/cara; coroa/cara/coroa; coroa/coroa/cara; cara/coroa/coroa; coroa/coroa/coroa}

Amostra um subconjunto de uma populao. uma frao de elementos, coletada da populao, para fins de anlise. Os dados geralmente so coletados a partir de amostras. Esse processo de coleta de dados denominado amostragem. A amostra deve ser representativa da populao. Por exemplo, se resolvermos pesquisar apenas brasileiras de uma cidade onde a mdia das mulheres mais alta que a mdia nacional, ento chegaremos concluso errada de que a mulher brasileira mais alta do que realmente . Esse um exemplo de uma amostra que no representativa. Uma amostra representativa deve conter brasileiras de diversas cidades, de regies bem distintas do Brasil, com estaturas mdias bastante variadas. No caso da produo de postes de concreto para iluminao, apenas uma pequena frao da produo (amostra) dever ser sacrificada para atender norma tcnica. No caso de uma moeda que foi jogada apenas duas vezes (n=2), apesar do tamanho da populao ser pequeno (22=4), a quantidade de amostras possveis bem grande, pois cada subconjunto uma amostra. S para se ter uma idia, e lembrando que o conjunto vazio { }, bem como o conjunto todo, so sempre subconjuntos de qualquer conjunto, podemos escrever aqui apenas algumas das amostras possveis para essa pequena populao: P={cara/cara; cara/coroa; coroa/cara; coroa/coroa}. Teremos amostras com zero, um, dois, trs e quatro elementos. O tamanho da amostra o nmero de elementos da amostra. Este exemplo foi colocado para ilustrar que h sempre uma enorme quantidade de amostras, para qualquer populao. Amostras (subconjuntos) possveis para uma populao onde uma moeda foi jogada duas vezes: A01 = { } A02 = {cara/cara} A03 = {cara/coroa} A04 = {coroa/cara} A05 = {coroa/coroa} A06 = {cara/cara; cara/coroa} A07 = {cara/cara; coroa/cara} A08 = {cara/cara; coroa/coroa} A09 = {cara/cara; cara/coroa; coroa/cara} A10 = {cara/cara; cara/coroa; coroa/coroa}

Afinal = {cara/cara; cara/coroa; coroa/cara; coroa/coroa}.

Organizao de Dados Quantitativos

Os dados quantitativos so representados por nmeros e so denominados variveis aleatrias. Para se utilizar a Estatstica, os dados devem ser organizados em tabelas e grficos. O exemplo a seguir trata da anlise de ons cloreto [Cl] da gua tratada em um municpio brasileiro. Os valores das concentraes de cloreto na gua, medidos em 25 coletas so apresentados abaixo, em mg/L. Concentraes de ons cloreto [Cl] medidas em 25 coletas de gua tratada em um municpio brasileiro. As unidades esto em mg/L. 254 253 253 252 252 252 251 251 251 251 250 250 250 250 250 249 249 249 249 248 248 248 247 247 246 Os dados acima esto desorganizados. Vamos coloc-los na forma de uma tabela. A Tabela 1 apresenta os dados obtidos de forma organizada, colocando para cada valor obtido, a frequncia absoluta, f com que ele observado. Por exemplo, o valor 250 foi observado em 5 (cinco) coletas. Portanto, a frequncia absoluta do valor 250 f = 5. A frequncia relativa, fr representa a frao que o valor observado. Por exemplo, o valor 250 observado numa frao de fr = 0,20. Ou seja, em 20% das observaes. A frequncia relativa, fr calculada dividindo-se a frequncia absoluta , f pelo tamanho da amostra, N. = Tabela 1. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa. [Cl] f fr 246 1 0,04 247 2 0,08 248 3 0,12 249 4 0,16 250 5 0,20 251 4 0,16 252 3 0,12 253 2 0,08 254 1 0,04

A somatria de todas as frequncias absolutas numericamente igual ao tamanho da amostra. Podemos ver isso no exemplo da Tabela 1, fazendo a conta: 1+2+3+4+5+4+3+2+1 = 25 Essa igualdade representada pela equao abaixo, onde foi utilizado o smbolo de somatria, representado pela letra grega sigma maiscula, . = A somatria de todas as frequncias relativas numericamente igual unidade. Podemos ver isso no exemplo da Tabela 1, fazendo a conta: 0,04 + 0,08 + 0,12 + 0,16 + 0,20 + 0,16 + 0,12 + 0,08 + 0,04 = 1 Essa igualdade representada pela equao abaixo, onde foi utilizado o smbolo de somatria, representado pela letra grega sigma maiscula, .

=1 Os dados da Tabela 1 podem ser visualizados na forma grfica. Uma forma bastante usual o histograma de frequncias. Nesse grfico, a grandeza medida, ou varivel aleatria, colocada no eixo horizontal (abscissa) e a frequncia absoluta, ou a relativa, no eixo vertical (ordenada). A Figura 1 mostra o histograma de frequncias para os dados da Tabela 1.

0,20

0,15

fr

0,10

0,05

0,00 246 247 248 249 250 251 252 253 254

[Cl ]/mg/L

Figura 1. Histograma de frequncias para os dados da Tabela 1.

Observa-se, no histograma de frequncias da Figura 1, que a distribuio dos valores da varivel aleatria simtrica em relao a um valor central, igual a 250 mg/L. Esse comportamento compatvel com um tipo de distribuio de probabilidade que ser visto mais adiante, denominada distribuio normal.

Medidas de Tendncia Central

Um conjunto de dados pode ser representado por um nico nmero, denominado mdia. Trata-se de uma medida de tendncia central cujo significado vai ficar mais claro medida que os exemplos forem sendo dados. Considere o seguinte conjunto de dados: x1 = 40 x2= 41 x3 = 42 x4 = 43 x5 = 44 x6 = 45

A mdia aritmtica simples de um conjunto de dados, ou simplesmente mdia definida pela soma entre todos os elementos do conjunto, com a subsequente diviso pelo nmero de elementos do conjunto. Se o conjunto de dados for uma populao, a mdia populacional representada pela letra grega mi minscula, . Caso o conjunto de dados seja uma amostra, a mdia amostral representada pela por um pessoa que est fazendo a estatstica dos dados. Vamos considerar que os dados acima sejam uma amostra. Ento a mdia amostral ser dada por: = = 1 6 + + + + + com uma barra em cima, . Quem vai determinar se o conjunto de dados uma populao ou uma amostra a

1 40 + 41 + 42 + 43 + 44 + 45 6

=

= 42,5

1 255 6

A frmula geral da mdia aritmtica simples dada pelas equaes abaixo, onde o i que aparece denominado ndice e um nmero inteiro que varia, por exemplo, de 1 a n, no caso de uma populao, ou seja: i = 1, 2, 3, ..., n...

Frmula para a mdia populacional. O tamanho da populao n.

=

1

Frmula para a mdia amostral. O tamanho da amostra N.

=

1

No caso de dados, como os da Tabela 1, em que temos as frequncias, o clculo da mdia pode ser feito de uma das seguintes formas:

Frmula para a mdia amostral, usando as frequncias absolutas, tamanho da amostra N.

. O

=

1

Frmula para a mdia amostral, usando as frequncias relativas, caso, no preciso dividir pelo tamanho da amostra.

Neste

=

Faamos os clculos com os dados da Tabela 1, das duas formas. Primeiro usando as frequncias absolutas:1 1 246 + 2 247 + 3 248 + 4 249 + 5 250 + 4 251 + 3 252 + 2 253 + 1 254 25 = 1 6250 25 = 250

=

Agora, refaamos o clculo da mdia, usando as frequncias relativas:= 0,04 246 + 0,08 247 + 0,12 248 + 0,16 249 + 0,20 250 + 0,16 251 + 0,12 252 = 250 + 0,08 253 + 0,04 254

Observem que os valores calculados para as mdias foram o mesmo, pelos dois mtodos, ou seja, obteve-se uma mdia de

ons cloreto na gua tratada desse municpio brasileiro. Olhando para o histograma de

= 250 mg/L para a concentrao de

frequncias da Figura 1, vemos que esse valor coincide com o valor central da distribuio de frequncias. Para uma distribuio simtrica como essa, a mdia coincide com o valor central da distribuio. Isso ocorre na distribuio normal, a qual ser vista mais adiante. Por esta razo, a mdia considerada uma medida de tendncia central. Outras medidas de tendncia central so a moda e a mediana. A moda simplesmente o valor da varivel que possui a maior frequncia. No caso dos dados da Tabela 1, a moda 250 mg/L, pois o valor que possui a maior frequncia.

A mediana o valor central, que divide o conjunto de dados em partes iguais. Os valores dos dados devem ser previamente colocados em ordem crescente. Sendo N o tamanho da amostra, a posio da mediana pode ser encontrada pela equao abaixo. = +1 2

Considere o seguinte conjunto, com um nmero mpar de dados (N=11): 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 A posio da mediana ser: (11+1)/2 = 6 lugar. O valor da mediana ser 45.

Considere, agora, o seguinte conjunto, com um nmero par de dados (N=10): 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 A posio da mediana ser: (10+1)/2 = 5,5. Isso significa que a mediana est entre o 5 e o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que esto no 5 e no 6 lugar. Logo, o valor da mediana ser (44+45)/2 = 44,5. A mediana bastante til quando temos um valor muito discrepante dos demais. Por exemplo, as vendas de hambrguer numa lanchonete foram medidas num perodo de 10 dias. Entretanto, em um determinado dia, no 4 dia, houve uma grande festa na lanchonete e a venda foi muito mais alta. Vejamos os dados na Tabela 2.

Tabela 2. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em um perodo de 10 dias. Dia Vendas 1 48 2 47 3 52 4 320 5 50 6 45 7 46 8 53 9 44 10 49

Vamos calcular a mdia para os dados acima:1 48 + 47 + 52 + 320 + 50 + 45 + 46 + 53 + 44 + 49 10 = = 75,4 1 754 10

=

Vamos calcular a mediana, agora. Mas, para isso, primeiro temos que colocar os dados em ordem crescente, na Tabela 3.

Tabela 3. Nmero de hambrgueres vendidos, em uma determinada lanchonete, em um perodo de 10 dias. Dados colocados em ordem crescente. Dia Vendas 9 44 6 45 7 46 2 47 1 48 10 49 7 50 3 52 8 53 4 320

A posio da mediana ser: (10+1)/2 = 5,5. Ento, a mediana est entre o 5 e o 6 lugar. Neste caso, o valor da mediana a mdia entre os valores que esto no 5 e no 6 lugar, na Tabela 3. Logo, o valor da mediana ser (48+49)/2 = 48,5. A mdia 75,4 e a mediana, 48,5. Qual dessas duas medidas reflete melhor as vendas dirias da lanchonete? bvio que a mediana. E sabe por qu? Porque a mediana no afetada por valores extremos. J o valor da mdia ficou bem alto, justamente por causa do valor extremo, 320. Nem sempre a mdia a melhor medida.

Medidas de Disperso

A disperso de um conjunto de dados pode ser representado por um nico nmero, denominado varincia cujo significado vai ficar mais claro medida que os exemplos forem sendo dados. A varincia calculada de forma diferente, caso o conjunto de dados seja uma populao, ou uma amostra. E lembre-se que a pessoa que est fazendo a estatstica dos dados que vai determinar se o conjunto de dados uma populao ou uma amostra.

Frmula para a varincia populacional, var(x)= 2. A varincia populacional representada pelo quadrado da letra grega sigma minscula, . O tamanho da populao n.

=

=

1

Frmula para a varincia amostral. A varincia amostral representada pelo quadrado da letra romana s minscula. O tamanho da amostra N.

=

1 1

A varincia tem o significado de ser uma mdia dos quadrados dos desvios entre cada valor e a mdia amostral, ou populacional. Se todos esses desvios fossem zero, = 0, a varincia seria zero. Verifique que, se o tamanho

da amostra for muito grande, no far diferena usar N1 ou N no denominador da ltima equao para s2. A diferena s relevante para amostras pequenas.

Considere o seguinte conjunto de dados abaixo, cuja mdia 42,5. x1 = 40 x2= 41 x3 = 42 x4 = 43 x5 = 44 x6 = 45

Se o conjunto de dados acima for uma populao de media =42,5 e tamanho n=6, ento a varincia populacional calculada da seguinte forma:1 40 42,5 6

=

+ 41 42,5

+ 42 42,5 =

= 2,91666

1 17,5 6

+ 43 42,5

+ 44 42,5

+ 45 42,5

,

Se o conjunto de dados acima for uma amostra de media N=6, ento a varincia amostral calculada da seguinte forma:1 61

= 42,5 e tamanho

=

40 42,5

+ 45 42,5

+ 41 42,5 =

+ 42 42,5 1 17,5 5

+ 43 42,5

+ 44 42,5

= ,

Existe uma frmula prtica para calcular a varincia populacional, que a seguinte. = = 42,5

fcil obter o valor de O valor de

= 1806,25.

obtido a partir da mdia dos quadrados dos valores de x.

x12 = (40)2= 1600 x22= (41)2= 1681 x32 = (42)2= 1764

x42 = (43)2= 1849 x52 = (44)2= 1936 x62 = (45)2= 2025

=

1 1600 + 1681 + 1764 + 1849 + 1936 + 2025 6 = 1809,1666 = 1 10855 6

1809,17

Assim, a varincia calculada pela diferena:

= 1809,17 1806,25 = ,

=

A varincia tem a desvantagem de ter unidades da varivel ao quadrado. Por isso, define-se uma medida de disperso muito utilizada denominada desvio-padro como sendo a raiz quadrada da varincia. Assim, teremos as seguintes equaes.

Desvio-padro populacional: = =

Desvio-padro amostral: = Vamos agora comparar dois conjuntos de dados amostrais, com varincias

distintas. Primeiramente, vamos utilizar os dados da Tabela 1. Na Tabela 4, reproduzimos esses dados e acrescentamos os quadrados das concentraes de cloreto, para ficar mais fcil calcular a varincia. Vamos supor, somente por simplicidade de clculo, que esses dados sejam referentes a uma populao.

Tabela 4. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa.[Cl] [Cl]2 f fr 246 60516 1 0,04 247 61009 2 0,08 248 61504 3 0,12 249 62001 4 0,16 250 62500 5 0,20 251 63001 4 0,16 252 63504 3 0,12 253 64009 2 0,08 254 64516 1 0,04

=

=

1 1 60516 + 2 61009 + 3 61504 + 4 62001 + 5 62500 + 4 63001 + 3 63504 25 + 2 64009 + 1 64516

=

=

=

1 1562600 25

= 62504 62500 =

=

2

2

Desvio-padro populacional:

= = mg/L

Os dados da Tabela 1 constituem uma distribuio simtrica, muito similar a uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 2 mg/L.

Vamos calcular, agora, a mdia e a varincia para o conjunto de dados da Tabela 5, assumindo que se trata de uma populao. A Figura 2 apresenta o histograma de frequncias para os dados da Tabela 5.

Tabela 5. Concentrao de ons cloreto [Cl] medidos na gua tratada de um municpio brasileiro. As unidades de concentrao esto em mg/L. Tamanho da amostra, =25. f = frequncia absoluta. fr =frequncia relativa.[Cl] [Cl]2 f fr 246 60516 1 0,04 247 61009 1 0,08 248 61504 2 0,12 249 62001 8 0,16 250 62500 8 0,20 251 63001 8 0,16 252 63504 2 0,12 253 64009 1 0,08 254 64516 1 0,04

0,25

0,20

0,15

fr0,10 0,05 0,00 246 247 248 249 250 251 252 253 254

[Cl ] / mg/L

Figura 2. Histograma de frequncias para os dados da Tabela 5.

= =

1 1 246 + 1 247 + 2 248 + 8 249 + 8 250 + 8 251 + 2 252 + 1 253 + 1 254 25 1 8000 32

=

=

= 1 1 60516 + 1 61009 + 2 61504 + 8 62001 + 8 62500 + 8 63001 + 2 63504 32 1 2000082 32 , + 1 64009 + 1 64516

= =

=

= 62502,5625 62500 = , ,

=

2

2

Desvio-padro populacional:

=

= ,

Os dados da Tabela 5 constituem uma distribuio simtrica, muito similar uma distribuio normal e possuem mdia 250 mg/L e desvio-padro 1,6 mg/L. Com relao aos dados da Tabela 1, a mdia manteve-se a mesma. Entretanto, o desviopadro apresentou-se menor no segundo caso. Esse fato pode ser visualizado pela comparao dos histogramas de frequncia das Figuras 1 e 2. No primeiro caso, os dados esto mais dispersos, enquanto que, no segundo caso, os dados esto mais concentrados em torno do valor central. Em outras palavras, a disperso dos dados maior no primeiro caso e esse fato medido pelo valor maior do desvio-padro da distribuio de frequncias.

0,20

0,25

0,20 0,15 0,15

fr

fr0,10 0,05 0,00 246 247 248 249 250 251 252 253 254 246 247 248 249 250 251 252 253 254

0,10

0,05

0,00

[Cl ]/mg/L

[Cl ] / mg/L

Figura 1. Histograma de frequncias para os dados da Tabela 1. = 250 mg/L ; = 2,0 mg/L

Figura 2. Histograma de frequncias para os dados da Tabela 5. = 250 mg/L ; = 1,6 mg/L

Dados Agrupados

Muitas vezes, os dados aparecem na forma de dados agrupados, como ocorre na Tabela 6.

Tabela 6. Peso de pessoas que trabalham em certa companhia. (N=40) Peso / kg 64-66 67-69 70-72 Frequncia Absoluta 16 21 2

Para se calcular a mdia em um conjunto de dados como esse, devemos fazer a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O histograma de frequncias da Figura 3 ilustra esse conceito.

20

frequncia absoluta

15

10

5

0 64 65 66 67 68 69 70 71

pesos / kg

Figura 3. Histograma de frequncias para os dados agrupados da Tabela 6.

Assim, a mdia da distribuio pode ser calculada atravs da equao abaixo, onde o ponto mdio de cada classe. Faamos o clculo para o exemplo da 1 Tabela 6. =

=

1 40

16 65 + 21 68 + 2 71 = 1 2610 40 ,

=

Vamos supor que tivssemos acesso aos dados mais completos e pudssemos construir a tabela de dados agrupados mostrada na Tabela 7.

Tabela 7. Peso de pessoas que trabalham em certa companhia. (N=40) Peso / kg 64 65 66 67 68 69 70 72 Frequncia Absoluta 3 5 8 11 7 3 2 1

Agora podemos calcular a mdia e comparar com aquela anteriormente feita, com a suposio de que a distribuio dos pesos uniforme dentro de cada classe. O histograma de frequncias da Figura 4 mostra a real distribuio dos pesos.

10

Frequncia Absoluta

8

6

4

2

0 64 65 66 67 68 69 70 71 72

Pesos / kg

Figura 4. Histograma de frequncias para os dados da Tabela 7.

=

1 3 64 + 5 65 + 8 66 + 11 67 + 7 68 + 3 69 + 3 70 + 1 72 40 = = 1 2747 40 ,

=

1

O mesmo se dar ao se calcular a varincia. Esse erro se deveu ao fato de termos poucos dados agrupados na Tabela 6 e de termos feito a suposio de que a distribuio dos pesos uniforme dentro de cada classe. Entretanto, no h outra suposio razovel que se possa fazer. Logo, muitas vezes, pela falta de dados, temos de aceitar o fato de que haver um erro.

agrupados das Tabelas 6 e 7, verificamos que h um erro: = 68,68 65,25 = 3,43.

Comparando com os resultados da mdias calculadas com os dados

Probabilidade

Experimento Aleatrio

No experimento exemplificado anteriormente, a concentrao de ons cloreto foi medida na gua tratada de um municpio brasileiro. O que se obteve como resultado foi uma distribuio de valores. Por que no se obteve um valor nico? Por vrias razes. Talvez a concentrao dos ons cloreto seja realmente diferente em cada ponto de coleta, ou ento pode ter havido erros de vrios tipos durante as determinaes quantitativas. Quando um experimento pode resultar em uma distribuio de resultados possveis, ele denominado experimento aleatrio. Esse o tipo de experimento que interessa para a Estatstica. Uma varivel medida em um experimento aleatrio, como a concentrao dos ons cloreto, denominada varivel aleatria. A jogada de uma moeda, M vezes, tambm um experimento aleatrio, pois resulta em uma distribuio de resultados possveis, caras e coroas, que so as variveis aleatrias.

Espao Amostral

O conjunto de todos os resultados possveis para a varivel aleatria denominado espao amostral. Nesse sentido, o espao amostral tem o mesmo sentido da populao definida anteriormente. No caso das concentraes de ons cloreto, esse conjunto tem um tamanho infinito, pois h uma quantidade infinita de valores possveis para os resultados. Entretanto, h espaos amostrais de tamanho finito, como o caso do experimento aleatrio de uma moeda sendo jogada M vezes. O tamanho do espao amostral, neste caso, ser dado por 2M. Para simplificar a notao, representaremos o resultado cara pela letra K e coroa pela letra C.

Cara Coroa

= =

K C

Desde j vamos deixar bem claro que a jogada de uma nica moeda M vezes e uma nica jogada de M moedas so experimentos aleatrios completamente equivalentes, com os mesmos espaos amostrais. O espao amostral, para a jogada de uma moeda, possui 21 = 2 elementos dado pelo conjunto, A1 abaixo. O espao amostral, para a jogada de duas moedas, possui 22 = 4 elementos dado pelo conjunto, A2 abaixo. O espao amostral, para a jogada de trs moedas, possui 23 = 8 elementos e dado pelo conjunto, A3 abaixo.

A1 = {K, C} A2 = {KK, KC, CK, CC} A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Evento

Evento todo subconjunto de um espao amostral. Nesse sentido, evento tem o mesmo sentido da amostra definida anteriormente. Usando o exemplo acima, da jogada de trs moedas, podemos escrever alguns eventos abaixo, em relao ao espao amostral A3, com seus significados escritos ao lado.

E3,1 = {KKK, KKC, KCK, KCC}: Sair cara no lanamento da primeira moeda. E3,2 = {KKC, KCK, CKK}: Sair exatamente uma coroa. E3,3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK}: Sair no mximo duas coroas. E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras. E3,5 = {KKK}: No sair nenhuma coroa.

Probabilidade de um Evento

Para chegar ao conceito de probabilidade, vamos usar os exemplos vistos anteriormente. Considere o espao amostral para o lanamento de trs moedas, A3 e o evento que seja sair pelo menos duas caras, E3,4. A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC} E3,4 = {KKK, KKC, KCK, CKK}: Sair pelo menos duas caras. A pergunta a seguinte: no lanamento de trs moedas, qual a probabilidade de sair pelo menos duas caras? A maneira formal de definir probabilidade considera o seguinte:

N E = nmero de elementos do evento.

amostral A, dada pela seguinte razo:

Assim, a probabilidade, P(E) de ocorrncia do evento E, no espao = Para o exemplo acima, o clculo da probabilidade fica assim: = = 4 1 = = 0,50 8 2

N A = nmero de elementos do espao amostral.

caras no lanamento de trs moedas.

O resultado foi P E =0,50 ou seja, h 50% de chance de sair pelo menos duas

Exerccio Resolvido. Uma moeda jogada 2 vezes. Calcule a probabilidade de sair cara na primeira jogada e coroa na segunda. Resoluo: Primeiro escrevem-se o espao amostral e o evento, com os respectivos tamanhos. A2 ={KK, KC, CK, CC}; N(A) = 4; A seguir, calcula-se a probabilidade do evento, pela equao abaixo. = = 1 = 0,25 4 E2,1 = {KC}; N(E) = 1

Logo, h 25% de chance de sair cara na primeira jogada e coroa na segunda.

Frequncia Relativa e Probabilidade

Uma segunda forma de definir probabilidade atravs do conceito de frequncia relativa. Neste caso, definimos as seguintes grandezas:

nE = nmero de vezes que o evento E observado. N = nmeros de vezes que o experimento aleatrio repetido. Assim, a frequncia relativa, f de ocorrncia do evento E, no experimento

aleatrio, dada pela seguinte razo:

=

No lanamento de trs moedas, a frequncia relativa de sair pelo menos duas caras depende do nmero de repeties e do que foi observado. Se o experimento foi repetido N=100 vezes e obtiveram-se pelo menos duas caras em nE = 48 vezes, ento Acompanhe o clculo abaixo. a frequncia relativa de sair pelo menos duas caras, neste caso foi f=0,48. = = 48 = 0,48 100

probabilidade (P=0,50). De fato, o valor da frequncia relativa tende para o valor da probabilidade, quando o experimento aleatrio for repetido um nmero muito grande de vezes. Por isso, vlida a seguinte definio de probabilidade, que utiliza o conceito de limite, quando N tender a infinito (). = lim

Verifique que o valor obtido aproxima-se bastante do valor calculado para a

Probabilidade da Unio de dois Eventos Mutuamente Excludentes

A unio de dois conjuntos A e B, simbolizada por AB, o conjunto que contm todos os elementos dos dois conjuntos. Por exemplo, considere os conjuntos A e B a seguir:

A = {1,3,5,7,9} B = {0,2,4,6,8}

Os conjuntos A e B acima no contm nenhum elemento em comum. So assim chamados conjuntos disjuntos, ou mutuamente excludentes. Diz-se que a interseo entre eles vazia, ou seja; AB = { }. A unio AB ser o conjunto dado abaixo: AB = {0,1,2,3,4,5,6,7,8,9} Agora vamos tratar da probabilidade da unio de dois eventos mutuamente excludentes. A probabilidade da unio de dois eventos A e B, mutuamente excludentes, igual soma das probabilidades de cada evento individual. A probabilidade da unio de dois eventos A e B interpretada como a probabilidade de ocorrncia do evento A ou do evento B.

=

=

+

(Eventos mutuamente excludentes)

Considere, agora, uma moeda sendo jogada duas vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A2 = {KK, KC, CK, CC} Vamos considerar dois eventos que sejam mutuamente excludentes. Por exemplo:

E2,1 = {KK}: Sair duas caras. E2,2={KC,CK}: Sair exatamente uma cara (ou uma coroa).

A unio desses dois eventos o seguinte conjunto: E2,1E2,2 = {KK, KC, CK} Pode-se ver que os eventos E2,1 e E2,2 so mutuamente excludentes, pois no apresentam nenhum elemento em comum. Ento podemos calcular a probabilidade da unio dos dois eventos pela equao acima. Primeiro, calculamos as probabilidades dos eventos individuais., ,

= =

, ,

= =

1 = 0,25 4 2 = 0,50 4

A seguir, aplicamos a equao da soma, para calcular a probabilidade da unio dos eventos.2,1

2,1

2,2

2,1

2,2

=

2,2

= 0,25 + 0,50 = 0,75

2,1

+

2,2

Interpretamos a resposta assim: a probabilidade de sair duas caras ou exatamente uma cara (ou uma coroa) de 75%. Tambm podemos dizer que a probabilidade de ocorrncia do evento unio E2,1E2,2 de 75%. Essa conta s foi vlida dessa forma porque os dois eventos eram mutuamente excludentes. Vamos aprender, mais a frente, a calcular a probabilidade da unio de eventos que no so mutuamente excludentes.

Probabilidade da Interseo de dois Eventos

A interseo de dois conjuntos A e B, simbolizada por AB, o conjunto que contm todos os elementos que pertencem simultaneamente aos dois conjuntos. Por exemplo, considere os conjuntos A e B a seguir:

A = {1,2,5,6,9} B = {0,2,4,6,8}

A interseo entre os conjuntos A e B acima o conjunto dado abaixo: AB = {2,6} Como se v, os conjuntos A e B acima possuem dois elementos em comum. Portanto no so disjuntos, ou seja, no so mutuamente excludentes. No h uma frmula geral para calcular a probabilidade da interseo entre dois eventos A e B. Por isso, teremos de obter a interseo e contar seu nmero de elementos. A partir da, a interseo passa a ser vista como um evento e a probabilidade calculada com a frmula da probabilidade de um evento. A probabilidade da interseo de dois eventos A e B interpretada como a probabilidade de ocorrncia do evento A e do evento B. Consideremos uma moeda sendo jogada trs vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A3 = {KKK, KKC, KCK, KCC, CKK, CKC, CCK, CCC}

Vamos considerar os dois eventos seguintes; E3,1 = {KKC, CCK}: Sair duas caras ou duas coroas, nas duas primeiras jogadas. E3,2 = {KKC, KCK, CKK}: Sair exatamente duas caras. A interseo desse dois eventos dada pelo conjunto abaixo: E2,1E2,2 = {KKC} Logo, a probabilidade da interseo desses dois eventos calculada pela equao abaixo.

E2,1 E2,2 =

E2,1 E2,2

=

1 = 0,125 8

Interpretamos a resposta assim: a probabilidade de sair duas coroas, nas duas primeiras jogadas e sair exatamente duas caras igual a 12,5%. Tambm podemos dizer que a probabilidade de ocorrncia do evento interseo E2,1E2,2 de 12,5%.

Probabilidade Geral da Unio de dois Eventos

Agora estamos em condies de formular a equao que estabelece a probabilidade da unio de dois eventos A e B, sejam eles mutuamente excludentes, ou no. A frmula bastante geral e dada abaixo.

=

=

+

equao torna-se igual quela que foi vista anteriormente. Assim, v-se que aquela equao um caso particular desta ltima.

No caso dos eventos mutuamente excludentes, o termo P AB =0 e a

Por exemplo, considere, agora, uma moeda sendo jogada duas vezes. J vimos que o espao amostral dado pelo conjunto abaixo: A2 = {KK, KC, CK, CC} Vamos considerar dois eventos que no sejam mutuamente excludentes, ou seja, que tenham pelo menos um elemento em comum. Por exemplo: E2,1 = {KK}: Sair duas caras. E2,2 = {KK, KC,CK}: Sair pelo menos uma cara. A interseo entre os eventos dada pelo conjunto abaixo: E2,1E2,2 = {KK} Vamos agora calcular a probabilidade da unio dos dois eventos, usando a ltima equao.2,1

2,2

=

2,1

+

2,2

2,1

2,2

2,1

2,2 2,1

= 2,2

2,1

=

Interpretamos a resposta assim: a probabilidade de sair duas caras ou de sair pelo menos uma cara de 75%. Note que, se no fosse a subtrao do termo de probabilidade de interseo, a soma teria chegado a 100%, dando um resultado errado.Exerccio Resolvido. Uma dado de seis faces jogado 2 vezes. Calcule (a) a probabilidade de sair 1 na primeira jogada e 2 na segunda jogada; (b) a probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada.

1 3 1 3 + = = 0,75 4 4 4 4

+

2,2

2,1

2,2

Resoluo: Primeiro escrevem-se o espao amostral e os eventos, com os respectivos tamanhos. A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}; N(A2) = 36 N(E2,1) = 6 N(E2,1) = 6

E2,1 = {11, 12, 13,14, 15, 16}: Sair 1 na primeira jogada. E2,2 = {12, 22, 32, 42, 52, 62}: Sair 2 na segunda jogada.

Os eventos no so mutuamente excludentes. Eles tm um elemento em comum. A interseo entre os eventos o conjunto: E2,1 E2,2 = {12}. N(E2,1 E2,2) = 1

(a) A probabilidade de sair 1 na primeira jogada e 2 na segunda jogada a probabilidade da interseo entre os dois eventos, ou seja, dado pelo clculo abaixo:,

,

=

,

,

=

Jogando um dado duas vezes, h uma chance de 2,78% de sair 1 na primeira jogada e 2 na segunda jogada.

1 = 0,0278 36

(b) A probabilidade de sair 1 na primeira jogada ou 2 na segunda jogada a probabilidade da unio entre os dois eventos, ou seja, dado pelo clculo abaixo:, , ,

,

, ,

=

Jogando um dado duas vezes, h uma chance de 30,6% de sair 1 na primeira jogada ou 2 na segunda jogada.

6 6 1 + = 0,167 + 0,167 0,0278 = 0,306 36 36 36

=

=

,

,

+

+

,

,

,

,

,

,

Amostragem com Reposio

Amostragem significa escolher alguns elementos da populao. Ela pode ser feita com reposio, ou sem reposio. Na amostragem com reposio, uma vez que o elemento escolhido uma vez, ele pode voltar a ser escolhido novamente. Esse o caso das jogadas de moedas e dados. Uma vez que deu resultado cara, na jogada de uma moeda, nada impede que d cara novamente na prxima jogada. Quando se joga uma moeda M vezes, o nmero de resultados possveis dado por 2M. Da mesma forma, quando se joga um dado M vezes, o nmero de resultados possves dado por 6M. De um modo geral, quando escolhemos M objetos, com reposio, de uma populao de A objetos, teremos AM maneiras distintas de selecionar os objetos. Vamos analisar um exemplo interessante, usando amostragem com

reposio.Considere uma prova com 30 questes de mltipla escolha, com cinco alternativas em cada questo. Qual a probabilidade de tirar a nota mxima na prova, apenas na sorte? Neste caso, podemos considerar que estamos escolhendo M=30 questes, com reposio, de uma populao de A=5 alternativas. O nmero total de respostas possveis dado por AM = 530 = 9,31 x 1020. Como h apenas uma maneira de se responder a prova para tirar a nota mxima, essa probabilidade ser dada pela conta abaixo. Verifica-se que o resultado P=1021 extremamente baixo para que algum consiga acertar a prova toda, apenas na sorte. = 1 9,31 10 = 1,07 10

Amostragem sem Reposio

Veremos agora a amostragem sem reposio. Na amostragem sem reposio, uma vez que o elemento escolhido uma vez, ele no pode voltar a ser escolhido novamente. Considere que h sete camisas em uma gaveta, para serem usadas durante a semana, uma cada dia. Suponha que, a cada dia, uma camisa retirada da gaveta, mas no devolvida, pois vai para o cesto de roupas para serem lavadas. No

domingo, h sete camisas. Na segunda-feira, haver seis. Na tera-feira, cinco. E assim por diante. No sbado s haver uma camisa na gaveta. De quantas maneiras diferentes podem-se escolher as camisas para os sete dias da semana? No domingo, h 7 escolhas possveis de camisas. Na segunda-feira, h 6 escolhas possveis. Ento, haver 7x6=42 escolhas possveis para os dois primeiros dias. Continuando o processo, podemos concluir que haver o seguinte nmero de escolhas possveis de camisas para toda a semana; 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 5 040 Em outras palavras, h 5040 maneiras diferentes de se escolher as camisas durante a semana, assumindo que a retirada das camisas sem reposio. Este uma caso de permutao de 7 camisas. Caso a escolha tivesse sido feita com reposio, esse nmero seria bem maior: 7 =823 543. O valor 7! denominado fatorial de 7. O fatorial de um nmero muito importante na teoria das probabilidades. Abaixo esto os valores dos fatoriais de zero a dez, dando a idia do conceito. Os valores dos fatoriais crescem muito depressa e nmeros grandes tm fatoriais gigantescos, por exemplo, 70! 10100. Por definio, o fatorial de zero 1.7

0! =1 1! = 1 2! =2x1 =2 3! = 3x2x1 = 6 4! = 4x3x2x1 = 24 5! = 5x4x3x2x1 = 120 6! = 6x5x4x3x2x1 = 720 7! = 7x6x5x4x3x2x1 = 5 040 8! = 8x7x6x5x4x3x2x1 = 40 320 9! = 9x8x7x6x5x4x3x2x1 = 362 880 10! = 10x9x8x7x6x5x4x3x2x1 = 3 628 800

Arranjos

Vamos considerar ainda a amostragem sem reposio. Entretanto, considere agora que h dez camisas em uma gaveta, para serem usadas durante a semana, uma cada dia. Note que, neste caso, nem todas as camisas sero usadas. De quantas maneiras diferentes podem-se escolher as camisas para os sete dias da semana? H 10 escolhas para o domingo, 9 para a segunda, 8 para a tera, e assim por diante. No sbado haver 4 camisas na gaveta. Podemos concluir que haver o seguinte nmero de escolhas possveis de camisas para toda a semana: 10 x 9 x 8 x 7 x 6 x 5 x 4=604 800 Em outras palavras, h 604 800 maneiras diferentes de se escolher as camisas durante a semana, assumindo que a retirada das camisas sem reposio. Este uma caso de arranjo de 10 camisas durante os 7 dias da semana. Podemos escrever uma frmula conveniente para arranjos, em termos de fatoriais. Vamos usar o ltimo exemplo para deduzir essa frmula. Note que a ltima expresso pode ser reescrita na forma abaixo: 10 9 8 7 6 5 4 3 2 1 10! 10! = = = 604 800 321 3! 10 7 ! A expresso acima mostra que a frmula para o arranjo,

escolhidos sem reposio, de uma populao de n objetos pode ser escrita na forma abaixo. = ! !

de j objetos,

Combinaes

Vamos considerar ainda a amostragem sem reposio. Vamos considerar uma exemplo bastante conhecido na loteria, a Mega-Sena. So 60 dezenas e voc tem de acertar seis. A pergunta , de quantas formas distintas pode-se escolher as seis dezenas?

Poderamos pensar em um arranjo. No incio tem-se 60 dezenas. Depois de sorteada a primeira dezena, sobram 59. Depois de sorteada a segunda, sobram 58. E assim por diante. Pode-se pensar no seguinte clculo de arranjo: 60 x 59 x 58 x57 x56 x55 = 36 045 979 200 Esse resultado seria calculado pela frmula do arranjo , dada abaixo.

=

60! 60! 60 59 58 57 56 55 54! = = = 36 045 979 200 54! 60 6 ! 54!

O nico problema com esse clculo o seguinte. Suponha que tenha sado as dezenas: 01, 05, 23, 25, 37, 39. Esse clculo conta todas as permutaes possveis dessas dezenas. Ento, temos de dividir o resultado pelo nmero de permutaes, ou seja 6! = 720. Isto porque a ordem em que os resultados saem no importa. Assim, a frmula para a combinao dada pela frmula abaixo. = ! de n objetos, tomados j de cada vez !

!

Fazendo o clculo da combinao de 60 objetos, tomados 6 de cada vez, chegamos ao nmero de formas distintas que se pode escolher as seis dezenas na Mega-Sena.60! 60! 60 59 58 57 56 55 54! 36 045 979 200 60 = = = = = 50 063 860 6 6! 60 6 ! 6! 54! 720 6! 54!

Probabilidade Condicional Dados dois eventos A e B, a probabilidade condicional P A|B Considere N AB o nmero de elementos e P AB

a

probabilidade de ocorrncia do evento A, dado que o evento B tenha ocorrido. ocorrncia da interseo entre os eventos A e B. Considere, tambm N B o nmero a probabilidade de

clculo da probabilidade condicional P A|B dada abaixo. | = =

de elementos e P B a probabilidade de ocorrncia do evento B. A expresso para o

zero, ou seja, P A|B =0.

Note que se a interseo AB for vazia, ento a probabilidade condicional ser

Um exemplo a jogada de um dado duas vezes. O espao amostral tem N(A2)=36 elementos e dado pelo conjunto abaixo. A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66} Considere os seguintes eventos: E2,1 = {12, 21}: Obter soma 3 nas duas jogadas. N(E2,1)=2 E2,2 = {21, 22, 23, 24, 25, 26}: Obter 2 na primeira jogada. N(E2,2)=6 A interseo entre os dois eventos dada pelo conjunto abaixo: E2,1E2,2 = {21}. A probabilidade condicional, , ,

N(E2,1E2,2) = 1

=

,

,

,

dada pela equao abaixo.,

=

1 = 0,167 6

Ento, a probabilidade condicional de obter soma 3 nas duas jogadas, dado que se obteve 2 na primeira jogada de 16,7%.

Eventos Independentes

Dois eventos A e B so independentes se a equao abaixo for verdadeira:

|

=

Considere que aparea um 3 na primeira jogada de um dado. No que isso afeta a probabilidade de aparecer qualquer outro nmero na prxima jogada? A resposta que no afeta em nada. Nesse caso, os eventos so independentes. Portanto, para eventos independentes pode-se escrever a expresso abaixo.

=na forma abaixo. =

Lembrando que P(AB)=P(A e B), essa ltima expresso pode ser rearranjada

(eventos independentes)

Por exemplo, na jogada de dois dados, qual a probabilidade de aparecer 3 na primeira jogada e 5 na segunda jogada? A2 ={11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25,26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}. N(A2) = 36 Considere os seguintes eventos independentes: E2,1 = {31, 32, 33, 34, 35, 36}: Aparecer 3 na primeira jogada. N(E2,1)=6 E2,2 = {15, 25, 35, 45, 55, 65}: Aparecer 5 na segunda jogada. N(E2,2)=6, ,

=

,

,

=

6 6 1 1 1 = = = 0,0278 36 36 6 6 36

Ento, na jogada de dois dados, a probabilidade de aparecer 3 na primeira jogada e 5 na segunda jogada de 2,78%.

Problemas

1. Quais so os significados da palavra Estatstica? 2. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) populao; (b) amostra; (c) populao de tamanho infinito; (d) populao de tamanho finito; (e) amostra representativa; (f) amostra no representativa. 3. Considere os conjuntos de dados amostrais A e B, abaixo. Para cada um, calcule a mdia, a mediana e a moda. (a) A={28, 22 , 33, 30, 100, 28, 25, 30, 27, 28} (b) B={213, 210, 215, 213, 220, 1018, 214, 213, 211, 213, 215} 4. Para as populaes de dados abaixo, calcule as respectivas varincias e desviospadro, usando as duas frmulas, a da definio e a frmula prtica. (a) A={70, 72, 75, 78, 74, 73, 79, 71, 77, 76} (b) B={1010, 1015, 1017, 1014, 1018, 1020, 1011} 5. Os visitantes do Parque Nacional de Yellowstone, nos Estados Unidos, consideram uma erupo do giser Old Faithful uma atrao que no pode ser perdida. A tabela de freqncias a seguir resume uma amostra de tempos (em minutos) entre erupes, Construa um histograma para a tabela de frequncias dada. Se um guia turstico deseja garantir que seus turistas presenciem uma erupo, qual o tempo mnimo que devem permanecer no parque? Calcule a mdia e o desvio-padro da distribuio de frequncias. Tempo / minutos 40-49 50-59 60-69 70-79 80-89 90-99 100-109 Freqncia 8 44 23 6 107 11 1

6. Obtiveram-se, em uma universidade brasileira, os dados da tabela abaixo, referentes ao nmero de carros de estudantes e de professores e servidores e seus respectivos anos de uso. Construa um histograma de freqncias relativas para cada um dos dois conjuntos de dados. Com base nos resultados, quais so as diferenas perceptveis entre as duas amostras? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Ano do carro 0-2 anos 3-5 6-8 9-11 12-14 15-17 18-20 21-23 Estudantes 23 carros 33 63 68 19 10 1 0 Professores e Servidores 30 carros 47 36 30 8 0 0 1

7. A tabela de freqncias a seguir d as velocidades, de motoristas multados pela polcia de uma cidade brasileira, onde o limite de velocidade estabelecido era de 40 km/h. Construa um histograma para essa tabela de freqncias. O que essa distribuio sugere sobre o limite fixado comparado com o limite de velocidade constatado? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Freqncia Absoluta 14 11 8 6 4 3 1 2 1 Velocidade / km/h 42-43 44-45 46-47 48-49 50-51 52-53 54-55 56-57 58-59

8. As companhias de seguro pesquisam continuamente as idades e as causas de morte. Construa um histograma de frequncias relativas correspondente tabela de freqncias abaixo. Os dados se baseiam em um estudo da revista Veja sobre vtimas fatais de armas de fogo no Brasil, durante uma semana. O que o histograma sugere quanto s idades dessas vtimas fatais? Calcule as mdias e os desvios-padro para cada distribuio de frequncias. Freqncia 22 10 6 2 4 5 1 Idade na Morte 16-25 26-35 36-45 46-55 56-65 66-75 76-85

9. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) experimento aleatrio; (b) varivel aleatria; (c) espao amostral; (d) evento; (e) unio de eventos (f) interseo de eventos; (g) eventos mutuamente excludentes. 10. Discuta a diferena conceitual entre as duas definies de probabilidade de um evento apresentadas, ou seja: = e = lim . Utilize um exemplo, diferente daquele dado no texto, para ilustrar sua discusso. 11. Uma moeda jogada trs vezes. Calcule a probabilidade dos eventos abaixo. Dica: escreva os conjuntos que representam o espao amostral e os eventos. (a) Sair exatamente uma cara. (b) Sair no mximo duas caras. (c) Sair coroa no lanamento da primeira moeda. (d) No sair nenhuma cara. 12. Uma moeda jogada trs vezes. Calcule as probabilidades que se pedem abaixo. (a) Sair trs caras ou trs coroas. (b) Sair trs caras e trs coroas. (c) Sair duas caras ou duas coroas. (d) Sair duas caras e duas coroas. (e) Sair uma cara e uma coroa. (f) Sair uma cara ou uma coroa. 13. Defina e d exemplos, diferentes daqueles dados no texto, de: (a) amostragem com reposio; (b) amostragem sem posio; (c) fatorial de um nmero; (d) permutao; (e) arranjo; (e) combinao. 14. De quantas formas distintas 9 pessoas podem ficar dispostas em fila indiana? 15. Quantos anagramas podemos formar com a palavra TEORIA? 16. Em uma prova com 10 questes de mltipla escolha, com 4 alternativas cada, qual a probabilidade de um candidato responder a prova e acertar todas a questes apenas no palpite? 17. Se voc tem 15 camisas em uma gaveta, para serem usadas durante a semana (7 dias), uma cada dia, sem reposio, de quantas maneiras diferentes pode-se escolher as camisas para os sete dias da semana? 18. Em um campeonato de futebol, participam 20 times. Quantos resultados so possveis para os 3 primeiros lugares?

Captulo 2. Aplicao da Matemtica Estatstica.

A Distribuio Binomial

Uma varivel aleatria discreta aquela que pode ser descrita por meio de nmeros inteiros. Por exemplo, quando se joga uma moeda 20 vezes, podemos definir uma varivel aleatria X discreta como sendo o nmero de vezes que sai o resultado cara. Assim, os valores possveis de X podem ser: X = 0, 1, 2, 3, ..., 20. A distribuio binomial uma distribuio de probabilidade para varivel discreta. Ela caracterizada por dois parmetros, apenas (n,p). O parmetro n o nmero de vezes que o experimento executado. Por exemplo, no lanamento de uma moeda, a moeda pode ser lanada n = 1, 2, 3, 4, 5, ... vezes. O parmetro p a probabilidade de sucesso em cada vez que o experimento executado. Por exemplo, no lanamento de uma moeda, p= pode representar a probabilidade de sair cara (ou coroa). Por consequncia, 1p a probabilidade de fracasso. Uma distribuio de frequncia coloca a varivel aleatria no eixo horizontal (abscissa) e a probabilidade de ocorrncia de cada valor da varivel no eixo vertical (ordenada). Seja X uma varivel aleatria. A probabilidade P X=i de se obter X=i sucessos, em uma distribuio binomial (n, p), dada pela equao abaixo. = = 1

Na equao acima, foi utilizada a notao de combinao, dada abaixo. = ! ! !

Exemplo da Jogada de 20 moedas Vamos calcular a distribuio binomial n, p = 20, para uma jogada de 20

(vinte) moedas. A probabilidade de sucesso, em cada jogada, pode ser definida arbitrariamente como a probabilidade de sair cara e seu valor p = . nas outras 19 moedas, pela distribuio binomial 20, calculada da forma abaixo. =1 = 20! 0,5 1! 20 1 ! 1 0,5 = 0,0000190735 Por exemplo, P X=1 , a probabilidade de sair cara em apena 1 moeda e coroa

A Tabela 8 e a Figura 5 mostram os resultados de todos os clculos. Tabela 8. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i , a destacado. i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 probabilidade de se obter X=i sucessos. O valor central X=10 est P X=i 0,0000009537 0,0000190735 0,0001811980 0,0010871900 0,0046205500 0,0147858000 0,0369644000 0,0739288000 0,1201340000 0,1601790000 0,1761970000 0,1601790000 0,1201340000 0,0739288000 0,0369644000 0,0147858000 0,0046205500 0,0010871900 0,0001811980 0,0000190735 0,0000009537

0.18 0.16 0.14 0.12

P(X=i)

0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 8 10 12 14 16 18 20

iFigura 5. Distribuio binomial n, p = 20, . Seja X a varivel aleatria e P X=i , a probabilidade de se obter X=i sucessos.

Como interpretamos a distribuio de probabilidades acima? Ao jogarmos 20 (vinte) moedas, a probabilidade de se obter 10 caras (X=10) mxima, ou seja, distancia de 10. P X=10 = 0,176197 o valor mximo. As probabilidades diminuem medida que X se A esperana (valor mdio), E X e a varincia, Var X de uma varivel aleatria

com distribuio binomial so calculadas a partir dos valores dos parmetros n e p, de acordo com as equaes abaixo. =

=

1

de X possuem os seguintes valores.

No exemplo dado acima, n, p = 20, . Portanto, a esperana e a varincia = 20 0,5 = 10

= 20 0,5 1 0,5 = 5 Logo, de se esperar o valor central X=10 para a distribuio binomial acima, j que este o valor da esperana de X.

Exemplo das 30 questes de mltipla escolha

Outro exemplo de utilizao da distribuio binomial foi o caso abordado anteriormente de uma prova de mltipla escolha, com 30 questes e 5 alternativas em cada questo. Vimos que h um total de 530 = 9,31 x 1020 respostas possveis. Considerando X o nmero de questes que um candidato acertou na prova, os valores possveis para essa varivel aleatria discreta sero: X = 0, 1, 2, 3, ..., 30. Podemos considerar que essa varivel siga uma distribuio binominal (n,p) = (30,1/5). Como h 5 alternativas, a probabilidade de sucesso, ou seja, de acertar uma questo p=1/5. Assim, podemos calcular a probabilidade de acertar qualquer nmero de questes, apenas na sorte, usando a frmula da distribuio binomial. Vamos calcular a probabilidade de acertar a prova inteira na sorte, ou seja, vamos calcular P(X=30), usando a distribuio binomial, com n=30 e p=1/5=0,2. = 30 = 30! 0,2 30! 30 30 ! 1 0,2 = 1,07 10

Esse o mesmo resultado encontrado anteriormente, da ordem de P=1021. Vamos agora encontrar a probabilidade de acertar metade da prova na sorte, ou seja, vamos calcular P(X=15), usando a mesma distribuio binomial. = 15 = 30! 0,2 15! 30 15 ! 1 0,2 = 0,000179

A probabilidade encontrada muitas vezes maior que a anterior. De fato, para algum acertar metade da prova, na sorte, a probabilidade de 0,0179%. O valor continua sendo pequeno para que algum consiga acertar na sorte, mas j possvel que algum consiga, pois esta probabilidade bem maior que as de muitas loterias! Calculemos a esperana e a varincia de X para este caso. = 30 0,2 1 0,2 = 4,8 Vamos calcular a probabilidade de acertar apenas 6 (seis) questes, na sorte, ou seja, vamos calcular P(X=6), usando a mesma distribuio binomial. =6 = 30! 0,2 6! 30 6 ! 1 0,2 = 0,179 = 30 0,2 = 6

17,9%. O desvio padro igual 4,8 = 2,2. Portanto, espera-se que a 18% dos candidatos que faam a prova no puro palpite acertem 62 questes.

Para se acertar 6 questes na sorte, a probabilidade mxima e igual a

A Distribuio Normal

Uma varivel aleatria contnua aquela que pode ser descrita por meio de nmeros reais. Por exemplo, a concentrao dos ons cloreto em amostras de gua. A distribuio normal uma distribuio de probabilidade para varivel contnua. Ela caracterizada por dois parmetros populacionais (, ). Ela uma distribuio simtrica, em forma de sino, sendo que o valor central a mdia da populao, e a medida da disperso o desvio-padro, da populao. A distribuio normal dada pela curva gaussiana, nome dado em homenagem ao matemtico alemo Johann Carl Friedrich Gauss (1777-1855). Seja x probabilidade, f x para a varivel aleatria x e dada pela equao abaixo. uma varivel aleatria contnua. A curva gaussiana a funo densidade de

=

2

1

A esperana E(x) e a varincia Var(x) da varivel aleatria contnua x, em uma distribuio normal, so dadas pelas equaes abaixo, respectivamente.

E(x) = Var(x) = 2

A Figura 6 apresenta duas curvas gaussianas, ambas com =0. Uma das curvas possui =1,0 e a outra, =2,0. A curva com maior mais larga e menos alta.

Figura 6. Curva gaussiana para =0, =1,0 e =2,0.

A Distribuio Normal Reduzida

Qualquer conjunto de dados {x}, com media e desvio-padro , pode ser transformado em outro conjunto de dados {Z}, com mdia =0 e desvio padro =1, mediante o uso da equao de transformao abaixo.

=

Aplicando a transformao acima para uma funo gaussiana, obtemos a equao abaixo, denominada distribuio normal reduzida: (, ) = (0, 1).

=

2

1

2

Note que a Figura 6 apresenta o grfico da distribuio normal reduzida.

mulheres. As estaturas so representadas pela varivel aleatria x. Vamos supor que essa varivel siga uma distribuio normal e que a mdia e o desvio padro dessa populao sejam, respectivamente: = 1,60 m; = 0,20 m. Neste caso, duas mulheres da populao que tivessem estaturas x1 = 1,47 m e x2 = 1,68 m na

Vejamos um exemplo. Consideremos as estaturas de uma populao de

distribuio normal, passariam a ter as seguintes estaturas na distribuio normal reduzida: 1,47 1,60 0,20

= =

1,68 1,60 0,20

= 0,65 = +0,40

Os valores na distribuio normal reduzida podem ser positivos ou negativos, indicando se so maiores ou menores que a mdia. Na distribuio normal reduzida, o valor Z=0 significa que a varivel tem o valor mdio. Alm disso, a distribuio normal reduzida adimensional, ou seja, os valores no tm unidade, so nmeros puros.

Probabilidade de uma varivel aleatria contnua

Para discutir a probabilidade de uma varivel aleatria contnua assumir um determinado valor, vamos usar a distribuio normal reduzida. A funo gaussiana f Z d a densidade de probabilidade para a varivel reduzida Z. O valor da probabilidade P da varivel reduzida Z assumir um valor entre Z1 e Z2 dado pela integral definida abaixo.

2 =

1 0,9545 0,04550 = = 0,02275 2 2

Se quisermos saber a probabilidade de Z assumir valores menores que 2, ou seja, P(Z>2) s fazer o seguinte clculo:

< 2 = 1 0,02275 = 0,97725H uma srie de valores de probabilidade que podemos calcular para os valores da varivel reduzida Z. Uma coisa importante notar. Que, como a probabilidade uma rea sob a curva, a probabilidade de a varivel assumir um determinado valor seria zero, pois a rea sob a curva seria zero.

=

=

=0

Na prtica so utilizadas tabelas de probabilidades. No Apndice A1 mostrada a tabela para a probabilidade de Z assumir valores menores que a, P(Z0,14 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,14 0,14 = 0,00 0,01

Agora, o problema determinar a probabilidade P(Z>0,00). Na tabela de probabilidades, encontramos P(Z 0,00 = 1 < 0,00 = 1 0,5000 = 0,5000

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima da mdia, na cidade, de 50%, como mostra a Figura 8.

Figura 8. Probabilidade de que a varivel Z assuma valores acima da mdia, ou seja, P(Z>0)=0,5000.

(b) A probabilidade de a concentrao de SO2 ser maior que 0,15 ppm. Neste caso, queremos a probabilidade P(X>0,15 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,15 0,14 = 1,00 0,01

Agora, o problema determinar a probabilidade P(Z>1,00). Na tabela de probabilidades, encontramos P(Z 0,00 = 1 < 0,00 = 1 0,8413 = 0,1587

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima de 0,15 ppm, na cidade, de 15,87%, como mostra a Figura 9.

Figura 9. Probabilidade de que a varivel Z assuma valores acima de 1,00. Ou seja, P(Z>1,00)=0,1587.

(c) A probabilidade da concentrao de SO2 ser maior do que 0,17 ppm. Neste caso, queremos a probabilidade P(X>0,17 ppm). Vamos transformar em varivel reduzida primeiro. = = 0,17 0,14 = 3,00 0,01

Agora, o problema determinar a probabilidade P(Z>3,00). Na tabela de probabilidades, encontramos P(Z 3,00 = 1 < 3,00 = 1 0,9987 = 0,0013

Conclumos que a probabilidade de que a concentrao do gs poluente SO2 venha a assumir um valor acima de 0,17 ppm, na cidade, de 0,13%, o que representa um valor muito baixo. (d) A probabilidade de que a concentrao de SO2 tenha um valor entre 0,141 ppm e 0,142 ppm. Neste caso, queremos a probabilidade P(0,141 ppm < X > 0,142 ppm). Vamos transformar em variveis reduzidas primeiro. = = = 0,141 0,14 = 0,100 0,01

=

0,142 0,14 = 0,200 0,01

A probabilidade que se quer pode ser obtida da tabela de probabilidades, atravs do seguinte clculo: P(0,100 < Z< 0,200) = P(Z