livro estatistica basica

Universidade Estácio de Sá

Disciplina: Probabilidade e Estatística

Marcelo Abrahão de Mattos

1


Apostila de Noções de Estatística


2010




2

NOÇÕES DE ESTATÍSTICA ................................................................................. 4

1. ESTATÍSTICA ........................................................................................................................ 4 1.1. CONCEITO ..................................................................................................................... 4 1.2. DIVISÃO DA ESTATÍSTICA ........................................................................................... 4 1.3. POPULAÇÃO ................................................................................................................. 4 1.4. AMOSTRAGEM .............................................................................................................. 5 1.5. AMOSTRA ...................................................................................................................... 6 1.6. CENSO ........................................................................................................................... 6 1.7. FENÔMENOS ESTATÍSTICOS ..................................................................................... 6 1.8. CARACTERÍSTICAS ...................................................................................................... 7

2. FASES DO TRABALHO ESTATÍSTICO ............................................................................... 9 2.1. DEFINIÇÃO DO PROBLEMA ........................................................................................ 9 2.2. DEFINIÇÃO DOS OBJETIVOS (GERAL E ESPECÍFICO) ............................................ 9 2.3. PLANEJAMENTO ......................................................................................................... 10 2.4. COLETA DOS DADOS................................................................................................. 10 2.5. CRÍTICA DOS DADOS................................................................................................. 12 2.6. APURAÇÃO (ARMAZENAMENTO) DOS DADOS ...................................................... 12 2.7. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS .................................................... 12 2.8. ANÁLISE E INTERPRETAÇÃO DOS DADOS ............................................................ 13

3. NORMAS PARA APRESENTAÇÃO TABULAR DOS DADOS ......................................... 13 3.1. INTRODUÇÃO ............................................................................................................. 13 3.2. SÉRIES ESTATÍSTICAS .............................................................................................. 13 Feijão ....................................................................................................................................... 16

4. REPRESENTAÇÃO GRÁFICA ........................................................................................... 17 4.1. INTRODUÇÃO ............................................................................................................. 17 4.2. REQUISITOS FUNDAMENTAIS EM UM GRÁFICO: .................................................. 17 4.3. GRÁFICOS QUANTO A FORMA: ................................................................................ 17

5. PRINCIPAIS TIPOS DE GRÁFICOS ................................................................................... 18 5.1. GRÁFICOS EM CURVAS OU EM LINHAS ................................................................. 18 5.2. GRÁFICOS EM COLUNAS .......................................................................................... 19 5.3. GRÁFICOS EM BARRAS............................................................................................. 20 5.4. GRÁFICO EM COLUNAS MÚLTIPLAS (AGRUPADAS) ............................................. 22 5.5. GRÁFICO EM BARRAS MÚLTIPLAS (AGRUPADAS) ................................................ 23 5.6. GRÁFICO EM SETORES............................................................................................. 24

6. DISTRIBUIÇÃO DE FREQÜÊNCIAS .................................................................................. 25 6.1. INTRODUÇÃO ............................................................................................................. 25 6.2. DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS ............................ 25 6.3. REPRESENTAÇÃO DOS DADOS (AMOSTRAIS OU POPULACIONAIS) ................. 26

7. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA .............................................. 28 7.1. DETERMINAÇÃO DO NÚMERO DE CLASSES (K) ................................................... 28

8. TIPOS DE FREQÜÊNCIAS ................................................................................................. 30 9. DISTRIBUIÇÕES CUMULATIVAS ...................................................................................... 31

9.1. Freqüência absoluta acumulada (Fac) ......................................................................... 31 9.2. Freqüência relativa acumulada (Frac) .......................................................................... 31

10. HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS ........................................................ 32 10.1. HISTOGRAMAS ....................................................................................................... 32 10.2. POLÍGONO DE FREQUÊNCIAS ............................................................................. 33

11. MEDIDAS DE POSIÇAO (MEDIDAS DE TENDÊNCIA CENTRAL) ............................... 33 11.1. Média aritmética ....................................................................................................... 34

(Dados sem classes): Determinar a média aritmética da Tabela 5.4 .................................... 35 (Dados com classes): Determinar a média aritmética da Tabela 5.7 .................................... 35

11.2. Moda (Mo) ................................................................................................................ 37 11.3. Mediana (Md) ........................................................................................................... 40 11.4. Quartis (medidas separatrizes) ................................................................................ 42 11.5. Decis: dividem a série em 10 partes iguais .............................................................. 43

12. Medidas de dispersão (Medidas de variabilidade) ...................................................... 44 12.1. Tipos de medidas de dispersão ............................................................................... 44




3

PRINCÍPIO FUNDAMENTAL DA CONTAGEM ................................................... 47 13. Permutações ................................................................................................................... 49 14. Arranjos ........................................................................................................................... 52 15. Combinação .................................................................................................................... 52 16. Permutações com elementos repetidos ...................................................................... 52

INTRODUÇÃO À PROBABILIDADE ................................................................... 54 17. Experimentos probabilísticos ....................................................................................... 54 18. Espaço Amostral ............................................................................................................ 55 19. Retirada com e sem reposição ..................................................................................... 56 20. Evento .............................................................................................................................. 56 21. Evento impossível .......................................................................................................... 56 22. Evento Elementar ........................................................................................................... 56 23. Evento certo .................................................................................................................... 56 24. Combinação de Eventos ................................................................................................ 56 25. Probabilidade de um Evento Elementar ...................................................................... 57

PROBABILIDADE ............................................................................................... 58 26. Conceito .......................................................................................................................... 58 27. Probabilidade da União de Eventos (regra da adição) ............................................... 59 28. Probabilidade de Não Ocorrer um Evento ................................................................... 60 29. Produto de Probabilidades (regra da multiplicação) .................................................. 61 30. Variável Aleatória ........................................................................................................... 61 31. Valor esperado de uma variável aleatória ................................................................... 62 32. Distribuição de probabilidade ....................................................................................... 63 33. Resumo das principais fórmulas das probabilidades. ............................................... 65

DISTRIBUIÇÕES DISCRETAS ............................................................................ 66 34. Distribuição Binomial .................................................................................................... 66

34.1. Cálculo das probabilidades ...................................................................................... 66 34.2. Esperança matemática ............................................................................................. 66 34.3. Variância ................................................................................................................... 66 34.4. Desvio padrão .......................................................................................................... 67

35. Distribuição de Bernoulli ............................................................................................... 67 35.1. Cálculo das probabilidades ...................................................................................... 67 35.2. Esperança matemática ............................................................................................. 67 35.3. Variância ................................................................................................................... 67 35.4. Desvio padrão .......................................................................................................... 67

36. Distribuição de Poisson ................................................................................................ 67 36.1. Cálculo das probabilidades ...................................................................................... 68 36.2. Esperança matemática ............................................................................................. 68 36.3. Variância ................................................................................................................... 68 36.4. Desvio padrão .......................................................................................................... 68

37. Distribuição Hipergeométrica ....................................................................................... 68 37.1. Cálculo das probabilidades ...................................................................................... 69 37.2. Esperança matemática ............................................................................................. 69 37.3. Variância ................................................................................................................... 69 37.4. Desvio padrão .......................................................................................................... 69

38. Aproximação da Binomial por Poisson ....................................................................... 69 DISTRIBUIÇÃO CONTÍNUA ................................................................................ 69

39. Distribuição Normal ....................................................................................................... 69 40. Aproximação da Binomial pela Normal........................................................................ 71




4

NOÇÕES DE ESTATÍSTICA

1. ESTATÍSTICA 1.1. CONCEITO

É a ciência que se preocupa com a coleta, a organização, descrição (apresentação), análise e interpretação de dados experimentais e tem como objetivo fundamental o estudo de uma população.

Este estudo pode ser feito de duas maneiras:

Investigando todos os elementos da população.

Por amostragem, ou seja, selecionando alguns elementos da população.

1.2. DIVISÃO DA ESTATÍSTICA

- Estatística Descritiva: é aquela que se preocupa com a coleta,

organização, classificação, apresentação, interpretação e analise de dados referentes ao fenômeno através de gráficos e tabelas além de calcular medidas que permita descrever o fenômeno.

- Estatística Indutiva (Amostral ou Inferencial): é a aquela que partindo

de uma amostra, estabelece hipóteses, tira conclusões sobre a população de origem e que formula previsões fundamentando-se na teoria das probabilidades. A estatística indutiva cuida da análise e interpretação dos dados.

O processo de generalização do método indutivo está associado a uma

margem de incerteza. Isto se deve ao fato de que a conclusão que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns baseia-se em uma parcela do total de observações.

1.3. POPULAÇÃO

CONCEITO: é o conjunto, finito ou infinito, de indivíduos ou objetos que

apresentam em comum determinadas características definidas, cujo comportamento interessa analisar.

A população é estudada em termos de observações de características nos

indivíduos (animados ou inanimados) que sejam relevantes para o estudo, e não em termos de pessoas ou objetos em si. O objetivo é tirar conclusões sobre o fenômeno em estudo, a partir dos dados observados.

Como em qualquer estudo estatístico temos em mente estudar uma ou

mais características dos elementos de uma população, é importante definir bem essas características de interesse para que sejam delimitados os elementos que pertencem à população e quais os que não pertencem.

Exemplos:




5

a) Estudar os filhos tidos, tipo de moradia, condições de trabalho, tipo de sanitário, números de quartos para dormir, estado civil, uso da terra, tempo de trabalho, local de nascimento, tipo de cultivo etc, dos agricultores do Estado do Pará.

População: Todos os agricultores (proprietários de terra ou não)

plantadores das culturas existentes no Estado do Pará.

b) Estudar a precipitação pluviométrica anual (em mm) na cidade de Belém.

População: Conjunto das informações coletadas pela Estação Pluviométrica, durante o ano.

c) As alturas dos cidadãos do Pará constituem uma população ou a

população dos pesos desses cidadãos.

Divisão da população - População Finita: apresenta um número limitado de elementos. É

possível enumerar todos os elementos componentes. Exemplo:

a) Idade dos universitários do Estado do Pará. População: Todos os universitários do Estado do Pará. - População Infinita: apresenta um número ilimitado de elementos. Não é

possível enumerar todos os elementos componentes. Entretanto, tal definição existe apenas no campo teórico, uma vez que, na prática, nunca encontraremos populações com infinitos elementos, mas sim, populações com grande número de componentes; e nessas circunstâncias, tais populações são tratadas como se fossem infinitas.

Exemplos:

a) Tipos de bactérias no corpo humano População: Todas as bactérias existentes no corpo humano.

b) Comportamento das formigas de certa área

População: Todas as formigas da área em estudo.

1.4. AMOSTRAGEM

É a coleta das informações de parte da população, chamada amostra

(representada por pela letra “n”), mediante métodos adequados de seleção destas unidades.




6

1.5. AMOSTRA

É uma parte (um subconjunto finito) representativa de uma população selecionada segundo métodos adequados.

O objetivo é fazer inferências, tirar conclusões sobre populações com

base nos resultados da amostra, para isso é necessário garantir que a amostra seja representativa, ou seja, a amostra deve conter as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.

O termo indução é um processo de raciocínio em que, partindo-se do

conhecimento de uma parte, procura-se tirar conclusões sobre a realidade no todo.

Ao induzirmos estamos sujeitos a erros. Entretanto, a Estatística Indutiva,

que obtém resultados sobre populações a partir das amostras, diz qual a precisão dos resultados e com que probabilidade se pode confiar nas conclusões obtidas.

1.6. CENSO

É o exame completo de toda população. Quanto maior a amostra, mais precisa e confiável deverão ser as induções

feitas sobre a população. Logo, os resultados mais perfeitos são obtidos pelo Censo. Na prática, esta conclusão muitas vezes não acontece, pois o emprego de amostras com certo rigor técnico, pode levar a resultados mais confiáveis ou até mesmo melhores do que os que seriam obtidos através de um Censo.

As razões de se recorrer a amostras são: menor custo e tempo para

levantar dados; melhor investigação dos elementos observados.

1.7. FENÔMENOS ESTATÍSTICOS

Refere-se a qualquer evento que se pretende analisar cujo estudo seja possível de aplicação de técnicas da estatística.

A Estatística dedica-se ao estudo dos fenômenos de massa, que são

resultantes do concurso de um grande número de causas, total ou parcialmente desconhecida.

Tipos de fenômenos:

a) Fenômenos Coletivos ou de Massa Não podem ser definidos por uma simples observação. Exemplos: a natalidade, a mortalidade, a nupcialidade, a idade média dos

agricultores do Estado do Pará, o sexo dos agricultores.

b) Fenômenos Individuais Compõem os fenômenos coletivos.




7

Exemplos: cada nascimento, cada pessoa que morre, cada agricultor

investigado.

1.8. CARACTERÍSTICAS É preciso definir qual(is) a(s) característica(s) de interesse que será(ão)

analisada(s). A característica de interesse pode ser de natureza qualitativa ou quantitativa.

1.8.1. ATRIBUTOS: são todas as características de uma população que

não podem ser medidas. Os indivíduos ou objetos são colocados em categorias ou tipos e conta-se

a freqüência com que ocorrem.

Exemplos: sexo (masculino e feminino); estado civil (solteiro, casado, viúvo, etc.); tipo de moradia (madeira, tijolo), situação do aluno (aprovado, reprovado), religião.

CLASSIFICAÇÃO DOS ATRIBUTOS

a) Dicotomia: quando a classe em que o atributo é considerado admite apenas duas categorias.

Exemplos: Sexo (masc. e fem.); Existência ou ausência de certo produto

agrícola (existência, ausência), resposta a uma pergunta: (concorda, não concorda), (sim, não).

b) Policotomia: quando a classe em que o atributo é considerado

admite mais de duas categorias.

Exemplos: Estado civil (solteiro, casado, viúvo), classe social (alta, média ou baixa).

1.8.2. VARIÁVEL: é o conjunto de resultados possíveis de um fenômeno

(ou observação, ou característica). Para os fenômenos: - sexo - dois resultados possíveis: masculino e feminino; (não pode ser

medida: é um atributo) - número de filhos tidos de um grupo de casais - resultados possíveis: 0, 1,

2, 3, 4, 5, ..., n; - peso de pessoas adultas - resultados possíveis: 60 kg, 59,3 kg, 75,3 kg,

65,3 kg, ...; pode tomar um infinito número de valores num certo intervalo.

TIPOS DE VARIÁVEIS

a) Variável Qualitativa: quando seus valores são expressos por atributos ou qualidade.

Exemplos:




8

População: Estudantes universitários do Estado do Pará. Variáveis: sexo, profissão, escolaridade, religião, meio onde vivem (rural,

urbano).

População: População dos bairros periféricos do município de Belém.

Variáveis: tipo de casa, existência de água encanada (sim, não), bairro de

origem.

Variáveis qualitativas que não são ordenáveis recebem o nome de nominais.

Exemplo: religião, sexo, raça, cor.

Raça dos Paraenses - 2001

Raça Freqüência

Branca Negra Parda Outra

Total

Fonte: Fictícia

Variáveis qualitativas que são ordenáveis recebem o nome de ordinais. Exemplo: nível de instrução, classe social.

Classe social dos Paraenses - 2001

Classe social Freqüência

Classe A Classe B Classe C Classe D

Total

Fonte: Fictícia

b) Variável Quantitativa: quando seus valores são expressos por números. Esses números podem ser obtidos por um processo de contagem ou medição.

Exemplos:

População: Todos os agricultores do Estado do Pará.

Variáveis: número de filhos tidos, extensão da área plantada, altura, idade.

População: População dos bairros periféricos do município de Belém.

Variáveis: número de quartos, área da casa em m2, número de moradores

da casa.




9

A variável quantitativa divide-se em:

a) Variável Discreta: são aquelas que podem assumir apenas

valores inteiros em pontos da reta real. É possível enumerar todos os possíveis valores da variável.

Exemplos:

População: Universitários do Estado do Pará. Variáveis: número de filhos, número de quartos da casa, número de

moradores, número de irmãos.

b) Variável Contínua: são aquelas que podem assumir qualquer valor num certo intervalo (contínuo) da reta real. Não é possível enumerar todos os possíveis valores. Essas variáveis, geralmente, provêm de medições.

População: Todos os agricultores do Estado do Pará.

Variáveis: idade, renda familiar, extensão da área plantada (em m2) , peso e altura das crianças agricultoras.

2. FASES DO TRABALHO ESTATÍSTICO

2.1. DEFINIÇÃO DO PROBLEMA

A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado e a seguir escolher a natureza dos dados. Além de considerar detidamente o problema objeto de estudo o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Saber exatamente aquilo que pretende pesquisar é o mesmo que definir de maneira correta o problema.

Por exemplo:

a) os preços dos produtos agrícolas produzidos no Estado do Pará são menores do que aqueles originados de outros Estados?

b) qual a natureza e o grau de relação que existe entre a distribuição da pluviosidade e a colheita do produto x?

c) estudar uma população por sexo: dividi-se os dois grupos em masculino e feminino;

2.2. DEFINIÇÃO DOS OBJETIVOS (GERAL E ESPECÍFICO)

É definir com exatidão o que será pesquisado. É recomendável ter em vista um objetivo para o estudo, em lugar de coletar o

material e defini-lo no decorrer do trabalho ou só no fim deste.

OBJETIVOS MAIS COMUNS EM UMA PESQUISA:




10

Dados pessoais: grau de instrução, religião, nacionalidade, dados profissionais, familiares, econômicos, etc.

Dados sobre comportamento: como se comportam segundo

certas circunstâncias. Ex: possível remanejamento da área habitada.

Opiniões, expectativas, níveis de informação, angústias,

esperanças, aspirações sobre certos assuntos.

Dados sobre as condições habitacionais e de saneamento que avalie as condições em que vivem e a qualidade de vida de certo grupo.

2.3. PLANEJAMENTO

O problema está definido. Como resolvê-lo? Se através de amostra, esta

deve ser significativa para que represente a população. O planejamento consiste em se determinar o procedimento necessário

para resolver o problema e, em especial, como levantar informações sobre o assunto objeto de estudo. Quais dados deverão ser coletados? Como se deve obtê-los? É preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir.

É nesta fase que será escolhido o tipo de levantamento a ser utilizado, que

podem ser: a) levantamento censitário, quando a contagem for completa, abrangendo

todo o universo; b) levantamento por amostragem, quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa fase são o

cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra, a forma como serão coletados os dados, os setores ou áreas de investigação, o grau de precisão exigido e outros.

2.4. COLETA DOS DADOS

Refere-se à obtenção, reunião e registro sistemático de dados, com o

objetivo determinado. A escolha da fonte de obtenção dos dados está diretamente relacionada

ao tipo do problema, objetivos do trabalho, escala de atuação e disponibilidade de tempo e recursos.

a) Fontes primárias: é o levantamento direto no campo através de

mensurações diretas ou de entrevistas ou questionários aplicados a sujeitos de interesse para a pesquisa.

Vantagens: grau de detalhamento com respeito ao interesse dos quesitos

levantados; maior precisão das informações obtidas.




11

b) Fontes secundárias: quando são publicados ou registrados por outra

organização. A coleta de dados secundários se realiza através de documentos

cartográficos (mapas, cartas, imagens e fotografias obtidas por sensoriamento remoto ou por fotogrametria e imagens de radar). Estas fontes de informação são de extrema importância.

Das fotografias aéreas em escalas reduzidas ou mais detalhadas, das

imagens de radar ou satélite e de cartas obtêm-se informações quanto ao uso do solo, drenagem, estruturas viárias e urbanas, povoamento rural, recursos florísticos, minerais e pedológicos, estrutura fundiária e de serviços, dados altimétricos, etc.

Vantagens: inclui um processo de redução e agregação de informações. A coleta dos dados pode ser feita de forma direta ou indireta.

COLETA DIRETA A coleta é dita direta quando são obtidos diretamente da fonte primária,

como os levantamentos de campo através de questionários.

Há três tipos de coleta direta:

a) a coleta é contínua quando os dados são obtidos ininterruptamente, automaticamente e na vigência de um determinado período: um ano, por exemplo. É o caso dos registros de casamentos, óbitos e nascimentos, escrita comercial, as construções civis.

b) a coleta dos dados é periódica quando feita em intervalos constantes de

tempo, como o recenseamento demográfico a cada dez anos e o censo industrial, anualmente.

c) a coleta dos dados é ocasional quando os dados forem colhidos

esporadicamente, atendendo a uma conjuntura qualquer ou a uma emergência, como por exemplo, um surto epidêmico.

COLETA INDIRETA A coleta é dita indireta quando é inferida a partir dos elementos

conseguidos pela coleta direta, ou através do conhecimento de outros fenômenos que, de algum modo, estejam relacionados com o fenômeno em questão.

Um instrumento por meio do qual se faz a coleta das unidades estatísticas

é o questionário. Deve ficar bem claro no questionário que ele é organizado de acordo com dispositivos legais, que há sansões e que o sigilo sobre as informações individuais será absoluto.

É aconselhável que um pequeno percentual dos exemplares do

questionário seja tirado e aplicado a uma parcela de informantes, a fim de testar a aceitação do mesmo, constituindo tal iniciativa, a pesquisa piloto. A boa aceitação




12

dos questionários determinará a tiragem completa dos exemplares ou a sua alteração.

2.5. CRÍTICA DOS DADOS

A crítica dos dados deve ser feita com cuidado através de um trabalho de

revisão e correção, ao qual chamamos de crítica (consistência), a fim de não de incorrer em erros que possam afetar de maneira sensível os resultados.

As perguntas dos questionários uniformemente mal compreendidas, os

enganos evidentes, tais como somas erradas, omissões, trocas de respostas e etc, são fáceis de corrigir. É necessário, entretanto, que o crítico não faça a correção pôr simples suposição sua, mas sim que tenha chegado a conclusão absoluta do engano.

As informações relativas à profissão não devem ser vagas como, pôr exemplo:

operário, mas sim, oleiro, pedreiro, carpinteiro, etc., conforme o caso. O estado civil será declarado: solteiro, casado, viúvo ou desquitado. Em resumo, os dados devem sofrer uma crítica criteriosa com o objetivo de

afastar os erros tão comuns nessa natureza de trabalho. As informações inexatas ou omissas devem ser corrigidas. Os questionários devem voltar a fonte de origem sempre que se fizerem necessário sua correção ou complementação.

2.6. APURAÇÃO (ARMAZENAMENTO) DOS DADOS

É um processo de apuração ou sumarização que consiste em resumir os

dados através de sua contagem ou agrupamento. É um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada.

Através da apuração, tem-se a oportunidade de condensar os dados, de modo

a obter um conjunto compacto de números, o qual possibilita distinguir melhor o comportamento do fenômeno na sua totalidade.

Os dados de fenômenos geográficos podem ser organizados em mapas,

tabelas, matrizes, disquetes ou fitas.

2.7. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS

Há duas formas de apresentação que não se excluem mutuamente:

Apresentação Tabular É uma apresentação numérica dos dados. Consiste em dispor os dados em

linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas adotadas pelo Conselho Nacional de Estatística. As tabelas têm a vantagem de conseguir expor, sistematicamente em um só local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar.

Apresentação Gráfica Constitui uma apresentação geométrica dos dados. Permite ao analista obter

uma visão tão rápida, fácil e clara do fenômeno e sua variação.




13

2.8. ANÁLISE E INTERPRETAÇÃO DOS DADOS

Nessa etapa, o interesse maior consiste em tirar conclusões que auxiliem o

pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso pôr número-resumo, as estatísticas, que evidenciam características particulares desse conjunto.

3. NORMAS PARA APRESENTAÇÃO TABULAR DOS DADOS

3.1. INTRODUÇÃO

A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas ditadas pelo Conselho /nacional de Estatística e pelo IBGE. Tais regras acham-se publicadas e dispõem sobre os elementos essenciais e complementares da tabela, a especificação dos dados e dos sinais convencionais, o procedimento correto a ser desenvolvido no preenchimento da tabela e outros dispositivos importantes.

As tabelas têm a vantagem de conseguir expor, sinteticamente e em um só

local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar.

Reunindo, pois os valores em tabelas compactas, consegue-se apresentá-los

e descrever-lhes a variação mais eficientemente. Essa condensação de valores permite ainda a utilização de representação gráfica, que normalmente é uma forma mais útil e elegante de apresentação da característica analisada.

3.2. SÉRIES ESTATÍSTICAS

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais

variáveis podem assumir, para que se tenha uma visão global dessa ou dessas variáveis. Isto é possível apresentando esses valores em tabelas e gráficos que fornecerão rápidas e seguras informações a respeito das variáveis em estudo, permitindo determinações mais coerentes.

TABELA é um quadro que resume um conjunto de observações. Como construir uma tabela que forneça informações de forma precisa e

correta: 1º passo: Começar pelo título, que explica o conteúdo da tabela. 2º passo: Fazer o corpo da tabela, composto pelos números e informações

que ela contém. É formada por linhas e colunas. Para compor o corpo da tabela, é necessário:

O cabeçalho, que indica o que a coluna contém. Deve estar entre traços horizontais, para melhor visualização.




14

A coluna indicadora, que diz o que a linha contém. 3º passo: Escrever o total (as tabelas podem apresentar um total ou não).

Aparece entre traços horizontais. 4º passo: Coloque a fonte. Deve entrar no rodapé, sendo obrigatória. Uma tabela compõe-se de: Tabela 3.1 Produção de Café· Brasil - 1978-1983

Anos Quantidade (1000 ton)

1978 (1) 2535 1979 2666 1980 2122 1981 3760 1982 2007 1983 2500

Fonte: Fictícia Nota: Produção destinada para o consumo interno. (1) Parte exportada para a Argentina.

Rodapé: fonte, chamadas e notas.

Notas: é usada para conceituação ou esclarecimento em geral.

Chamadas: é usada para esclarecer certas minúcias em relação a casas, linhas e colunas.

De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células,

devemos colocar:

Um traço horizontal (___) quando o valor é zero, não só quanto a natureza das coisas, como quanto ao resultado do inquérito;

Três pontos (...) quando não temos os dados;

Um ponto de interrogação (?) quando temos dúvida quanto a exatidão de determinado valor;

Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar a parte decimal um número correspondente de zeros (0,0; 0,00; 0,00;...).

Denomina-se SÉRIE ESTATÍSTICA toda tabela que apresenta a distribuição

de um conjunto de dados estatísticos em função da ÉPOCA, do LOCAL, ou da ESPÉCIE (fenômeno).




15

Numa série estatística observa-se a existência de três elementos ou fatores: o TEMPO, o ESPAÇO e a ESPÉCIE.

Conforme varie um desses elementos, a série estatística classifica-se em

TEMPORAL, GEOGRÁFICA e ESPECÍFICA.

3.2.1. SÉRIE TEMPORAL, HISTÓRICA OU CRONOLÓGICA.

É a série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo.

Tabela 3.2 Produção Brasileira de Trigo· 1988-1993


1988 (1) 2345 1989 2451 1990 2501 1991 2204 1992 2306 1993 2560

Fonte: IBGE Nota: Produção voltada para o consumo interno. (1) Parte da produção exportada.

Elemento variável: tempo (fator cronológico) Elemento fixo: local e o fato

3.2.2. SÉRIE GEOGRÁFICA, TERRITORIAL OU DE LOCALIDADE.

É a série cujos dados estão em correspondência com a região geográfica, ou

seja, o elemento variável é o fator geográfico (a região).

Tabela 3.3 Produção Brasileira de Trigo, por Unidade da Federação - 1994.

Unidades da Federação Quantidade (1000 ton)

São Paulo 670 Santa Catarina 451 Paraná 550 Goiás 420 Rio de Janeiro 306 Rio Grande do Sul 560

Fonte: Fictícia Elemento variável: localidade (fator geográfico) Elemento fixo: tempo e o fato

3.2.3. SÉRIE ESPECÍFICA OU CATEGÓRICA




16

É a série cujos dados estão em correspondência com a espécie, ou seja,

variam com o fenômeno. Tabela 3.4 Rebanhos Brasileiros

Espécie Quantidade

(1000 cabeças)

Bovinos 140 000 Suínos 1 181 Bubalinos 5 491 Coelhos 11 200

Fonte: IBGE

Elemento variável: fenômeno (espécie) Elemento fixo: local e o tempo

3.2.4. SÉRIES MISTAS

As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada.

Tabela 3.5 Exportação Brasileira de alguns produtos agrícolas - 1990 - 1992·

Produto Quantidade (1000 ton)

1990 1991 1992

Feijão 5600 6200 7300 Arroz 8600 9600 10210 Soja 4000 5000 6000

Fonte: Ministério da Agricultura Nota: Produtos mais exportados no período.

Este exemplo se constitui numa Série Temporal-Específica Elemento variável: tempo e a espécie Elemento fixo: local

Obs: uma tabela nem sempre representa uma série estatística, pode ser um aglomerado de informações úteis sobre certo assunto.




17

Tabela 3.6 Situação dos espetáculos cinematográficos no Brasil - 1967

Especificação Quantidade

Número de cinemas 2.488 Lotação dos cinemas 1.722.348 Sessões pôr dia 3.933 Filme de longa metragem 131.330.488 Meia entrada 89.581.234

Fonte: Anuário Estatístico do Brasil - IBGE

OBS:

SÉRIE HOMÓGRADA

A Série homógrada é aquela em que a variável descrita apresenta variação discreta ou descontínua. São séries homógradas as séries temporal, a geográfica e a específica.

SÉRIE HETERÓGRADA A série heterógrada é aquela na qual o fenômeno ou fato apresenta gradações

ou subdivisões. Embora fixo, o fenômeno varia em intensidade. A distribuição de freqüências ou seriação é uma série heterógrada.

4. REPRESENTAÇÃO GRÁFICA

4.1. INTRODUÇÃO

A Estatística Descritiva pode descrever os dados através de gráficos. A apresentação gráfica é um complemento importante da apresentação

tabular. A vantagem de um gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou das freqüências observadas. Os gráficos propiciam uma idéia inicial mais satisfatória da concentração e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis.

4.2. REQUISITOS FUNDAMENTAIS EM UM GRÁFICO:

o Simplicidade: possibilitar a análise rápida do fenômeno observado. Deve

conter apenas o essencial. o Clareza: possibilitar a leitura e interpretações correta dos valores do

fenômeno. o Veracidade: deve expressar a verdade sobre o fenômeno observado.

4.3. GRÁFICOS QUANTO A FORMA:

o Diagramas: gráficos geométricos dispostos em duas dimensões. São mais

usados na representação de séries estatísticas. o Cartogramas: é a representação sobre uma carta geográfica, sendo muito

usado na Geografia, História e Demografia.




18

o Estereogramas: representam volumes e são apresentados em três dimensões.

o Pictogramas: a representação gráfica consta de figuras representativas do

fenômeno. Desperta logo a atenção do público.

5. PRINCIPAIS TIPOS DE GRÁFICOS

5.1. GRÁFICOS EM CURVAS OU EM LINHAS

São usados para representar séries temporais, principalmente quando a série cobrir um grande número de períodos de tempo.

Considere a série temporal:

Tabela 4.1 Produção de Arroz do Município X - 1984-1994


1984 816 1985 904 1986 1.203 1987 1.147 1988 1.239 1989 1.565 1990 1.620 1991 1.833 1992 1.910 1993 1.890 1994 1.903

Fonte: Fictícia

Gráfico 4.1. Produção de Arroz do Município X - 1984-1994

0

500

1000

1500

2000

2500

84 85 86 87 88 89 90 91 92 93 94

(1000 ton)




19

5.2. GRÁFICOS EM COLUNAS

É a representação de uma série estatística através de retângulos, dispostos

em colunas (na vertical) ou em retângulos (na horizontal). Este tipo de gráfico representa praticamente qualquer série estatística.

As regras para a construção são as mesmas do gráfico em curvas. As bases das colunas são iguais e as alturas são proporcionais aos

respectivos dados. Exemplo: Tabela 4.2

Produção de Soja do Município X - 1991-1995

Anos Quantidade

(ton.)

1991 117.579 1992 148.550 1993 175.384 1994 220.272 1995 265.626

Fonte: Secretaria Municipal de Agricultura

Para cada ano é construída uma coluna, variando a altura (proporcional a cada quantidade). As colunas são separadas uma das outras.

Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho

da base da coluna.

0

50000

100000

150000

200000

250000

300000

To

ne

lad

as

1991 1992 1993 1994 1995

Gráfico 4.2. Produção de Soja do Município X - 1991-1995

Uso do gráfico em colunas para representar outras séries estatísticas




20

Tabela 4.3 Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966

Regiões Fisiográficas Área (Km2)

Norte 3.581.180 Nordeste 965.652 Sudeste 1.260.057 Sul 825.621 Centro-oeste 1.879.965

Brasil 8.511.965

Fonte: IBGE.

0

500.000

1.000.000

1.500.000

2.000.000

2.500.000

3.000.000

3.500.000

4.000.000Km2

Norte Nordeste Sudeste Sul Centro-Oeste

Grafico 4.3. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966.

Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico as colunas são ordenadas pela altura, da maior para a menor, da esquerda para a direita.

5.3. GRÁFICOS EM BARRAS

As alturas dos retângulos são iguais e arbitrárias e os comprimentos são

proporcionais aos respectivos dados. As barras devem ser separadas uma das outras pelo mesmo espaço de forma

que as inscrições identifiquem as diferentes barras. O espaço entre as barras pode ser a metade (½) ou dois terços(2/3) de suas larguras.

As barras devem ser colocadas em ordem de grandeza de forma decrescente

para facilitar a comparação dos valores. A categoria “outros” (quando existir) é representada na barra inferior, mesmo que o seu comprimento exceda o de alguma outra.

Outra representação gráfica da Tabela 4.3:




21

0

500.0

00

1.000.0

00

1.500.0

00

2.000.0

00

2.500.0

00

3.000.0

00

3.500.0

00

4.000.0

00

Km2

Norte

Centro-Oeste

Sudeste

Nordeste

Sul

Grafico 4.4. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966.

Tabela 4.4

Matrícula efetiva no Ensino Superior, segundo os ramos de ensino -Brasil – 1995

Ramos de ensino Matrículas

Filosofia, Ciências e Letras 44.802 Direito 36.363 Engenharia 26.603 Administração e Economia 24.027 Medicina 17.152 Odontologia 6.794 Agricultura 4.852 Serviço Social 3.121 Arquitetura e Urbanismo 2.774 Farmácia 2.619 Demais ramos 11.002

Total 180.109

Fonte: Fictícia




22

05000

1000015000

2000025000

3000035000

4000045000

Matrículas

Filosofia, Ciências e Letras

Direito

Engenharia

Administração e Econômia

Medicina

Odontologia

Agricultura

Serviço Social

Arquitetura e Urbanismo

Farmácia

Demais ramos

Grafico 4.5. Matrícula efetiva no Ensino Superior, segundo os ramos de ensino - Brasil -

1999.

OBS: Quando a variável em estudo for qualitativa e os nomes das categorias

for extenso ou as séries forem geográficas ou específicas é preferível o gráfico em barras, devido a dificuldade em se escrever a legenda em baixo da coluna.

5.4. GRÁFICO EM COLUNAS MÚLTIPLAS (AGRUPADAS)

É um tipo de gráfico útil para estabelecer comparações entre as grandezas de

cada categoria dos fenômenos estudados. A modalidade de apresentação das colunas é chamada de Gráfico de Colunas

Remontadas. Ele proporciona economia de espaços sendo mais indicado quando a série apresenta um número significativo de categorias.

Exemplo: Tabela 4.5

Entrada de migrantes em três Estados do Brasil - 1992-1994

Número de migrantes

Anos

Total Estados

Amapá São Paulo Paraná

1992 4.526 2.291 1.626 609 1993 4.633 2.456 1.585 592 1994 4.450 2.353 1.389 708

Fonte: Fictícia




23

0

500

1000

1500

2000

2500Q

uan

tid

ad

e

1992 1993 1994

Gráfico 4.6. Entrada de migrantes em três Estados do Brasil

1992-1994.

Amapá São Paulo Paraná

5.5. GRÁFICO EM BARRAS MÚLTIPLAS (AGRUPADAS)

Útil quando a variável for qualitativa ou os dizeres das categorias a serem escritos são extensos.

Exemplo: Tabela 4.6 Importação Brasileira de vinho e champanhe proveniente de várias

origens - 1994

Países

Importação (1.000 dólares)

Vinho Champanhe

Portugal 220 15 Itália 175 25 França 230 90 Argentina 50 5 Chile 75 20 Espanha 110 16

Fonte: Fictícia

0 50 100 150 200 250

1000 dólares

França

Portugal

Itália

Espanha

Chile

Argentina

Gráfico 4.7. Importação Brasileira de vinho e champanhe proveniente de várias origens -

1994.

Vinho Champanhe




24

5.6. GRÁFICO EM SETORES

É a representação gráfica de uma série estatística em um círculo de raio qualquer, pôr meio de setores com ângulos centrais proporcionais às ocorrências.

É utilizado quando se pretende comparar cada valor da série com o total.

O total da série corresponde a 360 (total de graus de um arco de circunferência).

O gráfico em setores representa valores absolutos ou porcentagens complementares.

As séries geográficas, específicas e as categorias em nível nominal são mais representadas em gráficos de setores, desde que não apresentem muitas parcelas (no máximo sete).

Cada parcela componente do total será expressa em graus, calculada através de uma regra de três:

Total - 360

Parte - x

Exemplo:

Tabela 4.7 Produção Agrícola do Estado A - 1995

Produtos Quantidade (t)

Café 400.000 Açúcar 200.000 Milho 100.000 Feijão 20.000

Total 720.000

Fonte: Fictícia

Gráfico 4.8. Produção Agrícola do Estado A - 1995.

Café

55%Açucar

28%

Milho

14%

Feijão

3%

Outras maneiras de representar graficamente a Tabela 4.7:




25

0

50.000

100.000

150.000

200.000

250.000

300.000

350.000

400.000

Quantidade (t)

Café Açucar Milho Feijão


0

50.000

100.0

00

150.0

00

200.0

00

250.0

00

300.0

00

350.0

00

400.0

00Quantidade (t)

Café

Açucar

Milho

Feijão


6. DISTRIBUIÇÃO DE FREQÜÊNCIAS

6.1. INTRODUÇÃO

As tabelas estatísticas, geralmente, condensam informações de fenômenos

que necessitam da coleta de grande quantidade de dados numéricos. No caso das distribuições de freqüências que é um tipo de série estatística, os dados referentes ao fenômeno objeto de estudo se repetem na maioria das vezes sugerindo a apresentação em tabela onde apareçam valores distintos um dos outros.

6.2. DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS

É a série estatística que condensa um conjunto de dados conforme as

freqüências ou repetições de seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as freqüências correspondentes. Os elementos época, local e fenômeno são fixos. O fenômeno apresenta-se através de gradações, ou seja, os dados estão agrupados de acordo com a intensidade ou variação quantitativa gradual do fenômeno.




26

6.3. REPRESENTAÇÃO DOS DADOS (AMOSTRAIS OU POPULACIONAIS)

o Dados brutos: são aqueles que não foram numericamente organizados, ou seja, estão na forma com que foram coletados.

Tabela 5.1 - Número de filhos de um grupo de 50 casais

2 3 0 2 1 1 1 3 2 5 6 1 1 4 0 1 5 6 0 2 1 4 1 3 1 7 6 2 0 1 3 1 3 5 7 1 3 1 1 0 3 0 4 1 2 2 1 2 3 2

o Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente.


o Distribuição de freqüências: é a disposição dos valores com as respectivas

freqüências. O número de observações ou repetições de um valor ou de uma modalidade, em um levantamento qualquer, é chamado freqüência desse valor ou dessa modalidade. Uma tabela de freqüências é uma tabela onde se procura fazer corresponder os valores observados da variável em estudo e as respectivas freqüências.

a) Distribuição de freqüências para variável discreta

Os dados não são agrupados em classes.


Número de filhos (x i) Contagem ou tabulação

Número de casais (f i)

Total ( )

0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7




27


Número de filhos (x i)

Numero de casais (f i)

Total ( )

Obs: X: representa a variável Número de filhos. xi: representa os valores que a variável assume. fi: é o número de vezes que cada valor aparece no conjunto de dados (freqüência simples absoluta).

fi = 50 n: tamanho da amostra (ou nº de elementos observados). N: tamanho da população (ou nº de elementos observados).

b) Distribuição de freqüências para variável contínua Os dados da variável são agrupados em classe (grupo de valores).

Dados brutos Tabela 5.5 - Taxas municipais de urbanização (em percentual) no Estado de Alagoas - 1970

8 24 46 13 38 54 44 20 17 14 18 15 30 24 20 8 24 18 9 10 38 79 15 62 23 13 62 18 8 22 11 17 9 35 23 22 37 36 8 13 10 6 92 16 15 23 37 36 8 13 44 17 9 30 26 18 37 43 14 9 28 41 42 35 35 42 71 50 52 17 19 7 28 23 29 29 58 77 72 34 12 40 25 7 32 34 22 7 44 15 9 16 31 30

Rol Tabela 5.6 - Rol das taxas municipais de urbanização, no Estado de Alagoas (em %) - 1970.

6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 11 12 13 13 13 13 14 14 14 15 15 15 15 16 16 17 17 17 17 18 18 18 18 19 20 20 22 22 22 23 23 23 23 24 24 24 25 26 28 28 29 29 30 30 30 31 32 34 34 34 35 35 35 36




28

37 37 38 38 40 41 42 42 43 44 44 44 46 50 52 54 58 62 62 71 72 77 79 92

Distribuição de freqüências para dados agrupados em classes Tabela 5.7 - Taxas municipais de urbanização, no Estado de Alagoas (em %) - 1970.

Taxas (em %)

Número de Municípios ( f i )

6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1

Total ( ) 94

Obs:

f i: freqüência simples absoluta.

2. f i = n = 94.

Quando a variável, objeto de estudo for contínua, recomenda-se agrupar os valores observados em classes. Se a variável for discreta e o número de valores observados for muito grande recomenda-se agrupar os dados em classes, evitando-se, com isso, grande extensão da tabela e a não interpretação dos valores de fenômeno.

7. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA

o Amplitude total (AT): é a diferença entre o maior e o menor valor observado.

o Freqüência simples absoluta (fi): é o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe (grupo de valores).

o Classe (K): é cada um dos grupos de valores do conjunto de valores observados,

ou seja, são os intervalos de variação da variável.

7.1. DETERMINAÇÃO DO NÚMERO DE CLASSES (K)

É importante que a distribuição conte com um número adequado de classes. Se o número de classes for excessivamente pequeno acarretará perda de detalhe e pouca informação se poderá extrair da tabela. Pôr outro lado, se forem utilizadas um número excessivo de classes, haverá alguma classe com freqüência nula ou muito pequena, não atingindo o objetivo de classificação que é tornar o conjunto de dados supervisionáveis.

Fórmula de Sturges:




29

K 1 + 3,3. Log n

o Intervalo de classe ou amplitude do intervalo de classe (i): é o comprimento da

classe.

i A T/ K Obs: - Convém arredondar o número correspondente à amplitude do intervalo

de classe para facilitar os cálculos (arredondamento arbitrário). - Intervalo de classe: i = l s - l i

o Limites de classes (limite inferior e limite superior): são os valores extremos de

cada classes.

Seja a classe 6 16 - limite inferior ( l i ) = 6 e limite superior ( l s ) = 16. Os valores 6 e 96, que representam, respectivamente, o limite inferior da 1ª

classe e o limite superior da última classe, são denominados também limite inferior e limite superior da distribuição de freqüência.

É recomendável que os limites de classes sejam representados por números

inteiros. Deve-se ter o cuidado para evitar interpretações ambíguas. Por exemplo: 30 _____ 40 40 _____ 50 50 _____ 60 O correto é: 30 _____ 39 40 _____ 49 50 _____ 59

Caso os valores estiveram arredondados para inteiro. Entretanto, se os valores originais estiverem com precisão até centavos:

30,00 ____ 39,99 40,00 ____ 49,99 50,00 ____ 59,99 Em virtude de ordem estética, recomenda-se: 30 ------| 40 40 ------| 50 50 ------| 60

Limites reais Dizemos que os limites indicados em cada linha de uma tabela de distribuição

de freqüências são os limites reais quando o limite superior de cada classe coincide com o limite inferior da classe seguinte.




30

Veja o exemplo da Tabela 5.7, os limites são reais, cada limite superior de

uma classe coincide com o limite inferior da classe seguinte. Vale observar que o uso do símbolo ---- só é possível com os limites reais de

classe.

o Ponto médio das classes ( x i ): é o valor representativo da classe para efeito de

cálculo de certas medidas. Para qualquer representação tabular basta acrescentar ao seu limite inferior a metade da amplitude do intervalo de classe.

x i = i / 2 + l i

Exemplo: 6 16, i = 10 metade de i = 10/2 = 5 x i = 5 + 6 = 11

Quando o limite superior de uma classe for igual ao inferior da seguinte, o intervalo de classe poderá ser calculado através da média aritmética dos limites do intervalo.

Exemplo: 6 16 : x i = (6 + 16)/2 = 11

Para obter os pontos médios das classes seguinte, basta acrescentar ao ponto médio da classe precedente a amplitude do intervalo de classe (se for constante).

8. TIPOS DE FREQÜÊNCIAS

o Freqüência simples absoluta (f i): é o número de repetições de um valor individual ou de uma classe de valores da variável.

f i = n

o Freqüência simples relativa (f r): representa a proporção de observações de um valor individual ou de uma classe em relação ao número total de observações. Para calcular a freqüência relativa basta dividir a freqüência absoluta da classe ou do valor individual pelo número total de observações. É um valor importante para comparações.

f r = f i / n = f i / f i

Para expressar o resultado em termos percentuais, multiplica-se o quociente

obtido por 100. f r = (f i / n). 100

A freqüência relativa é o resultado de uma regra de três simples: n ------- 100% Exemplo: 94 ------ 100% f i ------- x% 29 ------ x% x = 30,9 % Obs:




31

- a soma das freqüências simples relativa de uma tabela de freqüência é

sempre igual a 1,00: f r = 1,00. - a soma das freqüências relativas percentuais de uma tabela de

freqüência é sempre igual a 100%: f r = 100%. 9. DISTRIBUIÇÕES CUMULATIVAS

9.1. Freqüência absoluta acumulada (Fac)

É a soma da freqüência simples absoluta da classe atual com a(s) da(s) classe(s) anterior(es).

9.2. Freqüência relativa acumulada (Frac)

A freqüência relativa acumulada de uma classe ou do valor individual i é igual

a soma da freqüência simples relativa da classe ou do valor individual com as freqüências simples relativas das classes ou dos valores anteriores. As freqüências relativas acumuladas podem ser obtidas de duas formas:

1. Acumulando as freqüências simples relativas de acordo com a definição de

freqüências acumuladas. 2. Calculando as freqüências relativas diretamente a partir das freqüências

absolutas de acordo com a definição de freqüências relativas: F r = F i / n

Exemplos:

1 ) Considere a variável número de filhos do sexo masculino de 34 famílias com 4 filhos cada uma.

0 2 3 4

0 2 3 4

1 2 3 4

1 2 3 4

1 2 3

1 2 3

1 2 3

1 2 3

2 3 3

2 3 3

Distribuição de freqüência sem classes por se tratar de uma Variável Discreta. Tabela 1- Número de filhos do sexo masculino de 34 famílias com 4 filhos cada uma.

Número meninos

(x i)

Número de

família (f i)

fr

Fac

fr %

Frac

Frac%




32

0 1 2 3 4

Total ( )

2 ) Considere a estatura (em cm) de 40 alunos do Colégio B.

150 156 161 164

151 156 161 165

152 157 161 166

153 158 161 167

154 158 162 168

155 160 162 168

155 160 163 169

155 160 163 170

155 160 164 172

156 160 164 173

Distribuição de freqüências com classes por se tratar de uma Variável Continua.

Tabela 2- Estatura (em cm) de 40 alunos do Colégio B.

Estatura (em cm)

Número de alunos

(f i)

fr

Fac

fr %

Frac

Frac%

150 –|154 154 –| 158 158 –| 162 162 –| 166 166 –| 170

170 –|174

4 9

11 8 5 3

Total ( ) 40 10. HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS

10.1. HISTOGRAMAS

São gráficos de superfícies utilizados para representar distribuições de freqüências com dados agrupados em classes.

O histograma é composto por retângulos (denominados células), cada um deles representando um conjunto de valores próximos (as classes).

A largura da base de cada célula deve ser proporcional à amplitude do intervalo da classe que ela representa e a área de cada célula deve ser proporcional à freqüência da mesma classe.

Se todas as classes tiverem igual amplitude, então as alturas dos retângulos serão proporcionais às freqüências das classes que eles representam.

Considere o histograma obtido a partir da Tabela 2:




33

Tabela 2 - Taxas municipais de urbanização, no Estado de Alagoas (em %) - 1970.

Taxas (em %)

Número de Municípios (f i)

Percentual

6 ---| 16 29 30,9 16 ---| 26 24 25,5 26 ---| 36 16 17,0 36 ---| 46 13 13,8 46 ---| 56 4 4,3 56 ---| 66 3 3,2 66 ---| 76 2 2,1 76 ---| 86 2 2,1 86 ---| 96 1 1,1

Total ( ) 94 100,0

10.2. POLÍGONO DE FREQUÊNCIAS

O polígono de freqüências é o gráfico que obtemos unindo pontos dos lados superiores dos retângulos de um histograma por meio de segmentos de reta consecutivos.

Na Tabela 5.7, temos: Tabela 5.7 - Taxas municipais de urbanização, no Estado de Alagoas (em %) - 1970.

Taxas (em %)

Número de Municípios (f i)

Percentual

6 ---| 16 29 30,9

16 ---| 26 24 25,5

26 ---| 36 16 17,0

36 ---| 46 13 13,8

46 ---| 56 4 4,3

56 ---| 66 3 3,2

66 ---| 76 2 2,1

76 ---| 86 2 2,1

86 ---| 96 1 1,1

Total ( ) 94 100,0

11. MEDIDAS DE POSIÇAO (MEDIDAS DE TENDÊNCIA CENTRAL)

As distribuições de freqüências para variáveis discretas e contínuas descrevem os grupos que uma variável pode assumir. É possível visualizar a concentração de valores de uma distribuição de freqüências. Localizam-se no início, no meio ou no final, ou se distribuem de forma igual.

As medidas de posição são números que resumem e representam características importantes da distribuição de freqüências e podem apresentar-se de várias formas, dependendo daquilo que se pretende conhecer a respeito dos dados.

As medidas de posição são chamadas de medidas de tendência central, devido à tendência de os dados observados se concentrarem em torno desses valores centrais que se localizam em torno do meio ou centro de uma distribuição.




34

As medidas (número-resumo) mais usadas para representar um conjunto de

dados são a média, a moda e a mediana.

11.1. Média aritmética

Para dados não-agrupados (ou dados simples)

Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média aritmética simples de X, representada por x, é definida por:

x1 + x2 + x3 + ... + xn xi

x = ------------------------------- ou x = ------- n n

xi : são os valores que a variável X assume n: número de elementos da amostra observada

Exemplo: A produção leiteira diária da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produção média da semana (a média aritmética).

xi 10 + 15 + 14 + 13 + 16 + 19 + 18 x = --------- x = ---------------------------------------------- = 15 litros n 7

Para dados agrupados

Se os valores da variável forem agrupados em uma distribuição de freqüências será usada a média aritmética dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas freqüências absolutas: f1, f2, f3 ,..., fn.

xi . ƒi

x = ------------ , onde: n

xi : valores observados da variável ou ponto médio das classes

ƒi: freqüência simples absoluta

ƒi = n : número de elementos da amostra observada

A fórmula acima será usada para as distribuições de freqüências sem classes

e com classes.

Média aritmética para dados agrupados sem classes (Média aritmética ponderada)




35

(Dados sem classes): Determinar a média aritmética da Tabela 5.4


Número de filhos ( xi )

Numero de casais

( fi )

xi . ƒi

0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2

Total ( ) 50

Média aritmética para dados agrupados com classes intervalares

(Dados com classes): Determinar a média aritmética da Tabela 5.7

Tabela 5.7 - Taxas municipais de urbanização, no Estado de Alagoas (em %) 1970.

Taxas (em %)

Número de Municípios

( fi )

xi

xi . ƒi

6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1

Total ( ) 94

xi . ƒi

x = ------------ = ---------- x = n

Propriedades da média aritmética 1ª propriedade

A soma algébrica dos desvios em relação à média é zero (nula).

di = (xi - x ) = 0

Onde: di são as distâncias ou afastamentos da média.




36

Em uma distribuição simétrica será igual a zero e tenderá a zero se a distribuição for assimétrica.

Idades ( xi ) di = xi - x

2 d1 = 2 – 6 = -4 4 d2 = 4 – 6 = -2 6 d3 = 6 – 6 = 0 8 d4 = 8 – 6 = +2 10 d5 = 10 – 6 = +4

0

2ª propriedade

Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante.

Somar o valor 2 aos dados da tabela e calcular a nova média

Idades ( xi ) xi + 2

2 2 + 2 = 4 4 4 + 2 = 6 6 6 + 2 = 8 8 8 + 2 = 10

10 10 + 2 = 12

40

A nova média será: 40

x = ------ = 8. No caso, a média aritmética anterior ficou aumentada de 2. 5

3ª propriedade

Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante:

Multiplicar o valor 2 aos dados da tabela e calcular a nova média

Idades ( xi ) xi x 2

2 2 x 2 = 4 4 4 x 2 = 8 6 6 x 2 = 12 8 8 x 2 = 16

10 10 x 2 = 20

60




37

A nova média será: 60

x = ------ = 12. No caso, a média aritmética anterior ficou multiplicada por 2. 5

4ª propriedade

A soma dos quadrados dos afastamentos contados a partir da média aritmética é um mínimo.

Idades ( xi ) di = (xi – x) di2 = (xi – x)2

2 d1 = 2 – 6 = -4 (– 4)2 = 16

4 d2 = 4 – 6 = -2 (– 2)2 = 4

6 d3 = 6 – 6 = 0 ( 0)2 = 0

8 d4 = 8 – 6 = +2 ( +2)2 = 4

10 d5 = 10 – 6 = +4 ( +4)2 = 16

0 40

De modo que: (xi – x)2 = 40 sendo este valor o menor possível. Isso significa que, se tomássemos outro valor que não a média (x), o resultado dessa operação seria maior que o obtido.

5ª propriedade

A média aritmética é atraída pelos valores extremos. Considere os valores originais:

xi : 2, 4, 6, 8, 10 x = 6 Se o primeiro valor xi for alterado para 0:

xi : 0, 4, 6, 8, 10 x = 5,6 Se o último valor xi for alterado para 12:

xi : 2, 4, 6, 8, 12 x = 6,4

11.2. Moda (Mo)

Também chamada de norma, valor dominante ou valor típico. Defini-se a moda como o valor que ocorre com maior freqüência em conjunto de dados.

Exemplo: Se o salário modal dos empregados de uma empresa é igual a mil reais, este é o salário recebido pela maioria dos empregados dessa empresa.

A moda é utilizada freqüentemente quando os dados estão registrados na escala nominal.

Exemplo:




38

Sexo dos alunos – Turma A – Escola Z

Sexo Freqüência

Masculino 40 Feminino 60

Total 100

A moda é sexo feminino porque tem maior freqüência.

Para dados não agrupados

Primeiramente os dados devem ser ordenados para , em seguida, observar o valor que tem maior freqüência.

Exemplo: Calcular a moda dos seguintes conjuntos de dados:

1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (0 valor mais freqüente) Esse conjunto é unimodal, pois apresenta apenas uma moda.

2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais freqüentes)

Esse conjunto é bimodal, pois apresenta duas modas.

3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais freqüentes)

Esse conjunto é plurimodal, pois apresenta mais de duas modas.

4. W = (1, 2, 3, 4, 5, 6) Esse conjunto é amodal porque não apresenta um valor predominante.

Para dados agrupados sem classes

Basta observar, na tabela, o valor que apresenta maior freqüência. 1º) Cálculo da moda pelo ROL

Na Tabela 5.2, o resultado 1 aparece mais vezes Mo =1. Tabela 5.2 - Número de filhos de um grupo de 50 casais

0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7

2º) Cálculo da moda pela distribuição de freqüências sem classes




39



Numero de casais

( fi )

O valor 1 apresenta a maior freqüência. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado.

0 6

1 16

2 9

3 8

4 3

5 3

6 3

7 2

Total ( ) 50

Para dados agrupados em classes

Tabela 5.7 – Taxas municipais de urbanização (em %) – Alagoas, 1970. Taxas (em %)


( fi )

6 --- 16 29 24 16 13 4 3 2 2 1

16 --- 26 26 --- 36 36 --- 46 46 --- 56 56 --- 66 66 --- 76 76 --- 86 86 --- 96

Total ( ) 94

D1

Fórmula de Czuber: Mo = LMo + -------------- x h D1 + D2

Sendo: LMo : limite inferior da classe h: intervalo da classe modal

D1: freqüência simples da classe modal freqüência simples anterior à da classe modal

D2: freqüência simples da classe modal freqüência simples posterior à da classe modal

Na Tabela 5.7, temos: 29 LMo = 6 Mo = 6 + ------------- x 10 = 14,5% h = 10 29 + 5

D1 = 29 0 = 29




40

D2 = 29 24 = 5 A taxa de urbanização mais freqüente ficou em torno de 14,5%.

11.3. Mediana (Md) É uma medida de posição cujo número divide um conjunto de dados em duas

partes iguais. Por esse motivo, a mediana é considerada uma medida separatriz. Portanto, a mediana se localiza no centro de um conjunto de números ordenados segundo uma ordem de grandeza.

Para dados não agrupados

a) O número de valores observados é impar Exemplo: Considere o conjunto de dados: X = (5, 2, 7, 10, 3, 4, 1) 1º) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 5, 7, 10) 2º) Determinar a ordem ou posição (P) da Mediana por n + 1 P = ------- , quando n (nº de elementos) for ímpar 2 7 + 1 P = ------- = 4ª posição. O número que se encontra na 2 4ª posição é o número 4. Md = 4

b) O número de valores observados é par Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) 1º) Colocar os valores em ordem crescente ou decrescente: X = (2, 3, 4, 6, 7, 8, 9, 10) 2º) Determinar a ordem ou posição (P) da Mediana por n n P = ---- e P = ---- + 1 2 2 8 8 P = ---- = 4ª posição e P = ---- + 1 = 5ª posição 2 2 Os números são 6 (4ª posição) e 7 (5ª posição). Tira-se a média aritmética entre os dois números. 6 + 7 Md = ----------- = 6,5 2




41

Para dados agrupados sem classes



Numero de casais

( fi )

Fac

0 6 6 1 16 22 2 9 31 3 8 39 4 3 42 5 3 45 6 3 48 7 2 50

Total ( ) 50

1º) Determinar a posição da mediana por: n n P = ---- e P = ---- + 1 , pois n é par 2 2 50 50 P = ----- = 25ª posição e P = ----- + 1 = 26ª posição 2 2 2º) Pela Fi (freq. abs. Acum. abaixo de) verifica-se que o 31 contém o 25º e 26º elemento 2 +2 25º corresponde ao nº 2 Md = -------- = 2 26º corresponde ao nº 2 2 O nº 2 deixa 50% dos valores, ou seja, é o elemento central.

Para dados agrupados em classes

Tabela 5.7 - Taxas municipais de urbanização (em %) – Alagoas, 1970.

Taxas (em %)


( fi ) Fac

6 --- 16 29 29 16 --- 26 24 53 26 --- 36 16 69 36 --- 46 13 82 46 --- 56 4 86 56 --- 66 3 89 66 --- 76 2 91 76 --- 86 2 93 86 --- 96 1 94

Total ( ) 94




42

n 94 1º) Calcular a posição: P = ---- = ---- = 47ª posição 2 2 (não importa de n for ímpar ou par)

2º) Pela Fi identifica-se a classe que contém a Md:

O nº 47 está dentro de 53. Portanto, a classe da Md é a 2ª: 16 --- 26. 3º) Aplica-se a fórmula: Md = LMd + (n/2 – Fa) fMd x h onde, * LMd = limite inferior da classe da Md = 16

* n = tamanho da amostra ou nº de elementos

n/2 = 94/2 = 47 * Fa = frequência acumulada anterior à classe da Md = 29 * h = intervalo da classe da Md = 10 * fMd = frequência simples da classe da Md = 24

47 – 29 Md = 16 + ------------- x 10 = 23,5% 24 50% das taxas de urbanização estão antes taxa 23,5%.

11.4. Quartis (medidas separatrizes)

Dividem um conjunto de dados em quatro partes iguais.

Q1 = 1º quartil, deixa 25% dos elementos. n 1º) Calcular a posição: P = ---- (seja n ímpar ou par) 4

2º) Pela Fi identifica-se a classe que contém o Q1

3º) Aplica-se a fórmula: n/4 – Faca Q1 = LQ1 + -------------- x h f Q1

sendo * LQ1 = limite inferior da classe do Q1 * n = tamanho da amostra ou nº de elementos * Faca = frequência acum. anterior à classe do Q1 * h = intervalo da classe do Q1 * f Q1 = frequência simples da classe do Q1

Q3 = 3º quartil, deixa 75% dos elementos. 3 n 1º) Calcular a posição: P = ----- (seja n ímpar ou par) 4

2º) Pela Fi identifica-se a classe que contém do Q3

3º) Aplica-se a fórmula:

3n/4 – Faca

Q3 = LQ3 + -------------- x h f Q3

sendo * LQ3 = limite inferior da classe do Q3 * n = tamanho da amostra ou nº de elementos * Faca = frequência acum. anterior à classe do Q3 * h = intervalo da classe do Q3 * f Q3 = frequência simples da classe do Q3




43

Q2 = 2º quartil, é igual a mediana, deixa 50% dos elementos

11.5. Decis: dividem a série em 10 partes iguais in 1º) Calcular a posição: P = ---- (seja n ímpar ou par), 10 em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9

2º) Pela Fi identifica-se a classe que contém o Di


in/10 – Faca

Di = L Di + ---------------- x h f Di

sendo * LDi = limite inferior da classe Di , i = 1, 2, 3, ..., 9 * n = tamanho da amostra ou nº de elementos * Faca = frequência acum. anterior à classe do Di * h = intervalo da classe do Di * f Di = frequência simples da classe do Di

11.6. Percentis: dividem a série em 100 partes iguais in 1º) Calcular a posição: P = ----- (seja n ímpar ou par), 100 em que i = 1, 2, 3, ..., 98, 99

2º) Pela Fi identifica-se a classe que contém o Pi


in/100 – Faca

Pi = L Pi + ----------------- x h f Pi

sendo * LPi = limite inferior da classe Pi , i = 1, 2, 3, ..., 99 * n = tamanho da amostra ou nº de elementos * Faca = freqüência acum. anterior à classe do Pi * h = intervalo da classe do Pi * f Pi = freqüência simples da classe do Pi




44

12. Medidas de dispersão (Medidas de variabilidade)

São medidas utilizadas para medir o grau de variabilidade, ou dispersão dos valores observados em torno da média aritmética. Servem para medir a representatividade da média e proporcionam conhecer o nível de homogeneidade ou heterogeneidade dentro de cada grupo analisado.

Considere a seguinte situação: Um empresário deseja comparar a performance de dois empregados, com

base na produção diária de determinada peça, durante cinco dias:

Empregado A: 70, 71, 69, 70, 70 x = 70.

Empregado B: 60, 80, 70, 62, 83 x = 71. A performance média do empregado A é de 70 peças produzidas diariamente,

enquanto que a do empregado B é de 71 peças. Com base na média aritmética, verifica-se que a performance de B é melhor do que a de A. Porém, observando bem os dados, percebe-se que a produção de A varia apenas de 69 a 71 peças, ao passo que a de B varia de 60 a 83 peças, o que revela que a performance de A é bem mais uniforme do que de B.

Qual o melhor empregado?

12.1. Tipos de medidas de dispersão

12.1.1. Medidas de dispersão absoluta

o Amplitude total (AT): é a diferença entre o maior e o menor valor observado.

AT = xmax xmin

Empregado A = 71 69 = 2

Empregado B = 83 60 = 23

o Desvio médio (DM)

Analisa todos os desvios ou distâncias em relação à média aritmética. O cálculo dos desvios feito por:

di = (xi x) onde, di = desvio ou distância xi = valores observados x = média aritmética

A soma de todos os desvios em relação à média aritmética é igual a zero:

di = (xi – x) = 0

Cálculo dos di: Para eliminar a soma zero, coloca-se os desvios em módulo:

Empregado A d1 = 70 – 70 = 0 d2 = 71 – 70 = +1

d3 = 69 – 70 = 1 d4 = 70 – 70 = 0 d5 = 70 – 70 = 0

di = 0

Empregado B

d1 = 60 – 71 = 11 d2 = 80 – 71 = +9

d3 = 70 – 71 = 1

d4 = 62 – 71 = 9 d5 = 83 – 71 = +12

di = 0

Empregado A

d1 = 0 = 0

d2 = +1 = 1

d3 = 1 = 1

d4 = 0 = 0

d5 = 0 = 0

di = 2

Empregado B

d1 = –11 = 11

d2 = +9 = 9

d3 = –1 = 1

d4 = –9 = 9

d5 = +12 = 12

di = 42

Dessa forma, é possível calcular a média dos desvios por:




45

di xi x DM = ----------- = ---------------- n n

Empregado A

di 2 DM = ----------- = ----- = 0,4 n 5

Empregado B

di 42 DM = ----------- = ----- = 8,4 n 5

Variância amostral (s2) É usada quando o estudo é feito por amostragem.

(xi x)2 s2 = ----------------

n – 1

Variância – para dados agrupados sem e com classes

Variância populacional:

(xi x)2 . fi 2 = ---------------------

N

Variância amostral:

(xi x)2 . fi s2 = ---------------------

n – 1

OBS: quando os dados forem uma amostra, usa-se o denominador n – 1 na fórmula da variância, pois se obtém uma estimativa melhor do parâmetro da população. Quando a amostra for grande (n > 30) não há diferença entre usar n – 1 ou n.

o Desvio-padrão É a raiz quadrada da variância. Na fórmula original para o cálculo da variância, observa-se que é uma soma de quadrados. Por exemplo, se a unidade original for metro (m) o resultado será metro ao quadrado (m2). Para retornar a unidade de medida original, extrai-se a raiz quadrada da variância, passando a chamar-se de desvio-padrão.

Desvio-padrão populacional

= √ 2

Desvio-padrão amostral

s = √s2




46

12.1.2. Medida de dispersão relativa

o Coeficiente de variação (CV)

É uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas.

População

CV = ------ x 100

x

ou

Amostra s

CV = ------ x 100 X

O coeficiente de variação é expresso em porcentagem. Duas maneiras de analisar o CV:

Pequena dispersão: CV 10%

Média dispersão: 10% CV 20%

Grande dispersão: CV 20%

Baixa dispersão: CV 15%

Média dispersão: 15% CV 30%

Grande dispersão: CV 30%




47

PRINCÍPIO FUNDAMENTAL DA CONTAGEM

Uma pessoa mora em Nova Iguaçu e trabalha em Copacabana. Ela vai trabalhar

todos os dias usando apenas transporte coletivo. Esta pessoa vai Nova Iguaçu ao Centro do

Rio tomando ônibus, van ou trem. Do Centro do Rio, pode ir a Copacabana de ônibus, van

ou metrô. Levando em conta apenas estas possibilidades, de quantas maneiras ela poderá ir

de casa ao trabalho?

Neste caso podemos contar facilmente todas as 9 possibilidades:

{(V,V), (V,O), (V,M), (O,V), (O,O), (O,M), (T,V), (T,O), (T,M)},

onde usamos uma notação em que, por exemplo, (T, M) indica que ela toma o

primeiro percurso e, em seguida, o metrô.

Em geral a solução de problemas deste tipo se baseia no princípio multiplicativo,

também chamado de princípio fundamental da contagem.

Suponha que existam N1 maneiras de se realizar uma tarefa T1 e N2 maneiras de se

realizar uma tarefa T2. Então há N1 x N2 maneiras de se realizar a tarefa T1 seguida da

tarefa T2.

Exemplo 1

Na discussão acima, T1 é a tarefa de ir de Nova Iguaçu ao Centro do Rio e N1 = 3

(há 3 possibilidades de se fazer isto). Da mesma forma, T2 é a tarefa de ir do Centro do

Rio a Copacabana, e há N2 = 3 possibilidades de se realizar esta tarefa. No total, há:

N1 x N2 = 3 x 3 = 9 possibilidades

Exemplo 2




48

Um aluno se prepara para ingressar no ensino superior. Ele pode escolher entre 10

universidades. Se cada uma delas tiver 15 cursos, quantas possibilidades de cursos há para

este aluno?

10 x 15 = 150 cursos diferentes

O princípio acima pode ser estendido para a situação em que temos várias tarefas, o

que é chamado Princípio da Multiplicação Generalizado.

Se uma tarefa T1 pode ser feita de N1 maneiras, uma tarefa T2 de N2 maneiras, ... ,

uma tarefa Tk de Nk maneiras, então o número de maneiras de realizar T1, T2, ... , Tk, em

seqüência, é N1 x N2 X ... X Nk. 6

Exemplo 3

Em um jogo de "cara ou coroa", uma moeda é lançada 3 vezes. Qual o número de

resultados possíveis?

Cada lançamento tem dois resultados possíveis: cara ou coroa, que representaremos

por C e Cr, respectivamente.

Como foi lançada 3 vezes, há 2 x 2 x 2 = 8 resultados possíveis. Podemos ver os

resultados possíveis no diagrama:

No diagrama anterior foi utilizada uma notação por termos ordenados em que, por

exemplo, (C, Cr, C) indica que os resultados dos 3 lançamentos foram, nesta ordem, cara,

coroa e cara.

Quantos resultados têm exatamente 2 caras?




49

Inspecionando os 8 resultados possíveis, vemos que há 3 resultados com exatamente

2 caras.

Mas, e no caso de um número maior de lançamentos? Não poderemos, em

geral, responder a pergunta inspecionando todas os resultados possíveis.

Em qualquer caso, o Princípio Multiplicativo permite dizer quantos resultados

possíveis há no total. Se uma moeda for lançada N vezes, temos:

2 x 2 x 2 x ... 2 = 2N resultados possíveis.

13. Permutações

Para entender o que é permutação, vamos começar com um exemplo. Um pai quer

tirar uma fotografia de seus 3 filhos, mas não consegue colocar os 3 garotos em ordem:

todos querem ficar no meio e ninguém quer car nos lados.

O pai poderia obrigá-los à força, mas como é paciente e educador moderno ele

decide tirar uma foto de cada ordenação possível dos 3 meninos. Quantas fotos o paciente

pai deverá tirar?

Os garotos se chamam André (A), João (J) e Pedro (P). É fácil lista". todas as

ordenações possíveis. Elas são as seguintes:

São, portanto, 6 ordenações possíveis.

AJP, APJ, JAP, JPA, PAJ e PJA

Dado um conjunto de objetos distintos, uma permutação do conjunto é uma

ordenação dos elementos deste conjunto.

No exemplo acima, o conjunto

{A, J, P}

possui 6 permutações, que são as listadas acima.

Uma maneira de calcular quantas são as permutações de um conjunto sem ter que

listá-las é usar o princípio multiplicativo.

Voltando ao nosso exemplo do pai com paciência de Jó, são 3 posições na foto, as

quais representamos com 3 traços:

____ ____ ____

De quantas maneiras podemos preencher a primeira posição? De 3 maneiras, pois

são 3 crianças. Uma vez escolhido quem fica na primeira posição, temos 2 escolhas




50

possíveis para a segunda posição, pois restaram 2. crianças. Depois disto, resta somente

uma criança, o que dá apenas 1 escolha para a terceira posição.

Usando o princípio multiplicativo (e a paciência do pai), o número de ordenações

possíveis é:

3 x 2 x 1 = 6

E se fossem 6 crianças, quantas fotos teriam que ser tiradas para que houvesse uma

foto de cada ordenação possível das crianças? Em outras palavras, quantas permutações

existem para um conjuntos de 6 crianças?

Vamos novamente representar as 6 posições possíveis na foto por 6 espaços vazios:

____ ____ ____ ____ ____ ____

Para preencher a primeira posição temos 6 possibilidades. Uma vez escolhida a

criança que vai ficar na primeira posição, restam 5 crianças. Para a segunda posição temos

5 possibilidades. Escolhida a criança da segunda posição, ficam 4 crianças para escolher a

próxima posição, e assim por diante...

O número de permutações do conjunto de 6 crianças é:

6 x 5 x 4 x 3 x 2 x 1 = 720

Com este mesmo raciocínio, podemos deduzir o número de permutações de um

conjunto de n elementos. Cada permutação é uma ordenação deste conjunto. Temos n

espaços vazios e queremos saber de quantas maneiras podemos preenchê-los com os n

elementos do conjunto.

São n possibilidades para o primeiro espaço vazio, n - 1 possibilidades para o

segundo, n - 2 para o terceiro, e assim por diante até que, para o último espaço vazio, resta

apenas uma possibilidade.

Pelo princípio multiplicativo temos que o número total de permutações um conjunto

de n elementos é:

n(n-1)(n-2)...3.2.1 .

É interessante apresentar uma notação para o produto acima.

Para qualquer inteiro positivo n, definimos n!, que se lê "n fatorial", como o produto

n! = n(n-1)(n-2)...3.2.1

Definimos também:

0! = 1




51

O valor que escolhemos para 0! pode parecer um pouco arbitrário, mas simplifica

algumas fórmulas que veremos adiante.

Exemplo 1

0! = 1

1! = 1

2! = 2.1 = 2

3! = 3.2.1 = 6

4! = 4.3.2.1 = 24

5! = 5.4.3.2.1 = 120

Note que:

n! = n.(n-1)! = n.(n-1).(n-2)! = ... = n(n-1).(n-2) ...(n-r)!,

para qualquer inteiro r com 1 <= r <= n.

Quando temos fatoriais no numerador e no denominador de uma fração, podemos

simplificar a expressão sem ter que calcular todos os fatoriais, da seguinte forma:

).1)...(2)(1()!(

)!)(1)...(1(

)!(

!rnnnn

rn

rnrnnn

rn

n

Exemplo 2

15! = 15.14!

!12

!14 =

!12

!12.13.14 = 14.13

355.76

6.6.7

!3

5.6.7

!3!4

!4.5.6.7

!3!4

!7

Vamos a mais uma notação. Chamaremos de P(n) ao número de permutações de um

conjunto de n elementos.

O número de permutações de um conjunto de n elementos é: P(n) = n!




52

14. Arranjos

Em alguns problemas devemos determinar o número de maneiras de selecionar r

objetos, em certa ordem, dentro de um conjunto de n objetos distintos, onde n ≥ r.

Estes são chamados problemas de arranjo de n elementos, tomados r a r. Portanto, o

número de arranjos de n elementos, tomados r a r, é o número de maneiras de selecionar,

em ordem, r elementos de um conjunto de n elementos.

Devemos ressaltar que um problema é de arranjo se a ordem em que os r elementos

são selecionados é importante.

Portanto:

A(n,r) = )!(

!

rn

n

15. Combinação

Em outros problemas devemos determinar o número de maneiras de selecionar r

objetos, independentemente da ordem, dentro de um conjunto de n objetos distintos, onde n

≥ r.

Estes são chamados problemas de combinação de n elementos, tomados r a r.

Portanto, o número de combinações de n elementos, tomados r a r, é o número de maneiras

de selecionar r elementos de um conjunto de n elementos.

Devemos ressaltar que um problema é de combinação quando a ordem em que os r

elementos são selecionados não influencia o resultado.

Portanto:

C(n,r) = )!(!

!

rnr

n

16. Permutações com elementos repetidos

As permutações que estudamos até aqui envolviam conjuntos de objetos distintos.

Porém, alguns problemas de contagem envolvem permutações com objetos repetidos.

Vamos começar calculando quantas são as permutações das letras da palavra

ARARA.

Se passarmos um tempo tentando todas as reordenações possíveis das letras da

palavra ARARA, encontraremos as 10 palavras abaixo:




53

ARARA ARAAR ARRAA AAARR AARAR AARRA RARAA RAARA RAAAR

RRAAA.

Mas como poderíamos determinar que são 10 permutações, sem ter de listá-las?

Iniciaremos com uma palavra de 5 letras distintas, como em:

A1R1A2R2A3

onde A1, A2 e A3 simbolizam letras distintas nas posições dos A's e R1, R2 letras

distintas nas posições dos R's da palavra ARARA.

Como são 5 objetos distintos, temos 5! = 120 permutações. Vamos agora contar

estas 120 permutações de outra maneira. Seja x o número de permutações de ARARA.

Para cada posição dos A's e R's, temos 3! = 6 maneiras de distribuir os Ai's e 2! = 2

maneiras de distribuir R1 e R2 . Por exemplo, seja a permutação de ARARA dada por

RARAA. Então há 3! = 6 maneiras de colocar os Ai 's, que são:

RA1RA2A3 RA2RA1A3 RA3RA1A2

RA1RA3A2 RA2RA3A1 RA3RA2A1

Uma vez que escolho a posição dos Ai 's, por exemplo RA1RA2A3, tenho 2! = 2

maneiras de colocar R1 e R2, que são:

R1A1R2A2A3

R2A1R1A2A3

São x permutações da palavra ARARA, para cada uma delas 3! maneiras de colocar

os Ai's e 2! maneiras de colocar os Ri's. Pelo princípio multiplicativo, o número total de

permutações de A1R1A2R2A3 é :

x . 3! . 2!

Por outro lado, este número é simplesmente o número de permutações de 5 objetos

distintos, que é 5! = 120. Portanto,

x . 3! . 2! = 120

x = 102.6

120

!2!3

120

Vale, em geral, o seguinte:

Dados N objetos, de modo que

N1 são de certo tipo,

N2 são de um tipo diferente dos anteriores,

...




54

Nr são de um tipo diferente dos anteriores e

N = N1 + N2 + ... Nr,

Então, o número de permutações destes n objetos é dado pela fórmula:

!!...2!1

!

NrNN

N

INTRODUÇÃO À PROBABILIDADE

17. Experimentos probabilísticos

Considere o seguinte experimento: uma moeda é lançada de uma determinada

altura e o tempo necessário para que ela toque o chão é medido. Antes mesmo de realizar a

experiência, temos condições de conhecer a reposta, porque existe uma equação da Física

que fornece o tempo necessário para que um corpo, em queda livre, percorrer certa

distância.

Um fenômeno desse tipo é chamado de determinístico. Um experimento é

determinístico quando a sua realização tem resultado garantido, determinado por leis

físicas ou matemáticas, ou pelas próprias condições nas quais o experimento é executado.

Mais rigorosamente, trata-se de um fenômeno que pode ser descrito por um modelo

determinístico. Se o experimento é repetido, sob as mesmas condições, produz o mesmo

resultado.

Por outro lado, ao abandonarmos a moeda de uma certa altura e deixá-la cair sobre

uma superfície, não podemos afirmar qual face ficará voltada para cima quando ela parar:

se cara ou coroa. Sabemos que há somente essas duas possibilidades (descartamos a

possibilidade de a moeda cair “em pé”!), mas não temos como garantir qual delas ocorrerá.

Experimentos desse tipo são chamados probabilísticos ou aleatórios. Eles são o objeto de

estudo da área da Matemática chamada Teoria das Probabilidades. São fenômenos que

podem ser descritos por modelos probabilísticos. Os experimentos aleatórios não

produzem sempre o mesmo resultado, mas tem um comportamento estatisticamente

regular, no sentido de que, considerando um número grande de realizações, cada resultado

possível ocorre numa freqüência que pode ser avaliada. Assim, se lançarmos uma moeda

equilibrada, repetidamente, um grande número de vezes, nossa intuição e nossa experiência

nos levam a esperar que a quantidade de vezes de dar “cara” na face de cima será,

aproximadamente, igual à de dar “coroa”.

Esses aspectos de regularidade dos experimentos aleatórios, investigados e

analisados, permitem a construção de um modelo matemático e a atribuição, a cada

resultado possível, de um número que reflita a “chance de ocorrência” desse resultado. Por

exemplo, é comum ouvirmos uma frase como “há uma chance de 65% de chover amanhã”.

Mas o que isso quer dizer?

Quando nos referimos a algum experimento, devemos explicitar dois componentes:

a ação a ser executada e o resultado a ser observado. Explicando melhor: um experimento é




55

uma ação que pode ser repetida e um certo resultado que queremos observar. Por exemplo,

o experimento de jogar um dado (ação) e observar a face que cai voltada para cima

(resultado).

Observe que dois experimentos diferentes podem consistir da mesma ação, mas

com resultados observáveis diferentes. Por exemplo:

- experimento A: lançamos dois dados e observamos a maior das faces que caem

para cima;

- experimento B: lançamos dois dados e observamos a soma das faces que caem

para cima.

Os experimentos A e B são diferentes, embora a ação tenha sido a mesma (jogar

dois dados).

18. Espaço Amostral

O espaço amostral representa, na Teoria das Probabilidades, o mesmo papel que o

conjunto universo representa na Teoria dos Conjuntos. Portanto, o espaço amostral é o

conjunto de todos os resultados possíveis de um experimento aleatório. É representado pela

letra “S” e seu número de elementos por n(S).

Ex.:

No lançamento de uma moeda:

S = {cara, coroa}, n(S) = 2

No lançamento de um dado:

S = {1, 2, 3, 4, 5, 6}, n(S) = 6

Quando considerarmos um experimento composto de mais de uma ação, por

exemplo,

lançar um dado duas vezes e anotar o par resultante;

lançar um dado seguido de uma moeda e anotar o par obtido;

retirar duas cartas de um baralho de 52 cartas e observar os naipes etc.,

o princípio multiplicativo será muito útil no cálculo do número de elementos do

espaço amostral.

Ex.:

Quantos são os resultados possíveis na loteria esportiva?




56

A loteria esportiva é composta de 13 jogos. Para cada jogo, é claro, são possíveis

três resultados. Logo,

S = 3 x ...x 3 = 313

O lançamento de 3 dados possui 6 x 6 x 6 = 216 resultados possíveis.

19. Retirada com e sem reposição

Quando realizamos um experimento em que retiramos algo mais de uma vez,

devemos sempre observar se o objeto retirado é ou não reposto antes da próxima retirada.

Uma retirada com reposição é um experimento diferente de uma retirada sem reposição.

20. Evento

Evento de um experimento aleatório é qualquer subconjunto do espaço amostral

desse experimento.

21. Evento impossível

É um evento que nunca ocorre. E = { }.

22. Evento Elementar

É todo subconjunto unitário do espaço amostral de um experimento.

23. Evento certo

É um evento que sempre ocorre. E = S.

24. Combinação de Eventos

A partir de eventos podemos obter novos eventos, usando as operações de união,

interseção e diferença de conjuntos. Relembrando: sendo A e B dois eventos de um espaço

amostral S (isto é, A e B subconjuntos de S), temos:

AUB é o evento que ocorre se, e somente se, A ocorrer ou B ocorrer.

A∩B é o evento que ocorre se, e somente se, A ocorrer e B ocorrer.

A – B é o evento que ocorre se, e somente se, A ocorrer e B não ocorrer.

AC

ou A indica o evento complementar de A, ou seja, o evento que ocorre se, e

somente se, A não ocorrer.

Ex.:

Lançamos um dado e observamos o número que aparece em cima. O espaço

amostral desse experimento é S = {1, 2, 3, 4, 5, 6}. Consideremos os eventos:




57

A: “um número par ocorrer” A = {2, 4, 6}.

B: “um número ímpar ocorrer” B = {1, 3, 5}.

C: “um número primo ocorrer” C = {2, 3, 5}.

Então:

AUC = {2, 3, 4, 5, 6} é o evento “um número par ou um número primo ocorrerem”.

B∩C = {3, 5} é o evento “um número ímpar e primo ocorrerem”.

Cc = {1, 4, 6} é o evento “um número primo não ocorrerem”.

Ex.:

Lancemos uma moeda três vezes e observamos a seqüência de caras (K) e coroas

(C) que aparecem. O espaço amostral S consiste de oito elementos: S={KKK, KKC, KCK,

KCC, CKK, CKC, CCK, CCC}. Consideremos os eventos:

A: “duas ou mais coroas aparecem consecutivamente” A = {CCC, KCC, CCK}.

B: “todos os lançamentos apresentam resultados iguais” B = {KKK, CCC}.

Então:

A∩B = {CCC} é o evento elementar em que somente coroas aparecem.

25. Probabilidade de um Evento Elementar

Considere um experimento aleatório cujo espaço amostral é S = {e1, e2, e3,..., en}.

A probabilidade de ocorrência de cada evento elementar {ek}, 1 ≤ k ≤ n, desse

experimento é um número real Pk que satisfaz as condições:

1ª) Pk 0 , para todo k pertencente a {1, 2,...,n};

2ª)

11

nk

k

kP

, isto é, P1 + P2 + P3 + ... + Pn = 1 (a soma das probabilidades de

todos os eventos elementares é igual a 1).

Ex.:

Através de estudos genéticos uma gestante descobriu que a probabilidade de seu

filho nascer com olhos escuros é o triplo da probabilidade dele nascer com olhos claros,

independente do sexo. Qual a probabilidade da gestante ter uma criança de olhos escuros?

O espaço amostral é composto de apenas dois eventos elementares:

S = {olhos escuros, olhos claros}.

Os eventos são:

E1 = {olhos escuros}




58

E2 = {olhos claros}

Como a probabilidade de ocorrer E1 é o triplo da probabilidade de ocorrer E2, tem-

se:

P(E2) = x → P(E1) = 3x

P(E1) + P(E2) = 1

3x + x = 1 → x = ¼

Como P(E1) = 3x → P(E1) = ¾

A probabilidade de a criança ter os olhos escuros é de ¾ ou 75%.

PROBABILIDADE 26. Conceito

É a chance de um evento ocorrer quando o espaço amostral tem resultado

igualmente provável (lançamento de moeda, lançamento de dados, extração de cartas de

um baralho etc.).

NpossíveisresultadosdenresultadocadaP

1

º

1)(

É necessário identificar primeiro o número de resultados “favoráveis” e em seguida

dividi-lo pelo total de casos possíveis no espaço amostral. Em outras palavras, a

probabilidade de um evento A ocorrer é:

possíveisresultadosden

AeventoaofavoráveisresultadosdenAP

º

º)( =

)(

)(

Sn

An, 0 ≤ P(A) ≤ 1

Ex.:

Se cada carta de um baralho de 52 cartas tem a mesma chance de ser

escolhida, então a probabilidade de se extrair cada uma delas é de 1/52: P(A)

= 1 carta / 52 cartas = 1/52

O lançamento de uma moeda tem dois resultados possíveis: cara ou coroa.

Se os dois resultados são igualmente prováveis, então a probabilidade de sair

cara é P(cara) = ½ e a probabilidade de sair coroa é P(coroa) = ½.

Determinar a probabilidade de extrair uma das quatro damas de um baralho

de 52 cartas ou a de obter um número menor que 4 num lance de dado. A

probabilidade da extração de uma dama é P(dama) = cartas

damas

52

4 =

52

4=

13

1

Um dado não viciado é lançado. Qual a probabilidade de ocorrer:




59

a) Um número primo (evento A)?

A = {2,3,5}

Logo: P(A) = P(2) + P(3) + P(5) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2

b) Um quadrado perfeito (evento B)?

B = {1,4}

Logo: P(B) = P(1) + P(4) = 1/6 +1/6 = 2/6 = 1/3

Uma moeda é lançada duas vezes seguidas. Qual a probabilidade de se obter

cara em pelo menos um desses lançamentos?

S = {(K, K),(K, C),(C, K),(C, C)} n(S) = 4

A = {(K, K),(K, C),(C, K)} n(A) = 3

Portanto, P(A) = )(

)(

Sn

An

4

3

Uma caixa contém 5 bolas vermelhas, 3 bolas brancas e 4 bolas pretas.

Sorteando-se uma das bolas ao acaso, qual é a probabilidade dela ser:

a) branca (evento A)?

b) preta (evento B)?

O experimento tem 12 resultados possíveis, ou seja, n(S) = 12.

Como há 3 bolas brancas na caixa, há 3 casos favoráveis à ocorrência do

evento A, isto é, n(A) = 3. Portanto, P(A) = 4

1

12

3.

Como há 4 casos favoráveis à ocorrência de B, ou seja, n(B) = 4, temos:

P(B) =3

1

12

4.

27. Probabilidade da União de Eventos (regra da adição)

Sejam A e B eventos associados ao espaço amostral S de um experimento

aleatório. Como eventos são conjuntos, temos que:

n(AUB) = n(A) + n(B) - n(A∩B) (1) Dividindo (1) por n(S), temos:

)(

)(

)(

)(

)(

)(

)(

)(

Sn

BAn

Sn

Bn

Sn

An

Sn

BAn




60

Logo:

)()()()( BAPBPAPBAP

Ex.:

Uma urna contém 20 bolas numeradas de 1 a 20. Sorteando-se uma das bolas, qual

é a probabilidade de sair um número par ou um múltiplo de 3?

S = {1,2,3,...,18,19,20}. Portanto, n(S) = 20.

Se A é o evento “sair um número par”, então A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20}

e n(A) = 10.

Se B é o evento: “sair um múltiplo de 3”, então B = {3, 6, 9, 12, 15, 18} e n(B) = 6.

Ocorrer o evento A ou o evento B significa ocorrer qualquer um dos elementos que

figuram em qualquer um dos conjuntos A e B, ou seja, ocorrer o evento AUB.

De (1) temos n(AUB) = n(A) + n(B) - n(A∩B) = 10 + 6 - 3 = 13.

Como n(S) = 20, concluímos que 20

13

)(

)()(

Sn

BAnBAP .

28. Probabilidade de Não Ocorrer um Evento

Seja A um evento associado ao espaço amostral S de um experimento aleatório. O

evento complementar de A é indicado Ac, e indica a não ocorrência de A.

Ex.:

Um dado é lançado. Considerando o evento A = “obter um quadrado perfeito”,

então A = {1,4} e n(A) = 2. Portanto 6,5,3,2cA e 4)( cAn .

Nota-se que A e Ac são mutuamente exclusivos, ou seja, se um evento ocorre o

outro não ocorre. Portanto, SAA c . De fato cAA {1,2,3,4,5,6}.

Além disso, 1)()( SPAAP c, isto é, 1)()()( cc AAPAPAP . Mas

como 0)( cAAP , já que A e Ac são mutuamente exclusivos, concluímos que

)(1)(1)()( APAPAPAP cc.

Como n(S) = 6, n(A) = 2 e n(B) = 4, temos 3

1

6

2)(AP ,

3

2

6

4)( cAP . Logo,

13

2

3

1)()( cAPAP




61

29. Produto de Probabilidades (regra da multiplicação)

Duas cartas serão retiradas de um baralho comum uma após a outra sem reposição

da primeira. Qual é a probabilidade de se obterem duas cartas de paus?

1º) Indiquemos estes dois eventos: A: a 1a carta é de paus e B: a 2a carta é de paus.

2º) Obter “duas cartas de paus” significa ocorrer A e ocorrer B, isto é, calcular a

probabilidade de ocorrer A∩B. Para tanto, vamos aplicar a relação P(A∩B) = P(A) x

P(B/A).

3º) 1a retirada: P(A) = 13/52.

4º) Vamos calcular P(B/A), a probabilidade de que a 2a carta seja de paus supondo

que a 1a carta é de paus. Ora, se por suposição a 1a carta é de paus, como não há reposição

da mesma, restaram 51 cartas no baralho, das quais 12 são de paus. Assim: P(B/A) =

12/51.

Portanto, P(A∩B) = P(A) x P(B/A) = 1/17.

30. Variável Aleatória

Os resultados de um experimento aleatório podem ser numéricos ou não.

Experimentos como:

anotar os tempos em uma maratona,

medir a taxa de precipitação pluviométrica durante um período,

lançar uma moeda três vezes e anotar a quantidade de coroas que ocorrem,

têm seus espaços amostrais constituídos de números. Muitos experimentos, porém,

possuem resultados qualitativos (e não quantitativos). Por exemplo:

entrevistar um eleitor, antes de uma eleição, para conhecer sua preferência,

inspecionar uma lâmpada para verificar se é ou não defeituosa,

lançar uma moeda e observar se dá cara ou coroa.

Podemos, então, classificar os resultados de um experimento como quantitativos ou

qualitativos. Os estatísticos trabalham com os dois tipos, embora os quantitativos sejam

mais comuns.

Em certos casos, é possível converter dados qualitativos em quantitativos,

associando um valor numérico a cada resultado.

Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um

número. Fica, então, definida uma função chamada variável aleatória.

Muitas vezes não estamos interessados propriamente no resultado de um

experimento aleatório, mas em alguma característica numérica a ele associada.




62

Assim, se o espaço amostral relativo ao "lançamento simultâneo de duas moedas" é

S = {(ca, ca), (ca, co), (co, ca), (co, co)} e se x representa o "número de caras" que

aparecem, a cada ponto amostral podemos associar um número para x, de acordo com a

tabela abaixo (x é a variável aleatória associada ao número de caras observado):

Ponto Amostral x

(ca, ca) 2

(ca, co) 1

(co, ca) 1

(co, co) 0

Da mesma maneira podemos associar o experimento “retirada de uma lâmpada de

um lote e observar se é (sim) ou não (não) defeituosa”. Espaço amostral S = {sim, não}e o

resultado numérico que podemos definir é contar o número de lâmpadas defeituosas, isto é:

Ponto amostral x

sim 1

não 0

Temos, então, a seguinte definição:

Variável aleatória é uma função numérica definida em um espaço amostral.

31. Valor esperado de uma variável aleatória

Suponha que lancemos um dado equilibrado 300 vezes e anotemos o resultado da

face de cima. Queremos determinar a média dos valores observados.

Como os resultados possíveis são equiprováveis, é de se esperar que cada um ocorra

uma quantidade de vezes próximo de 50 (já que são 300 lançamentos e 6 resultados

possíveis). A média dos valores deve ser então, um valor próximo de:

Média = 5,3300

506505504503502501 xxxxxx

Note que:

Média = (1x1/6)+(2x1/6)+(3x1/6)+(4x1/6)+(5x1/6)+(6x1/6)




63

A somatória dos produtos de cada resultado (numérico) do experimento pela sua

probabilidade de ocorrência fornece um valor médio da variável aleatória. Esse valor é

chamado valor esperado ou esperança matemática ou ainda média da variável aleatória.

Seja x uma variável aleatória que assume os valores x1, ...xn, com probabilidades pi

= P (X = xi), i = 1, ..., n. O valor esperado da variável aleatória X, representado por E(X), é

dado por:

E(X) = x1.p1 + ... + xn.pn

32. Distribuição de probabilidade

Dado certo experimento aleatório, podemos interpretar os valores assumidos por

uma variável aleatória como eventos numéricos associados àquele experimento. Vamos

deixar isso mais claro, observando o exemplo abaixo.

Exemplo prático de uma distribuição de probabilidade:

Consideremos a distribuição de freqüências relativa ao número de acidentes diários

na Rodovia do Sol durante o mês de nov/97:

Número de Acidentes Frequência

0 22

1 5

2 2

3 1

Podemos então escrever a tabela de distribuição de probabilidade:

Número de Acidentes (x) Probabilidade (x)

0 0,73

1 0,17

2 0,07

3 0,03

Total 1,00

Construímos acima uma tabela onde aparecem os valores de uma variável aleatória

x e as probabilidades de x ocorrer que é a tabela de distribuição de probabilidades.

Ao definir a distribuição de probabilidade, estabelecemos uma correspondência

unívoca entre os valores da variável aleatória x e os valores da variável P (probabilidade).




64

Esta correspondência define uma função onde os valores xi formam o domínio da função e

os valores pi o seu conjunto imagem.

Assim, ao lançarmos um dado, a variável aleatória x, definida por "pontos de um

dado", pode tomar os valores 1, 2, 3, 4, 5 e 6. Então resulta a seguinte distribuição de

probabilidade:

x P (x)

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

T o t a l 6/6 = 1

Da mesma maneira, quando lançamos duas moedas e estamos interessados em

contar o número de caras, podemos, então, definir a variável aleatória:

S x

(C, C) 0

(C, K) 1

(K, C) 1

(K, K) 2

Para cada valor de x, identificamos os resultados do experimento que lhe são

associados:

Evento numérico Eventos

associados

X = 0 {(C, C)}

X = 1 {(C, K), (K, C)}

X = 2 {(K, K)}

Sendo S = {(K, K), (K, C), (C, K), (C, C)} equiprovável, cada resultado tem

probabilidade de ¼. Podemos determinar a probabilidade de ocorrência de cada evento

numérico, a partir das probabilidades dos eventos experimento:

P(X = 0) = P{(C, C)} = ¼

P(X = 1) = P{(C, K), (K, C)} = ½

P(X = 2) = P{(K, K)} = ¼




65

e construir a tabela:

x P

0 ¼

1 2/4

2 1/4

Note que essa tabela, na qual anotamos x e suas respectivas probabilidades,

caracteriza uma função que a cada valor de x associa um número real do intervalo [0, 1].

Esta função é denominada distribuição de probabilidade da variável aleatória x.

33. Resumo das principais fórmulas das probabilidades.

1. Avaliação da probabilidade de um evento.

...

...)(

CTN

eventoXFCNXP

2. Avaliação da probabilidade do evento certo (S) e do evento impossível.

1)(SP ; 0)(P

3. Regra da Soma.

Se A e B são mutuamente exclusivos, temos:

)()()( BPAPBAP

Se A e B não são mutuamente exclusivos, temos:

)()()()( BAPBPAPBAP

4. Eventos complementares.

)(1)( APAP , onde A é o complemento de A.

5. Avaliação da probabilidade condicional.

FeventoBCN

BFeventoACNBAP

..

..)/(

6. Regra do Produto.

Se A e B não são independentes, temos:




66

)/().()( ABPAPBAP ou )/().()( BAPBPBAP

Se A e B são independentes, temos:

)().()( BPAPBAP

DISTRIBUIÇÕES DISCRETAS

34. Distribuição Binomial

Vamos imaginar fenômenos cujos resultados só podem ser de dois tipos, um dos

quais é considerado como sucesso e o outro insucesso. Este fenômeno pode ser repetido

tantas vezes quanto se queira (n vezes), nas mesmas condições. As provas repetidas devem

ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas.

No decorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q = 1 -

p) do insucesso manter-se-ão constantes. Nessas condições X é uma variável aleatória

discreta que segue uma distribuição binomial.

34.1. Cálculo das probabilidades

P(x) = xnx

xn qpC ..,

Onde:

P(x) = é a probabilidade de que o evento se realize x vezes em n provas.

p = é a probabilidade de que o evento se realize em uma só prova = sucesso.

q = é a probabilidade de que o evento não se realize no decurso dessa prova =

insucesso.

n = número de tentativas.

x = número de sucessos

OBS: O nome binomial é devido à fórmula, pois representa o termo geral do

desenvolvimento do binômio de Newton.

34.2. Esperança matemática

E(x) = n.p

34.3. Variância

S qpn ..2




67

34.4. Desvio padrão

S = qpn ..

35. Distribuição de Bernoulli

É um caso particular da distribuição binomial. Com ela é possível calcular as

probabilidades associadas a uma única tentativa do experimento. Neste caso, só há duas

possibilidades: ou fracasso (aí se atribui “0” à variável aleatória) ou sucesso (quando se

atribui “1” à variável aleatória).


A fórmula adequada a este tipo de distribuição é:

P(x) = p xx p 1)1(


E(x) = p

35.3. Variância

S qp.2


S = qp.

36. Distribuição de Poisson

Descreve as probabilidades de certo número de ocorrências num dado

intervalo, espaço ou campo contínuo (tempo, comprimento, área, volume, peso

etc.). Determina, por exemplo, a probabilidade da ocorrência de certo número de

chamadas telefônicas por minuto, de clientes por hora, de acidentes por dia, de

defeitos por m2

de tecido, de pés de café por alqueire e lactobacilos por ml de

leite.

A distribuição de Poisson lida com a variável discreta inserida num espaço

contínuo (não confundir com variável contínua).

A distribuição de Poisson está baseada nas seguintes hipóteses:




68

o experimento é constituído de eventos independentes;

só há um resultado possível: ocorrência do eventos;

a probabilidade de ocorrência do evento é constante em todo o

intervalo;

a probabilidade de mais de uma ocorrência num mesmo ponto é

zero.

Nos experimentos típicos da distribuição de Poisson não é possível aplicar a

definição de probabilidade pela simples razão de que não é possível contar as não-

ocorrências dos eventos. Neles, só as ocorrências são passíveis de medidas.

Para determinar a probabilidade de ocorrência de qualquer resultado num

experimento ao qual se aplique a distribuição de Poisson basta conhecer a sua

média – que por si só caracteriza a distribuição.


A fórmula que calcula as probabilidades numa distribuição de Poisson é:

!

)()(

x

texP

xt

Onde:

X = número de ocorrências

E = 2,71828; base dos logaritmos neperianos

Λ = taxa média de ocorrências dos eventos por unidade de medida

T = espaço de medida ou número de intervalos ou unidades


E(x) = λ

36.3. Variância

S 2


S =

37. Distribuição Hipergeométrica

Distribuição aplicável quando os eventos são dependentes entre si, mas o espaço

amostral varia de um experimento para o outro.




69


A fórmula adequada a este tipo de distribuição é:

nN

xrxnrN

C

CCxP

,

,)(),( .)(

Onde:

N = tamanho da população

n = tamanho da amostra

r número de sucessos na população

x número de sucessos na amostra


E(x) = np

37.3. Variância

S )1/()(2 NnNnpq


S = )1/()( NnNnpq

Obs.: em ambos os casos p = r/N e q = 1-p

38. Aproximação da Binomial por Poisson

A distribuição de Poisson pode ser utilizada para estimar probabilidades binomiais.

Para tanto, deve-se:

Determinar a média da distribuição binomial; μ = np

Considerar a média binomial como média de Poisson;

Aplicar a fórmula de Poisson.

DISTRIBUIÇÃO CONTÍNUA

39. Distribuição Normal

Entre as distribuições teóricas de variável aleatória contínua, uma das mais

empregadas é a distribuição Normal.




70

Muitas das variáveis analisadas na pesquisa sócio-econômica correspondem à

distribuição normal ou dela se aproximam.

Propriedades da distribuição normal:

A variável aleatória X pode assumir todo e qualquer valor real.

A representação gráfica da distribuição normal é uma curva em forma de

sino, simétrica em torno da média, que recebe o nome de curva normal ou de

Gauss.

A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que

essa área corresponde à probabilidade de a variável aleatória X assumir

qualquer valor real.

A curva normal é assintótica em relação ao eixo das abscissas, isto é,

aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-

lo.

Como a curva é simétrica em torno da média, a probabilidade de ocorrer

valor maior que a média é igual à probabilidade de ocorrer valor menor do

que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada

metade da curva representa 50% de probabilidade.

Quando temos em mãos uma variável aleatória com distribuição normal, nosso

principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em

um determinado intervalo. Vejamos com proceder, por meio de um exemplo concreto.

Exemplo:

Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos

por certa máquina. Vamos supor que essa variável tenha distribuição normal com média =

2 cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com

valor entre 2 e 2,05 cm?

P ( 2 < X < 2,05) = ?

Com o auxílio de uma distribuição normal reduzida (padronizada), isto é, uma

distribuição normal de média = 0 e desvio padrão = 1. Resolveremos o problema através da

variável z, onde S

xz

)(.

Utilizaremos também uma tabela normal reduzida, que nos dá a probabilidade de z

tomar qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z).

Temos, então, que se X é uma variável aleatória com distribuição normal de média

e desvio padrão S, podemos escrever: )0()( zZPxXP .

No nosso problema queremos calcular P(2 < X < 2,05). Para obter essa

probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x =

2,05.

z = (2,05 - 2) / 0,04 = 1,25




71

Utilização da Tabela Z

Procuremos, agora, na tabela Z o valor de z = 1,25.

Na primeira coluna encontramos o valor até uma casa decimal = 1,2. Em seguida,

encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número

1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que

nos permite escrever:

P (0 < Z < 1,25) = 0,3944 ou 39,44 %.

Assim, a probabilidade de um certo parafuso apresentar um diâmetro entre a média

= 2cm e x = 2,05 cm é de 39,44 %.

40. Aproximação da Binomial pela Normal

A distribuição Binomial também pode ser aproximada pela normal. Neste caso, a

precisão da aproximação vai melhorando quando a média e a variância da distribuição

forem superiores a 5, atingindo um nível ótimo quando a probabilidade de ocorrência do

evento está próxima de 50%. Na aproximação, em razão do fato de a distribuição efetiva

ser discreta e a utilizada na estimativa das probabilidades ser contínua, deve-se aplicar a

chamada “correção de continuidade”, que consiste em calcular a probabilidade dentro de

certo intervalo e não em um ponto.

O procedimento para a aproximação da Binomial pela Normal é:

Calcular a média e o desvio-padrão da distribuição;

Transformar os valores efetivos em relativos (escala z);

Compor as probabilidades segundo os dados fornecidos;

Ler os valores nas tabelas e efetuar as somas ou diferenças exigidas.

livro estatistica basica

Economy & Finance