apostila estatistica
TRANSCRIPT
Estatística
Cursos: Engenharia Civil
UMC – Villa Lobos
Prof. Fábio Conte Correia
São Paulo 2011
Sumário
1 O que é estatística ................................................................................................... 3
1.1 Definições: .......................................................................................................... 3
1.2 Métodos Científicos ............................................................................................ 4
1.3 População e Amostra ......................................................................................... 5
1.4 Amostragem ....................................................................................................... 5
1.4.1 Variáveis ..................................................................................................... 6
2 Tabelas .................................................................................................................... 7
2.1 Séries estatísticas ............................................................................................... 8
2.1.1 Séries históricas, cronológicas, temporais ou marchas .............................. 8
2.1.2 Séries geográficas, espaciais, territoriais ou de localização ....................... 8
2.1.3 Séries específicas ou categóricas ............................................................... 9
2.1.4 Séries conjugadas – Tabela de dupla entrada ............................................ 9
2.1.5 Distribuição de freqüência ......................................................................... 10
3 Distribuição de freqüência ..................................................................................... 11
3.1 Tabela primitiva ou dados brutos ...................................................................... 11
3.2 ROL .................................................................................................................. 11
3.3 Distribuição de freqüência sem intervalo de classes ........................................ 11
3.4 Distribuição de freqüência com intervalo de classes ........................................ 12
3.4.1 Elementos de uma distribuição de frequências com intervalos de classe . 13
3.4.1.1 Etapas: Distribuição de Freqüências c/ classe .................................... 14
3.5 Gráficos ............................................................................................................ 15
3.5.1 Histogramas .............................................................................................. 15
3.5.2 Polígonos de freqüências .......................................................................... 16
3.5.3 Polígonos de freqüência acumulada ou ogivas ......................................... 17
4 Medidas posição .................................................................................................... 18
4.1 Medidas de tendência central para dados não agrupados ............................... 18
4.1.1 Média Aritmética Simples .......................................................................... 18
4.1.2 Moda ......................................................................................................... 19
4.1.3 Mediana .................................................................................................... 19
4.2 Medidas de tendência central para dados agrupados ...................................... 20
4.2.1 Média Aritmética Ponderada ..................................................................... 20
4.2.1.1 Sem intervalo de classes ..................................................................... 20
1
4.2.1.2 Com intervalo de classes ..................................................................... 20
4.2.2 Moda ......................................................................................................... 22
4.2.2.1 Sem intervalo de classes ..................................................................... 22
4.2.2.2 Com intervalo de classes ..................................................................... 22
4.2.3 Mediana .................................................................................................... 23
4.2.3.1 Sem intervalo de classes ..................................................................... 23
4.2.3.2 Com intervalo de classes ..................................................................... 23
4.3 Relação entre a média, a mediana e a moda ................................................... 25
4.4 Exercícios. ........................................................................................................ 26
4.5 Separatrizes...................................................................................................... 29
4.5.1 Quartis, Decis e Percentis ......................................................................... 29
4.5.1.1 Calculo para dados não agrupados ..................................................... 29
4.5.1.2 Cálculo para dados agrupados ............................................................ 30
5 Mediadas de dispersão ou de variabilidade ........................................................... 32
5.1 Amplitude Total ................................................................................................. 32
5.2 Variância e desvio padrão ................................................................................ 33
5.2.1 Dados não agrupados ............................................................................... 34
5.2.2 Dados agrupados sem intervalo de classes .............................................. 35
5.2.3 Dados agrupados com intervalo de classes .............................................. 35
5.3 Coeficiente de variação .................................................................................... 36
6 Correlação e Regressão ........................................................................................ 39
6.1 Correlação linear entre duas variáveis ............................................................. 39
6.1.1 Coeficiente de correlação linear ................................................................ 41
6.2 Regressão Linear ............................................................................................. 44
7 Fatorial ....................................................................... Erro! Indicador não definido.
7.1 Números Binomiais ........................................................................................... 53
8 Probabilidade ......................................................................................................... 54
8.1 Experimentos ou fenômenos aleatórios ............................................................ 54
8.2 Espaço amostral ............................................................................................... 54
8.3 Eventos ............................................................................................................. 55
8.4 Função Probabilidade ....................................................................................... 55
8.5 Eventos complementares ................................................................................. 56
8.6 Eventos independentes .................................................................................... 56
2
8.7 Eventos mutuamente exclusivos ...................................................................... 57
8.8 Exercícios ......................................................................................................... 57
9 Distribuição Binomial ............................................................................................. 60
3
1 O que é estatística
1. É a ciência da tomada de decisão perante incertezas;
2. Coleta, análise e interpretação de dados;
3. É um “kit” de ferramentas que ajuda a resolver problemas;
4. Base para a maior parte das decisões tomadas quanto ao controle de qualidade,
assim como em quase todas as outras áreas da atividade humana moderna.
Vista dessa forma, a Estatística não deve ser confundida como uma disciplina
isolada, e sim, compreendida como uma ferramenta ou conjunto de ferramentas,
disponível para a solução de problemas em diversas áreas do conhecimento.
1.1 Definições:
Processo: é qualquer combinação específica de máquinas, ferramentas,
métodos, materiais e/ou pessoas empregadas para atingir qualidades
específicas num produto ou serviço. Estas qualidades são chamadas de
“características de qualidade”.
Controle: é o ciclo de feedback (realimentação) através da qual medimos o
desempenho real, comparando-o com o padrão, e agimos sobre a diferença.
Controle Estatístico do processo (CEP): aplicação de técnicas estatísticas para
medir e analisar a variação nos processos.
Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para
medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de
diagnósticos, planos de amostragem e outras técnicas estatísticas.
Estatística Descritiva: sua função é observar fenômenos de mesma natureza, coletar
dados numéricos referente a esses fenômenos, organizar e classificar esses dados
observados, além da sua apresentação por meio de tabelas, diagramas e gráficos.
Etapas básicas:
Definição do problema;
Planejamento;
Coleta de dados;
Apuração dos dados;
4
Apresentação dos dados;
Análise e interpretação dos dados.
Estatística Indutiva: é um processo de generalização a partir de resultados obtidos
particulares, isto é, a inferência de propriedades para o todo com base na parte do
particular. O processo de generalização que é característico do método indutivo está
associado a uma margem de erro e para minimizar este grau de incerteza a teoria de
probabilidades será fundamental para o desenvolvimento da estatística aplicada.
Estatística nas empresas
Neste mundo globalizado, a empresa é uma das vigas mestras da Economia dos
povos e a Estatística tem colaborado com os gerentes porque permitem a construção
de ferramentas que dão oportunidades a tomada de decisões e estimativas, e ainda,
facilitam o tríplice trabalho do Administrador de organizar, dirigir e controlar a empresa.
Aplicação na Engenharia e na Administração
Uma firma que está se preparando para lançar um novo produto precisa
conhecer as preferências do consumidor no mercado de interesse. Deve-se fazer
pesquisa de mercado entrevistando um número de residências escolhidas
aleatoriamente. Assim, os resultados podem ser usados para estimar as preferências
da população.
É possível que em uma comunidade, o consumo de sorvete dependa do:
- preço do produto;
- renda média local;
- número de crianças na comunidade;
- temperatura média;
Através da análise de regressão podem-se determinar quais fatores têm efeitos
mais importantes.
1.2 Métodos Científicos
Método é um conjunto de meios dispostos convenientemente para se chegar a
um fim que se deseja.
5
• Método Experimental: consiste em manter constantes todas as causas (fatores),
menos uma, e variar esta causa de modo que o pesquisador possa descobrir
seus efeitos, caso existam.
• Método Estatístico: Admite todas essas causas presentes variando-as,
registrando essas variações e procurando determinar, no resultado final, que
influências cabem a cada uma delas.
1.3 População e Amostra
Ao conjunto de entes portadores de, pelo menos, uma característica comum
denominamos população estatística, universo estatístico ou simplesmente
POPULAÇÃO.
Como em qualquer estudo estatístico, temos em mente pesquisar uma ou mais
características dos elementos de alguma população, esta característica deve estar
perfeitamente definida. Isso possibilita que afirmemos, sem ambiguidade, se um
elemento pertence ou não à população.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou
temporal, limitamos as observações referentes a uma determinada pesquisa a apenas
uma parte da população. A essa parte proveniente da população em estudo
denominamos amostra.
Uma amostra é um subconjunto finito de uma população.
Para as inferências serem corretas, é necessário garantir que a amostra seja
representativa da população, isto é, a amostra deve possuir as mesmas características
básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.
1.4 Amostragem
A amostragem é uma técnica especial, que garante, tanto quanto possível o
acaso da escolha da amostra.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser
escolhido, o que garante à amostra caráter de representatividade.
Amostragem casual ou aleatória simples
6
Esse tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem casual ou aleatória simples pode ser realizada
enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo
aleatório qualquer, k números dessa seqüência, os quais corresponderão aos
elementos pertencentes à amostra.
Amostragem proporcional estratificada
Muitas vezes a população se divide em subpopulações -- estratos.
Como é possível que a variável em estudo apresente, de estrato em estrato, um
comportamento heterogêneo e, dentro de cada estrato, um comportamento
homogêneo, convém que o sorteio dos elementos da amostra leve em consideração
tais estratos.
Amostragem sistemática
Quando os elementos da população já se acham ordenados, não há
necessidade de construir o sistema de referência. São exemplos os prontuários
médicos de um hospital, os prédios de uma rua, etc...
Nesses casos, a seleção dos elementos que constituirão a amostra pode ser
feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos sistemática.
1.4.1 Variáveis
Variável é convencionalmente, o conjunto de resultados possíveis de um
fenômeno e cada fenômeno corresponde um número de resultados possíveis.
Alguns exemplos:
Para o fenômeno “sexo”, são dois o resultados possíveis: sexo masculino e sexo
feminino;
Para o fenômeno “número de filhos” há um número de resultados possíveis
expresso através dos números naturais: 0, 1, 2, 3, ..., n.
7
Uma variável pode ser:
Qualitativa são as características que não possuem valores quantitativos, mas,
ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos.
Nominal quando seus valores são expressos por atributos: sexo, cor
da pele, etc.
Ordinal existe uma ordenação entre as categorias. Ex: escolaridade
(1º, 2º, 3º graus), estágio da obra (inicial, intermediário, terminal), mês de
observação (janeiro, fevereiro...).
Quantitativas – são as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos.
Contínua características mensuráveis que assumem valores em uma
escala contínua (na reta real), para as quais valores fracionais.
Usualmente devem ser medidas através de algum instrumento.
Exemplos: peso (balança), altura (régua), tempo (relógio), pressão
arterial, idade
Discreta características mensuráveis que podem assumir apenas um
número finito ou infinito contável de valores e, assim, somente valores
inteiros. Geralmente é o resultado de contagens. Exemplos: número de
filhos, número de pilares, vigas, número de cigarros fumados por dia.
De modo geral, as medições dão origem a variáveis contínuas e as contagens
ou enumerações dão origem a variáveis discretas.
2 Tabelas
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais
variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou
dessas variáveis.
Tabela é um quadro que resume um conjunto de observações.
8
2.1 Séries estatísticas
Denominamos série estatística toda tabela que apresenta a distribuição de um
conjunto de dados estatísticos em função da época, do local ou da espécie.
Daí, podemos inferir que numa série estatística observamos a existência de três
elementos ou fatores: o tempo, o espaço e a espécie.
2.1.1 Séries históricas, cronológicas, temporais ou marchas
Descrevem os valores da variável, em determinado local, discriminados segundo
intervalos de tempo variáveis. Exemplo:
2.1.2 Séries geográficas, espaciais, territoriais ou de localização
Descrevem os valores da variável, em determinado instante, discriminados
segundo regiões. Exemplo:
9
2.1.3 Séries específicas ou categóricas
Descrevem os valores da variável, em determinado tempo e local, discriminados
segundo especificações ou categorias. Exemplo:
2.1.4 Séries conjugadas – Tabela de dupla entrada
Muitas vezes temos necessidade de apresentar em uma única tabela, a variação
de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais
séries.
10
Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla
entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma
horizontal (linha) e uma vertical (coluna). Exemplo:
2.1.5 Distribuição de freqüência
Por se tratar de um conceito estatístico de suma importância, merecerá um
tratamento especial. Exemplo:
11
3 Distribuição de freqüência
Quando da análise de dados, é comum procurar conferir certa ordem aos
números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de
divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes
a cada classe. É um tipo de tabela que condensa uma coleção de dados conforme as
freqüências (repetições de seus valores).
3.1 Tabela primitiva ou dados brutos
É uma tabela ou relação de elementos que não foram numericamente
organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um
todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
3.2 ROL
É a tabela obtida após a ordenação dos dados (crescente ou decrescente).
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
3.3 Distribuição de freqüência sem intervalo de classes
É a simples condensação dos dados conforme as repetições de seus valores.
Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já
que exige muito espaço. Veja exemplo abaixo:
Ex1. Um dado foi lançado 15 vezes, obtendo-se os seguintes pontos: 2, 5, 6, 6,
1, 4, 2, 6, 5, 1, 3, 3, 2, 4, 6. Construa uma tabela de distribuição de freqüências
absolutas, acumuladas e relativas.
Dados (xi)
Frequência absoluta
(fi)
Freq. absoluta acumulada
(fac)
Freq. Relativa (fr)%
Freq. Relativa acumulada
(fr ac)%
1 2 2 13,33% 13,33% 2 3 5 20,00% 33,33% 3 2 7 13,33% 46,66% 4 2 9 13,33% 59,99% 5 2 11 13,33% 73,32% 6 4 15 26,68% 100%
Total 15
100%
12
Frequência absoluta Número de vezes que a variável xi se repete
Frequência absoluta acumulada É a frequência atual somada às frequências
anteriores
Frequência Relativa É a relação entre a frequência absoluta e o numero de
elementos da população estatística.
Ex2. Um condomínio possui 25 apartamentos, sendo que esses apartamentos
possuem áreas (m2) diferentes. Seguem os valores das áreas dos apartamentos: 50,
65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60, 70, 50, 50, 59, 53, 65, 68, 50, 53,
75. Construa uma tabela de distribuição de freqüências absolutas, acumuladas e
relativas.
xi fi fac fr fr% fr ac fr ac%
50 5 5 0,20 20% 0,20 20%
53 4 9 0,16 16% 0,36 36%
59 3 12 0,12 12% 0,48 48%
60 2 14 0,08 8% 0,56 56%
62 1 15 0,04 4% 0,60 60%
65 3 18 0,12 12% 0,72 72%
68 2 20 0,08 8% 0,80 80%
70 2 22 0,08 8% 0,88 88%
72 1 23 0,04 4% 0,92 92%
75 2 25 0,08 8% 1,00 100%
Total 25
1,00 100%
3.4 Distribuição de freqüência com intervalo de classes
Quando o tamanho da amostra é elevado, é mais racional efetuar o
agrupamento dos valores em vários intervalos de classe.
Ex3. O tempo de cura em minutos de um determinado cimento foi de 45, 41, 42,
41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51, construa a tabela de
distribuição de frequências.
13
Dados (xi)
Frequência absoluta
(fi)
Freq. absoluta acumulada
(fac)
Freq. Relativa (fr)%
Freq. Relativa acumulada
(fr)% 41 3 3 15% 15% 42 2 5 10% 25% 43 1 6 5% 30% 44 1 7 5% 35% 45 1 8 5% 40% 46 2 10 10% 50% 50 2 12 10% 60% 51 1 13 5% 65% 52 1 14 5% 70% 54 1 15 5% 75% 57 1 16 5% 80% 58 2 18 10% 90% 60 2 20 10% 100%
Total 20 100%
3.4.1 Elementos de uma distribuição de frequências com intervalos de classe
Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20
Classe: são os intervalos de variação da variável e é simbolizada por i e o
número total de classes simbolizada por k.
Ex: na tabela anterior k = 5 e 49 |------- 53 são a 3ª classe, onde i = 3.
Limites de classe: são os extremos de cada classe. O menor número é o limite
inferior de classe (li) e o maior número, limite superior de classe ( Li ).
Ex: em 49 |------- 53,... l3 = 49 e L3 = 53.
O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita.
O dado 53 do ROL não pertence à classe 3 e sim à classe 4 representada por
53 |------- 57.
14
Amplitude do intervalo de classe: é obtida através da diferença entre o limite
superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela
anterior hi = 53 - 49 = 4. Obs: Na distribuição de freqüências c/ classe o hi
poderá ser igual em todas as classes.
Amplitude total da distribuição: é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela
anterior AT = 61 - 41= 20.
Amplitude total da amostra (rol): é a diferença entre o valor máximo e o valor
mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA =
60 - 41 = 19.
Obs: AT sempre será maior que AA.
Ponto médio de classe ( i ): é o ponto que divide o intervalo de classe em
duas partes iguais.
Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.
3.4.1.1 Etapas: Distribuição de Freqüências c/ classe
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA No nosso exemplo: AA = 60 - 41 = 19
3º - Calcule o número de classes através da "Regra de Sturges" K 1 +
3,3*log n. Onde K é o número de classes e n o número total de dados, ou pelo Critério
da Raiz
Obs: Qualquer regra para determinação do nº de classes da tabela não nos
levam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal,
que deve estar ligado à natureza dos dados.
No nosso exemplo: n = 20 dados, então a regra sugere a adoção de 5 classes.
4º - Decidido o nº de classes, calcule então a amplitude do intervalo de
classe h > AA / k. No nosso exemplo: AA/k = 19/5 = 3,8 . Obs: Como h > AA/k um valor
ligeiramente superior para haver folga na última classe. Utilizaremos então h = 4
15
5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com
freqüência = 0 (zero).
No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classe
será representada por
41 |------- 45. As classes seguintes respeitarão o mesmo procedimento.
A classe seguinte sempre terá como primeiro elemento o limite superior da
classe anterior.
Ex4. Utilizando os dados do exercício 3 (45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50,
46, 60, 54, 52, 58, 57, 58, 60, 51) Construa a tabela de distribuição de frequências com
intervalo de classes.
Tempo de cura do cimento X
Classes xi fi fac fr fr% frac frac%
41ǀ---45 43 7 7 0,35 35 0,35 35
45ǀ---49 47 3 10 0,15 15 0,5 50
49ǀ---53 51 4 14 0,2 20 0,7 70
53ǀ---57 55 1 15 0,05 5 0,75 75
57ǀ---61 59 5 20 0,25 25 1 100
3.5 Gráficos
Os principais gráficos utilizados na representação de distribuição de freqüências
são:
histograma e polígono de freqüência;
ogiva ou polígono de freqüência acumulada.
3.5.1 Histogramas
É um conjunto de retângulos com bases sobre um eixo dividido de acordo com
os tamanhos de classe, centro nos pontos médio das classes e áreas proporcionais às
freqüências.
Utilizando os dados do obtidos no EX4 montamos o histograma abaixo.
16
3.5.2 Polígonos de freqüências
É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes
às freqüências das diversas classes, centradas nos respectivos pontos médios (xi).
Para obter as interseções do polígono com o eixo, cria-se em cada extremo do
histograma uma classe com freqüência nula.
Utilizando os dados do obtidos no EX4 montamos o polígono de freqüência.
0
1
2
3
4
5
6
7
8 Tempo de cura do cimento X
41 45 49 53 57 61
0
1
2
3
4
5
6
7
8
39 41 43 45 47 49 51 53 55 57 59 61 63
Fre
qu
ên
cia
Tempo de cura (min)
Fre
qu
ên
cia
Tempo de cura (min)
Tempo de cura do cimento X
17
3.5.3 Polígonos de freqüência acumulada ou ogivas
É o gráfico representativo de uma distribuição acumulada de freqüências. É uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no
eixo vertical as freqüências acumuladas.
Note que a freqüência acumulada relacionada com o limite inferior da primeira
classe é sempre zero.
Ao contrário do polígono de freqüência, a ogiva de freqüências acumuladas
utiliza os pontos extremos
Utilizando os dados do obtidos no EX4 montamos o polígono de freqüência
acumulada.
0
5
10
15
20
25
39 41 43 45 47 49 51 53 55 57 59 61 63
Fre
qu
ên
cia
Tempo de cura (min)
Tempo de cura do cimento X
18
4 Medidas posição
São as estatísticas que representam uma série de dados orientando-nos quanto
à posição da distribuição em relação ao eixo horizontal do gráfico da curva de
freqüência. As medidas de posição mais importantes são:
Medidas de tendência central
Verifica-se uma tendência dos dados observados a se agruparem em torno dos
valores centrais.
As medidas de tendência central mais utilizadas são: média aritmética, moda e
mediana. Outros menos usados são as médias: geométrica, harmônica, quadrática,
cúbica e biquadrática.
Separatrizes
Que englobam: a própria mediana, os decis, os quartis e os percentis.
4.1 Medidas de tendência central para dados não agrupados
4.1.1 Média Aritmética Simples
A média aritmética simples ( x ) dos valores x1, x2, x3,....xn é o quociente entre a
soma desses valores e o seu número total (N):
x = N
xn
i
i1
ou seja: x =N
xxx n...21
Ex5: Uma loja de materiais de construção vendeu as seguintes quantidades de
caixas de pisos durante certa semana. Calcule a média dessas vendas
2ª. feira 3ª. feira 4ª. feira 5ª. feira 6ª. feira sábado
22 23 22 27 25 13
x = 6
132527222322 x =
6
132 x = 22
19
4.1.2 Moda
Moda de um conjunto de valores é o valor que aparece o maior número de
vezes, ou seja a característica com maior freqüência absoluta.
Na seqüência anterior 28, 37, 37, 37, 40,41, 41,43, 44, 45 a moda será o número
37.
4.1.3 Mediana
É o valor que ocupa a posição central de um conjunto de valores, colocados em
ordem crescente ou decrescente de grandeza. Devemos, portanto, considerar duas
situações: o número de valores é par ou, o número de valores é impar.
O número de dados é impar
Md = xp onde pn
1
2 (p = posição) ou
EX7. As nove classes de 1º Ano de engenharia têm respectivamente: 37, 28,
40,41,45,37,37, 41 e 44 alunos. Calcule a mediana.
pn
1
2 p
2
19 = 5
Portanto a mediana ocupará a 5ª posição = 40.
28, 37, 37, 37, 40, 41, 41, 44, 45
O número de dados é par
Mx x
d
p p
1
2 onde p
n
2.
Neste caso a mediana é a Média Aritmética dos dois termos centrais.
20
Ex8. As dez classes de 1º. Ano de engenharia têm respectivamente: 37, 28,
40,41,45,37,37, 41, 43 e 44 alunos. Calcule a mediana.
Ordenando aos dados temos: 28, 37, 37, 37, 40, 41, 41,43, 44, 45
pn
2
= 10/2 = 5
Md=
2
)( 155 xx
2
4140Md
Md= 40,5
4.2 Medidas de tendência central para dados agrupados
4.2.1 Média Aritmética Ponderada
4.2.1.1 Sem intervalo de classes
A média aritmética Ponderada difere da Média Aritmética Simples, pois alguns
dos valores x1, x2, x3,..., xn se repetem como podemos ver no exemplo abaixo.
EX6. A Tabela abaixo representa o número de falhas em um determinado
processo em uma indústria química.
xi fi
0 2
1 6
2 10
3 12
4 4
∑ 34
3,234
78.
i
ii
f
fxx
4.2.1.2 Com intervalo de classes
Neste caso, convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio ( ix ), e determinamos a média
aritmética ponderada por meio da fórmula:
21
i
ii
f
fx .
ou seja n
nn
fff
fxfxfxx
...
....
21
221.1
Ex7. O quadro de distribuição de freqüências representa os salários mensais de
40 empregados de uma firma. Calcule o salário médio mensal desses empregados.
Classe em Reais X10
Ponto Médio da classe
( ix )
Freq. (fi)
[180,200[ 190 4
[200,220[ 210 18
[220,240[ 230 10
[240,260[ 250 5
[260,280[ 270 3
40
810175023003780760 x
40
8900x x = 222,50 x = 222,50 x 10 = R$2.225,00
Ex8. Calcular a altura média de uma série de pilares de uma obra, conforme a
tabela abaixo.
Altura (cm) - xi Freqüência - fi Ponto médio i xi . fi
50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440
Aplicando a fórmula acima temos: 2.440 / 40.= 61, logo... = 61 cm
3510184
270.3250.5230.10210.18190.4
x
22
4.2.2 Moda
4.2.2.1 Sem intervalo de classes
Neste caso basto fixar o valor da variável de maior frequência
Temperaturas °C xi fi
0 3
1 9
2 12
3 6
4 5
∑ 34
2° C é temperatura modal, pois é a de maior frequência.
4.2.2.2 Com intervalo de classes
Neste caso o modo mais simples é achar a classe modal e calcular o ponto
médio dessa classe.
Classe fi
54 |------------ 58 9
58 |------------ 62 11
62 |------------ 66 8
66 |------------ 70 5
Total 33
A classe Modal é 58 |------------ 62, pois é a classe de maior frequência, e o ponto
médio dessa classe é (58+62)/2 60
Há também um método mais elaborado no qual utiliza a seguinte formula:
23
4.2.3 Mediana
4.2.3.1 Sem intervalo de classes
Impar
Temperaturas °C xi fi fac
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
∑ 35
2
1
npimparn
=(35+1)/2 18° termo equivale a 3°
Par
Temperaturas °C xi fi fac
0 2 2
1 6 8
2 9 17
3 13 30
4 4 34
∑ 34
2
1pp
d
xxM
p
n
2 Md=
2
)( 11717 xx
Nesse caso então serão a média entre os valores da posição 17° e 18°, 2 e 3
respectivamente 5,22
32
4.2.3.2 Com intervalo de classes
Nesse caso devemos seguir os seguintes passos:
1º) Determinamos as freqüências acumuladas;
2º) Calculamos ∑fi/2 ;
3º) Marcamos a classe correspondente à freqüência acumulada imediatamente
superior à ∑fi/2 . Tal classe será a classe mediana;
24
4º) Calculamos a Mediana pela seguinte fórmula:
onde: li é o limite inferior da classe mediana.
F(ant) é a freqüência acumulada da classe anterior a classe mediana
h é a amplitude do intervalo da classe mediana
fi é a freqüência do intervalo da classe mediana
classes freqüência = fi Freqüência acumulada
50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40
=
, logo.a classe mediana será 58 |------ 62.
li = 58 ; F(ant) =13 ; fi = 11 e h = 4 , Substituindo esses valores na fórmula, obtemos:
No caso de
acontecer, a mediana será o limite superior da classe correspondente
EX9. Calcule a mediana
8
18
29
45
58
63
64
25
=
, logo.a classe mediana será 750 |------ 850.
li = 750 ; F(ant) =29 ; fi = 16 e h = 100 , Substituindo esses valores na fórmula, obtemos:
No caso de
acontecer, a mediana será o limite superior da classe correspondente
4.3 Relação entre a média, a mediana e a moda
Para os dados agrupados representados por uma curva de freqüência, as
diferenças entre os valores da média, da mediana e da moda são indicadores da forma
da curva em termos de assimetria. Para uma distribuição unimodal simétrica, a média,
a mediana e a moda são, todas, coincidentes em valor Para uma distribuição
positivamente assimétrica, a média apresenta o valor mais elevado, enquanto a
mediana é maior do que a moda, mas menor do que a média. Para uma distribuição
negativamente assimétrica, a média apresenta o menor valor e a mediana se encontra
abaixo da moda, mas acima da média.
Moda Média
Mediana
Moda
(a) Simétrica (b) Positivamente assimétrica
(c) Negativamente assimétrica
26
4.4 Exercícios.
1) Calcular a média a moda e a mediana dos seguintes valores:
27,27,30,30,30,30,30,32,32,32.
x = 30
Md=2
)( 155 xx
2
)( 155 xx =
2
3030 = 30
Mo= 30
2) Calcular a média a moda e a mediana dos seguintes valores: 13,5; 13,5; 17,23;
35,003; 45,72; 63,601; 37,13; 13,5; 52,13
x = 32,368
Md - Organizar os dados em ordem crescente
Md= xp onde pn
1
2 (p = posição) p=5 Md= 35,003; Mo= 13,500
Posição
(p)
Valores
(xi)
1 13,500
2 13,500
3 13,500
4 17,230
5 35,003
6 37,130
7 45,720
8 52,130
9 63,601
3) A tabela nos dá uma distribuição de freqüências. Calcule a média dessa
distribuição. Resp. 22,9
xi fi xi* fi
10 8 80
20 11 220
30 7 210
40 5 200
Total 31 710
27
4) Foi feita uma pesquisa para saber o número de acidente que cada um dos 30
operários de uma obra já sofreram, obteve-se o seguinte quadro. Calcule a média, a
mediana e a moda.
0 2 3 2 1 2 2 1 1 2 1 2 0 1 2
0 2 2 3 4 2 3 1 3 2 5 2 4 4 2
Organizando os dados temos:
Número acidentes (xi) Freq.(fi) (xi)*(fi) fac
0 3 0 3
1 6 6 9
2 13 26 22
3 4 12 26
4 3 12 29
5 1 5 30
Total 30 61
x = 61/30= 2,033 acidentes
Md= 2
)( 1615 xx =
2
22 = 2
Mo= 2
5) No quadro abaixo temos as idades dos 20 alunos que estudam na 2ª. Série do
Ensino Médio de uma Escola. Faça um quadro completo de distribuição de freqüências.
Calcule a média dessa seqüência. Resp: x = 15,45
15 15 14 16 16 16 17 16 14 15
15 15 16 16 16 17 16 15 14 15
6) Utilizando os dados do EX2 (50, 65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60,
70, 50, 50, 59, 53, 65, 68, 50, 53, 75). Construa uma tabela de distribuição de
frequência com intervalo de classes e calcule a média, a moda e a mediana
28
1° Calcular a amplitude total AA = 75-50= 25
2° Calcular o numero de classes K= 1+3,3*log25 = 5,6 5
3° Calcular a Amplitude do intervalo Ai = AA/k = 5
Obs confirmar se pode li+( Ai * K) ≥ Ls 50+25 ≥ 75 75 ≥ 75 OK.
4° Calcular os intervalos:
Classes x fi fac fr frac
50 ǀ--- 55 52,50 9 9 0,36 0,36
55 ǀ--- 60 57,50 3 12 0,12 0,48
60 ǀ--- 65 62,50 3 15 0,12 0,60
65 ǀ--- 70 67,50 5 20 0,20 0,80
70 ǀ--- 75 72,50 5 25 0,20 1,00
Total 25
1
5° Calculo da média = 1532,5/25 = 61,3
Classes x fi fac x * fi
50 ǀ--- 55 52,50 9 9 472,5
55 ǀ--- 60 57,50 3 12 172,5
60 ǀ--- 65 62,50 3 15 187,5
65 ǀ--- 70 67,50 5 20 337,5
70 ǀ--- 75 72,50 5 25 362,5
Total 25
1532,5
6° Calculo da mediana
∑fi/2 20/2 = 10
Classe onde a fac é imediatamente superior a ∑fi/2 essa será a classe da
mediana : 55 ǀ--- 60
Usando a formula : Md = li* + [( ∑fi /2 - Fant ) . h*] / fi*
Md= 55 + [( 10 – 9 ) * 5] / 3 = 56,66
29
4.5 Separatrizes
4.5.1 Quartis, Decis e Percentis
São valores que ocupam determinados lugares de uma série.
Seus empregos são para análise, assim como a mediana, sendo que esta divide
a distribuição em duas partes iguais, os quartis em 4, os decis em 10 e os percentis em
100 partes iguais. Pode-se então dizer, de modo geral, que são valores de posição de
uma distribuição e que servem para o auxílio de comparação. Os processos de cálculo
de seus valores são idênticos aos da mediana.
4.5.1.1 Calculo para dados não agrupados
EX10. Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Q1= 1(11+1)/4 = 3° posição = 15
Q2= 2(11+1)/4 = 6° posição = 40
Q3= 3(11+1)/4 = 9° posição = 43
Ex11. Calcular os quartis da seguinte série:
O primeiro quartis (Q1) abrange 25% dos termos da série, o segundo quartil (Q2)
50% = Me o terceiro quartil (Q3) 75%.
30
4.5.1.2 Cálculo para dados agrupados
O processo a ser empregado é o mesmo que para o cálculo da mediana,
bastando apenas no cálculo das posições (P) considerarem os denominadores, 4, 10 e
100, respectivamente, para os quartis, decis e percentis.
Sendo k o número de ordem do quartil, do decil ou do percentil
EX12. Calcular os quartis na seguinte série estatística
31
EX13. Calcular os quartis na seguinte série estatística
EX13. Calcular o oitavo percentil na seguinte série estatística abaixo.
K=8
, logo a classe do percentil será 1°.
li=150; F(ant) = 0; h=4; fi=4
32
5 Mediadas de dispersão ou de variabilidade
Visam descrever os dados no sentido de informar o grau de dispersão ou
afastamento dos valores observados em torno de um valor central (média). Informa se
um conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita
variabilidade).
Medidas de dispersão então medem o afastamento dos valores observados em
relação a uma medida de tendência central (normalmente em relação a média
aritmética).
Ex 14. Desejamos compara o desempenho de dois grupos, com base em um teste
em uma prova do MEC:
Grupo A { 70; 71; 69; 70; 70 }
Grupo B { 55; 80; 70; 62; 83 }
Calculando a média para cada um dos grupos vamos obter a=70 e b=70
Baseado nestes resultados, diríamos que ambos os grupos apresentam a mesma
performance. Mas, observando mais detalhadamente os dados, notamos que as notas
do grupo A variam apenas de 69 a 71, ao passo que as de B variam de 55 a 83, o que
revela que o desempenho de A é bem mais uniforme que o de B.
Para avalia quantitativamente o grau de variabilidade ou dispersão de um grupo de
valores utilizamos então as medidas de dispersão, onde as principais medidas são: a
amplitude total, a variância, o desvio padrão e o coeficiente de variação de Pearson.
5.1 Amplitude Total
É a diferença entre o maior e o menor valor observado
Sem Intervalo Com intervalo de classes
AT = Xmax – Xmin AT = L(Máx) – l(Mín)
Quanto maior for à amplitude, maior será dispersão ou variabilidade dos valores
da variável
33
5.2 Variância e desvio padrão
A variância e o desvio padrão são medidas que levam em consideração a
totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade
bastante estáveis e, por isso mesmo, os mais geralmente utilizados.
A variância baseia-se nos desvios em torno da média aritmética, porém
determinado a média aritmética dos quadrados dos desvios, representamos a variância
por s2.
O desvio padrão é o valor positivo da raiz quadrada da variância absoluta. É
uma medida estatística que representa, em média, os afastamentos, em valores
absolutos, dos elementos observados em relação a respectiva média aritmética. É uma
medida estatística que é dada na unidade da medida utilizada:
Em geral a média aritmética ( ) é um numero fracionário o que torna pouco
prático o calculo das quantidades de .
Podemos simplificar os cálculos fazendo a seguinte igualdade:
Substituindo na formula do desvio padrão temos:
34
5.2.1 Dados não agrupados
EX 15.
EX16.
EX17. Com os seguintes valores 8; 10; 11; 15; 16; 18, calcule o desvio padrão:
(Xi) (Xi)2
8 64
10 100
11 121
15 225
16 256
18 324
∑= 78 ∑=1090
35
5.2.2 Dados agrupados sem intervalo de classes
EX18.
xi fi xi*fi (xi – ) fi(xi – )2
0 2 0 0 – 2,1 = – 2,1 2*4,41= 8,82
1 6 6 1 – 2,1 = – 1,1 6*1,21= 7,26
2 12 24 2 – 2,1 = – 0,1 12*0,01= 0,12
3 7 21 3 – 2,1= 0,9 7*0,81=5,67
4 3 12 4 – 2,1 = 1,9 3*3,61=10,83
∑= 30 ∑= 63 ∑= 32,70
5.2.3 Dados agrupados com intervalo de classes
EX19.
Altura (cm) - xi fi xi*fi (xi – ) fi(xi – )2
150 |------ 154 4 152 608 152-161 = - 9 4*81
154 |------ 158 9 156 1404 -5 9*25
158 |------ 162 11 160 1760 -1 11*1
162 |------ 166 8 164 1312 3 8*9
166 |------ 170 5 168 840 7 5*49
170 |------ 174 3 172 516 11 3*121
Total 40 6.440 1240
cm
36
5.3 Coeficiente de variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de
duas unidades pode ser considerado pequeno para uma série de valores cujo valor
médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além
disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o
seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades
diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a
dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida
essa denominada coeficiente de variação (CV):
EX.20 Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivíduos:
Temos:
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão
que as estaturas.
Ex.21 Para os dados abaixo calcule a variância e o desvio padrão
a) 1,3,5,9
b) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
c) 26, 14, 15, 19, 21, 22, 20
d) -10, -6, 2, 3, 7, 9, 10
R: a) 2,96; b) 3,016; c) 2,81; d) 7,04
37
Ex.22 Calcule o desvio padrão das distribuições abaixo:
(R: a) 1,51; b) 0,159)
EX.23 Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente
calcule o desvio padrão:
(R: 1,13)
EX.24 Calcule o desvio padrão da distribuição:
(R: 4,5)
EX.25 Calcule o desvio padrão das distribuições de freqüência abaixo:
(R: a) 2,43; b) 8,8 cm; c) R$ 229; d) 9,93 kg).
38
EX26. Sabendo que um conjunto de dados apresenta para média aritmética e para
desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
(R:8,02%).
EX27. Em uma obra A, foram inspecionadas 150 barras de ferro e média foi 7,8 cm e o
desvio padrão, 0,80 cm. Em outra obra B, entretanto, a média foi de 7,3 cm e o desvio
padrão, 0,76. Em qual obra houve uma maior a dispersão?
(R: Obra B)
EX28. Medidas as estaturas de 1.017 indivíduos, obtivemos x = 162,2 cm e s = 8,01
cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3
kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
(R:estatura)
39
6 Correlação e Regressão
Nos métodos estatísticos precedentes consideramos sempre a existência de uma
única variável de interesse, porém vários problemas no trabalho estatístico, todavia,
envolvem muitas variáveis. Veremos agora dois métodos estatísticos para lidar com
este tipo de problema. Faremos nosso estudo com o caso mais simples em que temos
apenas duas variáveis de interesse.
6.1 Correlação linear entre duas variáveis
Avaliar se existe associação entre duas características quantitativas é objetivo de
muitos estudos em diversas áreas. Um ecologista pode estar interessado em saber, por
exemplo, se há associação entre a quantidade de chumbo medida na água e o volume
de dejetos despejados em determinado rio; um médico pode querer avaliar se a
pressão arterial está relacionada à idade das pessoas. Quando se pode demonstrar
que existe associação entre duas variáveis quantitativas, isto é, quando se constata
que elas variam juntas, diz-se que as variáveis estão correlacionadas.
Ex29. Consideremos uma amostra aleatória, formada por dez dos 98 alunos de
uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística:
Representando, em um sistema coordenado cartesiano ortogonal, os pares
ordenados (x, y), obtemos uma nuvem de pontos que denominamos diagrama de
40
dispersão. Esse diagrama nos fornece uma idéia grosseira, porém útil, da correlação
existente:
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos
imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma elíptica tem como "imagem" uma reta,
sendo, por isso, denominada correlação linear. É possível verificar que a cada
correlação está associada como "imagem" uma relação funcional. Por esse motivo, as
relações funcionais são chamadas relações perfeitas.
Como a correlação em estudo tem como "imagem" uma reta ascendente, ela é
chamada correlação linear positiva.
Assim, uma correlação é:
a. linear positiva se os pontos do diagrama têm como "imagem" uma reta
ascendente;
b. linear negativa se os pontos têm como "imagem" uma reta descendente;
41
c. não-linear se os pontos têm como "imagem" uma curva .
Se os pontos apresentam-se dispersos, não oferecendo uma "imagem" definida,
concluímos que não há relação alguma entre as variáveis em estudo .
Temos, então:
6.1.1 Coeficiente de correlação linear
O instrumento empregado para a medida da correlação linear é o coeficiente de
correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre
duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo).
Faremos uso do coeficiente de correlação de Pearson, que é dado por:
Onde n é o número de observações. Os valores limites de r são -1 e + 1, isto é, o
valor de r pertence ao intervalo [-1, +1].
Assim:
se r = + 1, há uma correlação perfeita e positiva entre as variáveis;
se r = -1, há uma correlação perfeita e negativa entre as variáveis;
se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura
exista não é linear.
42
Para podermos tirar algumas conclusões significativas sobre o comportamento
simultâneo das variáveis analisadas, é necessário que:
0,6 ≤ I r I ≤ 1
Se 0,3 ≤ I r I ≤ 0,6, há uma correlação relativamente fraca entre as variáveis.
Se 0 < I r I < 0,3, a correlação é muito fraca e, praticamente, nada podemos
concluir sobre a relação entre as variáveis em estudo.
EX29. Vamos, então, calcular o coeficiente de correlação relativo à tabela dada.O
modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos
valores de x.y., x2 e y2. Assim:
Resultado que indica uma correlação linear positiva altamente significativa entre as
duas variáveis.
43
Ex 30. Calcule o coeficiente de correlação para os valores das variáveis Xi e Yi
abaixo:
A correlação linear entre as variáveis X e Y é positiva, porém fraca.
EX31. Um grupo de pesquisadores fez uma avaliação do peso aparente de alguns
objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se
a tabela:
Com os dados apresentados calcule o índice de correlação:
Xi Yi Xi*Yi Xi2 Yi
2
18 10 180 324 100
30 23 690 900 529
42 33 1386 1764 1089
62 60 3720 3844 3600
73 91 6643 5329 8281
97 98 9506 9409 9604
120 159 19080 14400 25281
442 474 41205 35970 48484
Xi Yi Xi*Yi Xi2
Yi2
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196
40 56 460 360 648
44
6.2 Regressão Linear
Sempre que desejamos estudar determinada variável em função de outra,
fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através de
um modelo matemático, a relação entre duas variáveis, partindo de n observações das
mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de
variável dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos
obter uma função definida por:
Y = aX + b
Onde os parametros a e b podem ser obtidos pelas formula:
Exemplo: Dada a tabela abaixo:
45
Para traçarmos a reta no gráfico basta determinar dois pontos:
X=0 Y=0,89
X=5 Y=5,19
EX32. Com os dados abaixo faça o ajustamento de uma reta.
Xi Yi Xi*Yi Xi2
2 30 60 4
4 25 100 16
6 22 132 36
8 18 144 64
10 15 150 100
12 11 132 144
120 159 19080 14400
56 131 858 560
EX33. A tabela abaixo apresenta a produção de uma indústria:
Calcule:
a. o coeficiente de correlação;
b. a reta ajustada;
c. a produção estimada para 1989.
46
Xi Yi Xi*Yi Xi2 Yi
2
0 34 0 0 1156
1 36 36 1 1296
2 36 72 4 1296
3 38 114 9 1444
4 41 164 16 1681
5 42 210 25 1764
6 43 258 36 1849
7 44 308 49 1936
8 46 368 64 2116
36 360 1530 204 14538
c)
a)
b)
47
7 Analise combinatória
7.1 Fatorial
Seja n um número natural, tal que n2. Denomina-se fatorial de n e representado
por n! o produto de todos os números naturais de n a 1, ou seja:
Para n N e n 2,
12)...2)(1(! nnnn
Para n=1 e n=0 define-se n!=1, isto é
1!=1 e 0!=1
Na utilização da calculadora podemos observar a existência de uma tecla n!,
para a realização do cálculo fatorial. Vamos analisar alguns exemplos:
a) 12012345!5
b) 40320!567812345678!8
c) 8006283!8910!10
Em probabilidade, muitas vezes devemos calcular expressões como
, e para
calculá-la devemos recorrer a seguinte simplificação:
336678!5
!5678
!5
!8
De um modo geral, podemos escrever:
...)!2)(1()!1(! nnnnnn
48
7.2 Princípio fundamental da contagem – PFC
Suponhamos que uma ação seja constituída de duas etapas sucessivas. A
primeira etapa pode ser realizada de p maneiras distintas. Para cada uma dessas
possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas. Então, o número
de possibilidades de se efetuar a ação completa é dado por p x q.
EX1. No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do
alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado?
Imaginemos a seguinte situação: Placa ACD – 2172.
Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos
(de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como
pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação
aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4
lugares, portanto:
26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.
EX2. No sistema antigo utilizavam se 2 letras do alfabeto e 4 algarismos. Qual o
número máximo de veículos que podia ser licenciado neste sistema?
26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.
Concluímos que a inclusão de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veículos.
EX3. Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos
distintos podemos formar?
1ª escolha do algarismo das centenas: são seis possibilidades.
2ª escolha do algarismo das dezenas: como não pode haver repetição de
algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena.
Assim, há cinco possibilidades.
3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos
dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro
possibilidades.
Pelo PFC, o resultado é: 6 x 5 x 4 = 120 números
49
EX4. Quantos números de três algarismos podemos formar com os algarismos 0,
1, 2, 3, 4, 5, 6 e 7 ?
Algarismo das centenas: com exceção do zero, qualquer um dos algarismos
dados pode ser escolhido, havendo, portanto, sete possibilidades.
Algarismo das dezenas e unidades não há restrição alguma
Logo, pelo PFC: 7 x 8 x 8 = 448.
7.3 Arranjos simples
Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,
tomados k a k, a qualquer seqüência ordenada de k elementos distintos escolhidos
entre os n existentes.
Ex5. Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses
quatro elementos tomados dois a dois. A4,2
(1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3).
Notamos que (2, 3) ≠ (3, 2), isto é, a troca na ordem dos elementos de um
possível agrupamento gera um agrupamento diferente.
EX6. Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do
cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa tentar abrir o
cofre, quantas tentativas deverá fazer (no máximo) para conseguir abri-lo?
As seqüências serão do tipo xyz. Para a primeira posição teremos 10 alternativas,
para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de arranjos pelo PFC,
chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3
7.3.1 Cálculo do número de arranjos
Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para
o número de arranjos dos n elementos tomados k a k (An,k).
50
EX7. O quadrangular de um torneio de futebol é disputado por quatro seleções. De
quantas maneiras distintas podemos ter os três primeiros colocados?
EX8. Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com
3 letras podem ser montados?
EX9. A senha de um cartão de banco é formada por duas letras distintas seguidas por
uma seqüência de três algarismos distintos. Quantas senhas poderiam ser
confeccionadas?
1° As letras A26,2 = 650
2° Os Números A10,3 = 720
Pelo PFC A26,2 x A10,3 = 650 x 720 = 468.000.
7.4 Permutações simples
De outro modo, podemos entender permutação simples como um caso especial de
arranjo, onde n = k.
EX10. Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é
qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou
sem sentido: SOL, SLO, OSL, OLS, LOS, LSO.
51
7.4.1 Permutações com elementos repetidos
Se entre os n elementos de um conjunto, existem a elementos repetidos, b
elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de
permutações que podemos formar é dado por:
EX11. Determine o número de anagramas da palavra MATEMÁTICA Temos 10
elementos, com repetições. A letra M está repetida duas vezes, a letra A três, a letra T,
duas vezes. Na fórmula anterior, teremos:
7.5 Combinações simples
Dado um conjunto A com n elementos distintos, chama-se combinação dos n
elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto
é, temos uma combinação quando os agrupamentos conseguidos permanecem iguais
ao se inverter a posição dos seus elementos.
Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de
três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís,
Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos de
três.
52
EX12. Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de
três alunos para representação discente na universidade. De quantas maneiras
podemos fazer tal escolha?
Neste caso tanto faz a posição dos três alunos no conjunto ( A, B, C); (B, A, C) ....
desde que os três sejam os escolhidos
Se fosse importante a ordem deles nos subconjunto usaríamos o Arranjo simples
Mas não nos importa a ordem então utilizaremos a combinação simples.
Ex13. Uma loja de materiais de construção oferece 15 tipos de pisos diferentes
a) De quantas maneiras se pode escolher três tipos desses pisos?
b) Suponha que certo comprador sempre opte por um piso tipo A. Como poderão
ser escolhidos os outros dois pisos?
a) Escolher os pisos {A, B, C} é o mesmo que escolher os Pisos {C, B, A}. Assim,
cada possível escolha é uma combinação dos 15 pisos tomados três a três
b) Como um dos pisos já foi definido, os outros dois serão escolhidos entre os 14
restantes.
53
7.6 Números Binomiais
Sejam n e p dois números naturais quaisquer e tais que n p. Denomina-se
número binomial, e indica-se por , o número assim definido:
Onde n,p N e n p, e devemos lembrar que n é o numerador e p é a classe do
número binomial , e lê-se: binomial n classe p.
Vamos calcular o seguinte exemplo, aplicando-se a expressão dada acima:
Existem também os binomiais complementares, que recebem esta
denominação, quando dois números binomiais apresentam o mesmo numerador, e a
soma de suas classes é igual a esse numerador, isto é, se n, p, q N, então:
São complementares se p+q=n.
Vamos analisar os seguintes exemplos:
Observamos que a soma: 6+9=15
Dois números binominais complementares são iguais, se n, p, q N, isto é:
p + q=n
Devemos observar como conseqüência dessa propriedade dos números
binominais complementares, a seguinte relação:
Para n, p N e np
npxoupxp
n
x
n
54
8 Probabilidade
A Probabilidade pode ser definida como a possibilidade ou chance de que um
evento venha a ocorrer. O estudo das probabilidades se justifica pelo fato de a maioria
dos fenômenos de que trata a Estatística serem de natureza aleatória ou probabilística.
Fenômenos onde o resultado final depende do acaso são chamados fenômenos
aleatórios ou experimentos aleatórios.
8.1 Experimentos ou fenômenos aleatórios
São aqueles que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis.
Assim, da afirmação "é provável que o meu time ganhe a partida de hoje" pode
resultar:
a. que, apesar do favoritismo, ele perca;
b. que, como pensamos, ele ganhe;
c. que empate.
8.2 Espaço amostral
A cada experimento correspondem, em geral, vários resultados possíveis. Assim,
ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa.
Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou
conjunto universo, representado por S.
Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:
lançamento de uma moeda: S = {Ca, Co};
lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.
Se lançarmos duas vezes a moeda teremos:
S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.
Cada elemento de S que corresponde a um resultado recebe o nome de ponto
amostral.
55
8.3 Eventos
Chamamos de evento qualquer subconjunto de espaço amostral S de um
experimento aleatório.
Assim, qualquer que seja E, se E C S (E está contido em S), então E é um evento
de S.
Se E = S, E é chamado evento certo;
Se E C S e E é um conjunto unitário, E é chamado evento elementar. Se
E=conjunto vazio, então é chamado evento impossível.
Ex1.
No lançamento de um dado, onde S = {1,2,3,4,5,6}, temos:
A = {2,4,6} C S; logo, A é um evento de S;
B = {1,2,3,4,5,6} C S; logo, B é um evento certo de S;
C = {4} C S; logo, C é um evento elementar de S;
D = C S; logo, D é um evento impossível de S.
8.4 Função Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir
que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é
um conjunto equiprovável.
Chamamos de probabilidade de um evento A (A C S) o número real P(A), tal que:
n(A) é o número de elementos de A;
n(S) é o número de elementos de S.
Ex2:
a) Considerando o lançamento de uma moeda e o evento A "obter cara", temos:
S = {Ca, Co} n(S) = 2
A = {Ca) n(A ) = 1
Sn
AnAP
2
1AP
56
O resultado acima nos permite afirmar que, ao lançarmos uma moeda
equilibrada, temos 50% de chance de que apareça cara na face superior.
b) Considerando o lançamento de um dado, vamos calcular:
1° Probabilidade do evento A "obter um número par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3
2° Probabilidade do evento B "obter um número menor ou igual a 6 na face superior" .
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2,3, 4, 5, 6} n(B) = 6
8.5 Eventos complementares
Sabemos que um evento pode ocorrer ou não. Sendo “p” a probabilidade de que
ele ocorra (sucesso) e “q” a probabilidade de que ele não ocorra (fracasso), para um
mesmo evento existe sempre a relação:
p + q = 1 q = 1 – p
Assim, se a probabilidade de se realizar o evento é 5
1p , a probabilidade de que
ele não ocorra é 5
4q .
8.6 Eventos independentes
Dizemos que dois eventos são independentes quando a realização ou a não-
realização de um dos eventos não afeta a probabilidade de realização do outro e vice-
versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles
independe do resultado obtido no outro.
2
1
6
3AP
16
6AP
57
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
p = p1 * p2
Ex3: Se lançamos dois dados. A probabilidade de obtermos 1 no primeiro e 5 no
segundo é ?
8.7 Eventos mutuamente exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a
realização de um exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa"
são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro
se realize é igual à soma das probabilidades de que cada um deles se realize:
p = p1 + p2
Ex4: Lançamos um dado. A probabilidade de se tirar o 3 ou 5 é:
8.8 Exercícios
1) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
R: O evento é formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o número de
elementos de S é 36, temos:
58
2) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho
ser um rei e a do segundo ser o 5 de paus?
3)
4)
59
5)
6)
a) 14/16 = 7/8
b) 10/16 = 5/8
c)10/16 + 2/16 = 3/4
a) 10/16 * 9/15 = 90/ 240 = 3/8
b) = 7/8
c) 14/16 * 13/15 = 91/120
d) 6/16 * 5/15 = 1/8
60
9 Distribuição Binomial
Uma distribuição de probabilidade binomial resulta de um experimento que
satisfaz os seguintes requisitos:
O experimento deve ser repetido, nas mesmas condições, um número finito de
vezes (n);
As tentativas devem ser independentes, ou seja, o resultado de uma não afeta
os resultados das sucessivas;
Cada tentativa deve ter todos os resultados classificados em duas categorias
(sucesso e insucesso);
No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q = 1 – p) do insucesso devem permanecer constantes.
Se um experimento satisfaz esses quatro requisitos, a distribuição da variável
aleatória x é chamada de distribuição de probabilidade binomial ou (distribuição
binomial).
Em uma distribuição binomial, as probabilidades podem ser calculadas através
da fórmula da probabilidade binomial.
Onde: n = número de tentativas
k = número de sucessos em n tentativas
p = probabilidade de sucesso em qualquer tentativa
q = probabilidade de fracasso em qualquer tentativa (q = 1 – p)
61
Ex1. Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a
probabilidade de obter 3 caras, nessas 5 provas. Para o exemplo dado temos que:
n= 5
k=3
p =
( probabilidade de obter cara – sucesso)
q =
(probabilidade de obter coroa – insucesso)
Daí:
Ex2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de
o time A ganhar 4 jogos.
n = 6
k = 4
p = 1/3 (Pode ganhar empatar ou perder)
q = 1 – 1/3 = 2/3