estatística unidade ii
Post on 28-Dec-2015
1.922 Views
Preview:
TRANSCRIPT
54
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Unidade II5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS
O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que, com relativamente poucas informações, possamos chegar a conclusões sobre essa amostra estudada.
Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas medidas de tendência central, também chamadas de medidas de posição, que informam a magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às características individuais de seus elementos.
No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as medidas de dispersão, também chamadas de medidas de variabilidade.
5.1 Medidas de posição
As medidas de posição ou medidas de tendência central, como o próprio nome indica, preocupam‑se com definir uma posição central da amostra, ou seja, um valor que seja representativo do que é típico da amostra. Iremos trabalhar com as três principais medidas desse tipo: a média, a mediana e a moda.
5.1.1 Média
De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de média simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor aparece uma única vez na amostra, e de média ponderada quando os dados são dotados de certa frequência.
Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações matemáticas diferentes.
A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um
55
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
conjunto de valores S = {x1, x2, x3,………xn}, a média aritmética desse conjunto será calculada por meio das fórmulas:
Xx x x x
Nn= + + + +1 2 3 ....
Ou
Xx
Ni= Σ
Onde:
X é a média aritmética;
x1, x2, etc. são os diversos valores;
N é a quantidade total de elementos da amostra.
Exemplo 1. Calcular a média aritmética dos valores relacionados a seguir:
S = {2; 5; 7; 9; 10; 12; 16; 18}
Observe que são oito elementos de diferentes valores, portanto:
Xx
NX Xi= ⇒ = + + + + + + + ⇒ =Σ 2 5 7 9 10 12 16 18
89 9,
Exemplo de aplicação
1. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir:
Tabela 25
12% 13% 18% 9% 10% 11%
13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento médio dessas aplicações é de:
A) 13%
B) 12%
56
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
C) 15%
D) 18%
E) 16%
Caso os valores sejam repetidos na amostra, ou seja, caso tenham uma frequência diferente de 1 (x1 com f1; x2 com f2 e assim por diante), então a fórmula para o cálculo da média aritmética é:
Xx ffi i
i= Σ
Σ
Este último conceito define a média ponderada; eventualmente, as frequências podem ser substituídas por “pesos” que conferem importância diferenciada a cada valor.
O exemplo a seguir mostra o cálculo para dados não agrupados em classe:
Exemplo 2. Calcular a média aritmética dos valores relacionados a seguir:
Tabela 26
Valor Frequência simples
xi fi
25 37
42 28
57 54
62 62
39 12
Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores dividida pela quantidade total de elementos. Porém, cada um dos valores da tabela aparece certo número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto precisamos somar 25 com ele mesmo 37 vezes; ou, de maneira mais direta, precisamos multiplicar 25 por 37. A coluna C mostra todos os cálculos desse tipo. Quando somamos essa coluna, obtemos o valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim, a média é:
57
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Tabela 27
A B C = A x B
Valor Frequência simples Valor x Frequência
xi fi xi . fi
25 37 925
42 28 1176
57 54 3078
62 62 3844
39 12 468
ft 193 9491
Xx ff
X Xi i
i= ⇒ = ⇒ =Σ
Σ9491193
49 2,
No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de que o valor a ser usado é o ponto médio de classe (lembre‑se de que já definimos esse valor anteriormente):
x pi mi=
O exemplo a seguir mostra‑nos, passo a passo, o cálculo da média aritmética ponderada para dados agrupados por classes:
Exemplo de aplicação
2. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir, estão relacionados as informações referentes aos últimos 120 dias de produção.
Tabela 28
Número de defeitos diários Número de dias
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
58
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Nessas condições o número médio de defeitos diários é de aproximadamente:
A) 7,9
B) 10,0
C) 9,3
D) 8,0
E) 8,7
Exemplo 3. Dada a tabela de frequências a seguir, calcular a média aritmética.
Tabela 29
A B C D E = (C + D)/2 F = D x E
Classe Limites de classe
li ls
Frequênciasimples
fi
Pontomédio
de classepmi
Frequênciax pontomédio
fi x pmi
1,0 3,0 |‑‑‑‑‑‑‑ 414,0 14,0 208,5 2.919,0
2,0 414,0 |‑‑‑‑‑‑‑ 825,0 19,0 619,5 11.770,5
3,0 825,0 |‑‑‑‑‑‑‑ 1.236,0 41,0 1.030,5 42.250,5
4,0 1.236,0 |‑‑‑‑‑‑‑ 1.647,0 53,0 1.441,5 76.399,5
5,0 1.647,0 |‑‑‑‑‑‑‑ 2.058,0 32,0 1.852,5 59.280,0
6,0 2.058,0 |‑‑‑‑‑‑‑ 2.469,0 27,0 2.263,5 61.114,5
7,0 2.469,0 |‑‑‑‑‑‑‑ 2.880,0 20,0 2.674,5 53.490,0
8,0 2.880,0 |‑‑‑‑‑‑‑ 3.291,0 11,0 3.085,5 33.940,5
9,0 3.291,0 |‑‑‑‑‑‑| 3.702,0 8,0 3.496,5 27.972,0
∑= ft = 225,0 369.136,5
A tabela anterior apresenta os valores e cálculos necessários para determinarmos a média aritmética para uma amostra que estivermos descrevendo.
As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética.
O uso de uma tabela para esses cálculos facilita as operações, além de estas serem mais facilmente trabalhadas em computador.
Nesse exemplo, somamos os valores de todos os elementos da amostra, ficando na seguinte situação: o valor da soma dos 225 elementos da amostra é 369136,5, portanto a média aritmética será de:
59
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Xx ff
X Xi i
i= ⇒ = ⇒ =Σ
Σ369136 5
2251640 6
,,
É importante observar as seguintes propriedades das médias aritméticas:
• a soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados em relação à média é nula;
• se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética ficará multiplicada ou dividida por essa constante;
• somando‑se ou subtraindo‑se uma constante de todos os valores de um conjunto de informações, a média aritmética ficará somada ou subtraída dessa constante;
• a soma dos quadrados dos desvios tomados em relação à média aritmética é mínima (essa propriedade é muito importante para a definição de desvio‑padrão, que veremos mais à frente)
Exemplo de aplicação
3. Uma pequena agência de publicidade relacionou, na tabela a seguir, o custo das suas 120 últimas campanhas publicitárias:
Tabela 30
Classes Custo das campanhas publicitárias (limites)
Quantidade de campanhas publicitárias (frequência simples)
A R$ 5.000 |‑‑‑‑ R$ 10.000 12
B R$ 10.000 |‑‑‑‑ R$ 15.000 15
C R$ 15.000 |‑‑‑‑ R$ 20.000 18
D R$ 20.000 |‑‑‑‑ R$ 25.000 23
E R$ 25.000 |‑‑‑‑ R$ 30.000 25
F R$ 30.000 |‑‑‑‑ R$ 35.000 14
G R$ 35.000 |‑‑‑‑ R$ 40.000 13
Nessas condições, podemos afirmar que o custo médio das campanhas publicitárias dessa agência é de aproximadamente:
A) R$ 22.833,00
B) R$ 22.500,00
C) R$ 20.000,00
60
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
D) R$ 25.833,00
E) R$ 20.833,00
5.1.2 Mediana
Conceitualmente, definimos mediana como o valor, em um conjunto de valores ordenados, que divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50% inferiores. Essa definição precisa adaptar‑se ao número N de elementos da amostra:
• caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento mediano);
• caso N seja um número par, a mediana será a média aritmética simples dos dois elementos centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no exemplo a seguir:
Exemplo 1. Dados os seguintes conjuntos de notas de alunos de Estatística, calcule a mediana:
Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}.
Para calcular a mediana é necessário colocar os dados em ordem crescente:
{2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1}
Como o número de elementos é ímpar (N = 9), a mediana será o valor do elemento central (o quinto elemento), ou seja, o valor da mediana será 6,2.
Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas a seguir, onde: Eme é o elemento mediano e Me a mediana:
EN
E Eme me me= + => = + => =12
9 12
5º
O valor do quinto elemento é a mediana:
Me = 6,2
Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0}
Ordenando:
{4,9; 6,3; 6,5; 8,0; 8,4; 9,2}
61
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
EN
E Eme me meo= + => = + => =1
26 1
23 5,
Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor do terceiro e do quarto elemento:
Mex x
Me Me= + => = + => =3 4
26 5 8 0
27 25
, ,,
Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não. Primeiro, veremos quando os dados não forem agrupados em classes. Nesse caso, o procedimento é semelhante ao feito no Exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada crescente para permitir localizarmos o elemento mediano.
Exemplo de aplicação
4. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir:
Tabela 31
12% 13% 18% 9% 10% 11%
13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento mediano dessas aplicações é de:
A) 18%
B) 12%
C) 15%
D) 13%
E) 16%
O exemplo 2 mostra o cálculo em duas situações diferentes:
Exemplo 2. Calcular a mediana para os dados relacionados a seguir, relativos ao número de filhos por família moradora em determinada cidade.
62
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Tabela 32 – Cidade A
Número de filhos por família
Quantidade de familias na cidade Frequência
acumulada crescenteValor Frequência simples
xi fi fac
0 15 15
1 18 33
2 12 45
3 8 53
4 5 58
5 3 61
6 1 62
Mais do que 6 1 63
Soma 63
Perceba que o número de elementos (N = 63) é ímpar, logo o elemento mediano será o 32º:
E Eme me= + => =63 12
32º
O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem‑se a famílias com 0 filho; o 16º ao 33º valor referem‑se a famílias com 1 filho, e assim por diante. Logo a mediana será:
Me = 18
Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm um filho ou mais.
Tabela 33 – Cidade B
Número de filhos por família
Quantidade de famílias na cidade Frequência acumulada
crescenteValor Frequência simples
xi fi fac
0 15 15
1 21 36
2 16 52
3 9 61
4 6 67
5 4 71
6 1 72
Mais do que 6 0 72
Soma 72
63
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Perceba que o número de elementos (N = 72) é par, logo o elemento mediano seria o 36,5º, que, evidentemente, não existe.
E Eme meo= + => =72 1
236 5,
O 36º elemento tem o valor 1, e o 37º, o valor o valor 2, portanto o 36,5º seria um valor médio entre esses dois valores, ou seja, a mediana será:
Me Me= + => =1 22
15,
Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho e 50% das famílias tem mais de 1,5 filho.
Exemplo de aplicação
5. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção.
Tabela 34
Número de defeitos diários Número de dias
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
Nessas condições, o número médio de defeitos diários é de aproximadamente:
A) 7,9
B) 10,0
C) 9,3
64
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
D) 8,0
E) 8,7
O cálculo da mediana, quando trabalhamos com dados agrupados em classes, é mais trabalhoso porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de interpolação.
Lembrete
No nosso contexto, interpolar significa encontrar, dentro de uma faixa de valores, aquele valor que melhor corresponde às condições estabelecidas, normalmente situado entre dois outros valores conhecidos.
No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre iremos usar:
Me liE f
fhMe
me ac ant
Me= + −
×
Onde:
Me = Mediana.
lime = Limite inferior da classe que contém o elemento mediano (classe mediana).
Eme = Elemento mediano.
fac ant = Frequência acumulada crescente até a classe anterior à classe mediana.
fme = Frequência da classe mediana.
h = Amplitude da classe mediana.
O Exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em reais agrupadas por classe.
Exemplo 3. Calcular a mediana para a tabela a seguir, que apresenta a distribuição de vendas de determinada empresa.
65
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Tabela 35
Classes número
Vendas mensais em R$ Quantidade de meses Frequência acumulada crescenteValor frequência
li ls fi fac
1 R$ 50.000,00 |‑‑‑‑ R$ 80.000,00 12 12
2 R$ 80.000,00 |‑‑‑‑ R$ 110.000,00 18 30
3 R$ 110.000,00 |‑‑‑‑ R$ 140.000,00 27 57
4 R$ 140.000,00 |‑‑‑‑ R$ 170.000,00 26 83
5 R$ 170.000,00 |‑‑‑‑ R$ 200.000,00 21 104
6 R$ 200.000,00 |‑‑‑‑ R$ 230.000,00 18 122
7 R$ 230.000,00 |‑‑‑‑ R$ 260.000,00 12 134
8 R$ 260.000,00 |‑‑‑| R$ 290.000,00 9 143
TOTAL 143
O elemento mediano é dado por:
E Eme me= + => =143 12
72º
O 72º elemento está na quarta classe, que chamamos de classe mediana, ou seja, a mediana é um valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação:
Me liE f
fhMe
me ac ant
Me= + −
× = + −
×. .140 00072 57
2630 0000 157 307 69=> =Me . ,
Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$ 157.307,69, e 50%, abaixo desse valor.
Exemplo de aplicação
6. Uma pequena agência de publicidade relacionou, na tabela seguinte, o custo das suas 120 últimas campanhas publicitárias:
Tabela 36
Classes Custo das campanhas publicitárias Quantidade de campanhas publicitárias (frequência simples)
A R$ 5.000 ï‑‑‑‑ R$ 10.000 12
B R$ 10.000 ï‑‑‑‑ R$ 15.000 15
C R$ 15.000 ï‑‑‑‑ R$ 20.000 18
D R$ 20.000 ï‑‑‑‑ R$ 25.000 23
E R$ 25.000 ï‑‑‑‑ R$ 30.000 25
F R$ 30.000 ï‑‑‑‑ R$ 35.000 14
G R$ 35.000 ï‑‑‑‑ R$ 40.000 13
66
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Nessas condições podemos afirmar que o custo mediano das campanhas publicitárias dessa agência é de aproximadamente:
A) R$ 22.370
B) R$ 22.500
C) R$ 23.370
D) R$ 25.833
E) R$ 20.833
5.1.3 Moda
O conceito de moda é o mais simples entre as medidas estatísticas. Trata‑se do valor que mais vezes se repete numa distribuição de frequências, ou seja, aquele dotado de maior frequência.
O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato: decorre de simples observação, como mostra o Exemplo 1; já para dados agrupados necessitamos adotar algumas recomendações feitas por estatísticos renomados. No Exemplo 2, apresentamos um cálculo deste último tipo de distribuição.
Exemplo 1. Calcular a moda para os conjuntos de dados mostrados a seguir, referentes ao consumo de rolamentos (em unidades) em várias linhas de produção.
Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28}
A moda evidentemente é: Mo = 25
Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12}
Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal.
Linha C: {15; 18; 25; 32; 43; 50; 61}
Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal.
67
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Tabela 37
Quantidade de rolamentos conumidos
Número de vezes em que ocorreu o consumo
xi fi
Valor Frequência
8 18
10 25
12 32
13 45
15 28
16 21
17 12
21 8
A moda é o valor de maior frequência; portanto, para a linha D, teríamos Mo = 13
Exemplo de aplicação
7. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela que segue:
Tabela 38
12% 13% 18% 9% 10% 11%
13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento modal dessas aplicações é de:
A) 18%
B) 13%
C) 15%
D) 12%
E) 16%
8. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção.
68
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Tabela 39
Número de defeitos diários
Número de dias
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
Nessas condições, o número modal de defeitos diários é de aproximadamente:
A) 7,0
B) 6,0
C) 9,0
D) 8,0
E) 8,7
Exemplo 2. Calcular a moda para a distribuição de rendas familiares apresentada na tabela a seguir.
Classes número
Rendas familiares mensais em R$ Quantidade de meses
Valor Frequência
li ls fi
1 R$ 650,00 |‑‑‑‑ R$ 1.100,00 16
2 R$ 1.100,00 |‑‑‑‑ R$ 1.550,00 21
3 R$ 1.550,00 |‑‑‑‑ R$ 2.000,00 28
4 R$ 2.000,00 |‑‑‑‑ R$ 2.450,00 31
5 R$ 2.450,00 |‑‑‑‑ R$ 2.900,00 18
6 R$ 2.900,00 |‑‑‑‑ R$ 3.350,00 16
7 R$ 3.350,00 |‑‑‑‑ R$ 3.800,00 12
Total 142
69
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda?
Normalmente esse cálculo pode ser feito por três recomendações diferentes: as formulas de Czuber, King e Pearson, que utilizaremos a seguir.
Observação
Recomendação é diferente de equacionamento matemático. Decorre de estudos, normalmente empíricos, que apresentam validade prática, mas não exatidão matemática. São, portanto, aproximações.
Recomendação de Czuber
Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4, como já falamos. Em seguida aplicamos a seguinte fórmula:
Mo lif f
f f f fhMo
Mo ant
Mo ant Mo post= + −
− + −
×( )( ) ( )
Onde:
Mo = Moda.
Limo = Limite inferior da classe modal.
fmo = Frequência da classe modal.
fant = Frequência da classe imediatamente anterior à classe modal.
fpost = Frequência da classe imediatamente posterior à classe modal.
h = Amplitude da classe modal.
No nosso exemplo, ficaria:
Mo Mo R= + −−( ) + −
× => =2 000
31 2831 28 31 18
450 2 034 61.( )
( )$ . ,
70
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Recomendação de King
Como no cálculo anterior, para utilizarmos a recomendação de King, devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula:
Mo lif
f fhMo
post
ant post= +
+
×
Onde:
Mo = Moda.
limo = Limite inferior da classe modal.
fant = Frequência da classe imediatamente anterior à classe modal.
fpost = Frequência da classe imediatamente posterior à classe modal.
h = Amplitude da classe modal.
No nosso exemplo ficaria:
Mo Mo R= ++
× => =2 00018
28 18450 2 176 09. $ . ,
Recomendação de Pearson
No caso de Pearson, a recomendação parte de conceito diferente do adotado nas anteriores. Baseia‑se no uso da média e da mediana:
Mo Me X= × − ×3 2
Onde:
Mo = Moda.
Me = Mediana.
X = Média.
71
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
No nosso exemplo teríamos:
Me = R$ 2.094,36
X = R$ 2.123,59
Logo, a moda seria:
Mo = 3 x 2.094,36 ‑ 2 x 2.123,59 => Mo = R$ 2.035,90
Cada recomendação resultou em um valor diferente. Isso ocorre porque são recomendações que partem de considerações diferentes. A experiência nos ensina qual é a melhor recomendação a utilizar em cada caso prático.
Exemplo de aplicação
9. Uma pequena agência de publicidade relacionou na seguinte tabela o custo das suas 120 últimas campanhas publicitárias:
Tabela 40
Classes Custo das campanhas publicitárias (limites)
Quantidade de campanhas publicitárias
(frequência simples)
A R$ 5.000 |‑‑‑‑ R$ 10.000 12
B R$ 10.000 |‑‑‑‑ R$ 15.000 15
C R$ 15.000 |‑‑‑‑ R$ 20.000 18
D R$ 20.000 |‑‑‑‑ R$ 25.000 23
E R$ 25.000 |‑‑‑‑ R$ 30.000 25
F R$ 30.000 |‑‑‑‑ R$ 35.000 14
G R$ 35.000 |‑‑‑‑ R$ 40.000 13
Nessas condições, podemos afirmar que o custo modal (pelo Método de King) das campanhas publicitárias dessa agência é de aproximadamente:
A) R$ 27.500
B) R$ 30.000
C) R$ 28.370
D) R$ 25.000
E) R$ 26.892
72
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
O uso de cada uma dessas medidas depende da situação prática que se apresenta. Bruni (2007) apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no quadro a seguir:
Quadro 2
Medida de posição Vantagens Desvantagens
Média
É de fácil compreensão, podendo ser calculada diretamente usando‑se calculadoras apropriadas.
É afetada por valores extremos da série, não representando com precisão a distribuição em que esses valores ocorrem com frequencia acentuada.
Depende de todos os valores da distribuição, usando todos os dados disponíveis.
É necessário conhecer todos os valores da distribuição.
Evidencia bastante estabilidade de amostra para amostra.
A média não tem, necessáriamente, existência real.
Possibilita a manipulação de dados, com cálculo de médias combinadas
Pode ser obtida uma média de número fracionario inexistente, por exemplo, 6,7 alunos.
Pode ser facilmente incluida em equações matemáticas
Mediana
Mesmo que alguns valores da série sejam modificados, ela pode manter‑se inalterada
Se for determinada a mediana dos grupos separados, não será encontrada a mediana do grupo.
Os valores extremos não interferem no seu resultado, por isso é indicada quando existem valores discrepantes.
Mesmo que os valores mais altos ou mais baixos da série não estejam definidos, ela pode ser determinada.
Pode ser utilizada para dados que têm a possibilidade de ser ordenados.
Moda
Caso algum valor da série seja modificado, não necessariamente a moda se alterará.
A moda tem de ter, necessariamente, um valor real, já que ela é representada por algum valor da série.
Os valores extremos não interferem no seu resultado.
Quando utilizadas para calcular distribuições de classe aberta, não pode ser determinada a moda empregando‑se algum procedimento aritmético elementar.
Pode ser calculada em distribuições que possuam classe indeterminada.
Fonte: Bruni (2007).
5.2 Medidas de dispersão
As medidas de dispersão completam a informação contida nas medidas de posição, revelando o afastamento ou o desvio dos elementos do valor central. Quanto menor for a dispersão de uma amostra, maior será a qualidade da informação contida na medida de posição, ou, em outras palavras, menor a margem de erro que será assumida, considerando a medida de posição como representante de toda a amostra.
73
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Essas medidas, também chamadas de medidas de variabilidade, caracterizam a homogeneidade ou heterogeneidade da amostra. Quanto menor o valor, mais homogênea a amostra será.
Existem basicamente dois grandes grupos de medidas de dispersão:
• medidas de dispersão absolutas: levam em conta a dispersão propriamente dita;
• medidas de dispersão relativas: levam em conta, simultaneamente, uma medida de posição e a medida de dispersão correspondente. São úteis para efetuarmos comparações entre amostras.
O objetivo deste tópico é tomarmos contato com ambos os grupos.
5.2.1 Medidas de dispersão absolutas
5.2.1.1 Amplitude total
A amplitude total (AT) já é nossa conhecida e é a mais elementar das medidas de dispersão. É extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos são muito grandes ou muito pequenos. Portanto, é mais utilizada quando as distribuições apresentam certa homogeneidade. Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas diferentes empresas, A e B, com os seguintes valores (dados em porcentagem):
Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6}
Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8}
As amplitudes seriam, respectivamente, de 45,1 – 18,0 = 27,1% para as ações da empresa A e de 25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras, as variações máximas seriam de 27,1% para as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação é maior para a empresa A do que para a empresa B.
5.2.1.2 Desvio médio
Definido como a média aritmética do módulo dos desvios dos elementos em relação à média destes.
Lembrete
Módulo ou valor absoluto de um número é a distância deste número para zero, independentemente do sinal, ou seja, módulo de um número será o próprio número, se ele for positivo, ou seu simétrico (positivo), se for negativo.
74
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Saiba mais
Os conceitos básicos sobre módulo ou valor absoluto podem ser revistos no seguinte artigo:
MIRANDA, D. Definição de módulo de um número real. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/definicao‑modulo‑um‑numero‑real.htm>. Acesso em: 6 dez. 2013.
Entende‑se por desvio a diferença entre o valor de um elemento da amostra e a média dessa mesma amostra:
d x Xi i= −
Portanto, o desvio médio será dado pela fórmula:
dmd
Nin
i= =Σ 1| |
O exemplo a seguir deixará mais claro esse processo.
Exemplo 1. Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um dos valores. Depois, somaremos o módulo desses valores dividindo‑os pelo número total de elementos da amostra. A tabela a seguir mostra passo a passo esses cálculos:
Tabela 41
Ordem dos elementos
Valoresxi
Desviosdi = xi - X
Módulo dos desvios| di = xi - X |
1 18 18 ‑ 27 = ‑9 9
2 21 21 ‑ 27 = ‑6 6
3 22 22 ‑ 27 = ‑5 5
4 27 27 ‑ 27 = 0 0
5 28 28 ‑ 27 = 1 1
6 29 29 ‑ 27 = 2 2
7 33 33 ‑ 27 = 6 6
8 38 38 ‑ 27 = 11 11
Soma 216 0 40
Média ( X ) 216/8=27 Desvio médio (dm) 40/8 = 5
Observe que a soma dos desvios é zero. O próprio conceito de média (valor equidistante de todos os elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos
75
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
o módulo dos desvios. Para ficar mais claro, veja a seguir os cálculos feitos, utilizando‑se das fórmulas informadas:
Cálculo da média:
Xx
NX Xi= ⇒ = ⇒ =Σ 216
827
Cálculo do desvio médio:
dmd
Ndm dmi
ni= => = => ==∑ 1 40
85
| |
Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo processo de cálculo, evidentemente, com alterações nas fórmulas de cálculo, introduzindo o conceito de frequência simples, como mostramos a seguir:
dmd f
fi
ni i
i
ni
=×
=
=
∑∑
1
1
| |
Observar que, para dados agrupados em classes, o cálculo dos desvios é dado por:
d pm Xi i= −
Os exemplos a seguir demonstram esses cálculos.
Exemplo 2. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal.
Tabela 42 – Distribuição de acidentes por dia – Estrada X
Número de acidentes diários Dias pesquisados Valor x
frequência Desvios Módulo dos desvios
Módulo dos desvios x
FrequênciaValor Frequência
xi fi xi.fi di = xi ‑ X | di = xi ‑ X | | di | x fi
0 12 0 ‑3,6 3,6 43,5
1 15 15 ‑2,6 2,6 39,4
2 28 56 ‑1,6 1,6 45,6
4 23 92 0,4 0,4 8,6
5 19 95 1,4 1,4 26,1
6 8 48 2,4 2,4 19,0
8 6 48 4,4 4,4 26,2
76
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
10 4 40 6,4 6,4 25,5
11 2 22 7,4 7,4 14,7
12 1 12 8,4 8,4 8,4
Somas 118 428 257,0
Média 3,6 Desvio médio 2,2
dmd f
fdm dmi
ni i
i
ni
=×
=> = => ==
=
∑∑
1
1
257118
2 2| |
,
Exemplo 3. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea.
Tabela 43 – Distribuição de horas de manutenção – Aero X
ClassesLimites de classes
Pontos médios
de classe
Manutenções pesquisadas
Valor x frequência Desvios Módulo dos
desvios
Módulo dos desvios x
frequência
Valor Frequência
li ls pmi fi pmi.fi di = xi - X | di = xi - X | | di | x fi
1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 4,1 106,0
2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,1 21,5
3 6 |‑‑‑ 9 7,5 16 120 1,9 1,9 30,8
4 9 |‑‑‑ 12 10,5 10 105 4,9 4,9 49,2
5 12 |‑‑| 15 13,5 6 81 7,9 7,9 47,5
Somas 78 435 255,1
Média 5,6 Desvio médio 3,3
dmd f
fdm dmi
ni i
i
ni
=×
=> = => ==
=
∑∑
1
1
255 178
3 3| | ,
,
5.2.1.3 Variância
A definição de desvio médio leva em consideração os desvios dos elementos tomados à primeira potência. Matematicamente, demonstra‑se que os efeitos de desvio são mais bem‑representados quando tomados ao quadrado.
Observação
Dois motivos justificam os desvios ao quadrado: a soma dos quadrados dos desvios tomados ao quadrado é mínima; e, elevando ao quadrado, resolvemos o problema de alguns desvios serem positivos e outros negativos, gerando soma algébrica zero.
77
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Essa consideração nos leva à definição das duas mais importantes medidas de variabilidade absolutas: a variância e o desvio‑padrão, que veremos em seguida.
A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a mesma definição do desvio médio, alterando‑se apenas a potência dos desvios:
Sd
Ni
ni2 12
1=
−=∑
Observação
O denominador N – 1 justifica‑se pelos chamados graus de liberdade, que podem ser entendidos com o número de espaços entre os dados. No decorrer do curso, utilizaremos a fórmula apresentada para amostras e a mesma fórmula com denominador igual a N para populações.
No caso em que estivermos trabalhando com dados agrupados, a fórmula, naturalmente, deverá incluir o conceito de frequência simples, ou seja:
Sd f
fi
ni i
i
ni
2 12
11
=×
−=
=
∑∑
Os Exemplos de 1 a 3 no próximo subtópico mostram o cálculo da variância nos vários casos possíveis.
5.2.1.4 Desvio‑padrão
O cálculo ou a análise da variância tem um grande inconveniente prático: apresenta unidades ao quadrado em relação à medida de tendência central. Por exemplo, suponha que queiramos descrever uma amostra de salários de uma empresa. Poderíamos afirmar que o salário médio da empresa é de 1.340 reais, e a variância, de 11.025 reais ao quadrado.
Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante que resultou dos cálculos. Para contornar esse problema, define‑se a mais utilizada das medidas de variabilidade: o desvio‑padrão.
Conceitualmente, o desvio‑padrão é a raiz quadrada da variância e é simbolizado pela letra S (maiúscula). Dessa forma, é calculado pelas fórmulas:
Sd
Ni
ni=
−=∑ 1
2
1
78
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
para dados isolados e
Sd f
fi
ni i
i
ni
=×
−=
=
∑∑
12
11
para dados agrupados em classes ou não.
Nos Exemplos de 1 a 3 a seguir, são calculados os valores do desvio‑padrão e da variância, de maneira semelhante ao que foi feito anteriormente para o desvio médio. Observe que o cálculo obedece aos seguintes passos, em ambos os casos:
• calcular a média da distribuição;
• calcular os desvios de cada elemento;
• calcular o quadrado dos desvios;
• somar o quadrado dos desvios (usando o conceito de frequência, caso sejam dados agrupados);
• dividir a soma obtida pelo número de elementos menos 1, obtendo‑se a variância;
• extrair a raiz quadrada, obtendo‑se o desvio‑padrão.
Exemplo 1. Calcular a média e o desvio‑padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
Tabela 44
Ordem dos elementos
Valoresxi
Desviosdi = xi - X
Desvios ao quadrado di
2
1 18 18 ‑ 27 = ‑9 81
2 21 21 ‑ 27 = ‑6 36
3 22 22 ‑ 27 = ‑5 25
4 27 27 ‑ 27 = 0 0
5 28 28 ‑ 27 = 1 1
6 29 29 ‑ 27 = 2 4
7 33 33 ‑ 27 = 6 36
8 38 38 ‑ 27 = 11 121
Soma 216 0 304
Média 216/8=27Variância 304/7 = 43,4
Desvio‑padrão 6,6
79
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Cálculo da média:
Xx
NX Xi= ⇒ = ⇒ =Σ 216
827
Cálculo da variância:
Sd
NS Si
ni2 12
2 2
13048 1
43 4=−
=> =−
=> ==∑,
Cálculo do desvio‑padrão:
Sd
NS S Si
ni=
−=> =
−=> = => ==∑ 1
2
13048 1
43 4 6 6, ,
Mo = 26.892
Exemplo de aplicação
10. As últimas dez ligações telefônicas para um call center duraram, em minutos, os seguintes valores:
Tabela 45
15 12 16 18 14
11 17 16 12 13
Para esses dados, podemos dizer que o valor aproximado do desvio‑padrão é:
A) 3,0
B) 3,2
C) 1,6
D) 2,4
E) 2,2
80
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Exemplo 2. Calcular a variância e o desvio‑padrão da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal.
Tabela 46 – Distribuição de acidentes por dia – Estrada X
Número de acidentes diários Dias pesquisados Valor
x Frequência
Desvios Quadrado dos desvios
Quadrado dos desvios x FrequênciaValor Frequência
xi fi xi.fi di = xi ‑ X di2 di
2 x fi
0 12 0 ‑3,6 13,2 157,9
1 15 15 ‑2,6 6,9 103,5
2 28 56 ‑1,6 2,6 74,1
4 23 92 0,4 0,1 3,2
5 19 95 1,4 1,9 35,8
6 8 48 2,4 5,6 45,0
8 6 48 4,4 19,1 114,7
10 4 40 6,4 40,6 162,5
11 2 22 7,4 54,4 108,7
12 1 12 8,4 70,1 70,1
Somas 118 428 875,6
Média 3,6 Variância 7,5
Desvio médio 2,7
Cálculo da variância:
Sd f
fS Si
ni i
i
ni
2 12
1
2 2
1
875 6118 1
7 5=×
−=> =
−=> ==
=
∑∑
,,
Cálculo do desvio‑padrão:
Sd f
fS S Si
ni i
i
ni
=×
−=> =
−=> = => ==
=
∑∑
12
11
875 6118 1
7 5 2 7,
, ,
Exemplo de aplicação
11. A CIPA de uma empresa relacionou o número de acidentes ocorridos nos últimos seis anos, montando a seguinte tabela:
81
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Tabela 47
Número de acidentes por mês Número de meses
0 38
1 12
2 9
3 7
4 4
5 2
O desvio‑padrão dos acidentes nessa empresa é de:
A) 0,4
B) 0,5
C) 0,6
D) 0,7
E) 0,8
Exemplo 3. Calcular o desvio‑padrão da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea.
Tabela 48 – Distribuição das horas de manutenção – Aero X
ClassesLimites de
classes
Pontos médios de
classe
Manutençõespesquisadas Valor x
Frequência DesviosQuadrado
dos desvios
Quadrado dos
desvios x FrequênciaValor Frequência
li ls pmi fi pmi.fi di = xi - X di2 di
2 x fi
1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 16,6 432,2
2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,2 23,2
3 6 |‑‑‑ 9 7,5 16 120 1,9 3,7 59,2
4 9 |‑‑‑ 12 10,5 10 105 4,9 24,2 242,4
5 12 |‑‑| 15 13,5 6 81 7,9 62,8 376,7
Somas 78 435 1133,5
Média 5,6 Variância 14,7
Desvio‑padrão 3,8
82
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Cálculo da variância:
Sd f
fS Si
ni i
i
ni
2 12
1
2 2
1
1133 578 1
14 7=×
−=> =
−=> ==
=
∑∑
,,
Cálculo do desvio‑padrão:
Sd f
fS S Si
ni i
i
ni
=×
−=> =
−=> = => ==
=
∑∑
12
11
1133 578 1
14 7 3 8,
, ,
O desvio‑padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa a quantidade de elementos da amostra ou da população que se situam em torno da média.
O mais comum, na Estatística, é que essa relação entre média e desvio‑padrão seja feita pela chamada distribuição normal, à qual nós voltaremos na disciplina Estatística Aplicada. Nessa relação, válida na maior parte dos casos práticos, há os seguintes intervalos:
• entre a média mais uma vez o desvio‑padrão e a média menos uma vez o desvio‑padrão, estão contidos 68% dos elementos da amostra ou da população;
• entre a média mais duas vezes o desvio‑padrão e a média menos duas vezes o desvio‑padrão, estão contidos 85% dos elementos da amostra ou da população;
• entre a média mais três vezes o desvio‑padrão e a média menos três vezes o desvio‑padrão, estão contidos 99,74% dos elementos da amostra ou da população;
• entre a média mais quatro vezes o desvio‑padrão e a média menos quatro vezes o desvio‑padrão, estão contidos 100% dos elementos da amostra ou da população.
Exemplo 4. Um estudo estatístico com 4.850 alunos de Administração da Produção de uma universidade mostrou que a nota final média deles foi de 5,3 com desvio‑padrão de 1,2. Quantos alunos tiveram médias finais entre 4,1 e 6,5?
Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio‑padrão (5,3 – 1,2 = 4,1) e à média mais um desvio‑padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão contidos nesse intervalo, ou seja: 68% de 4.850 são 3.298 alunos.
Como 60% de 4.850 é 3.298, podemos afirmar que essa é a quantidade de alunos que tiveram notas entre 4,1 e 6,5.
83
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Exemplo de aplicação
12. Certa repartição pública anotou e relacionou os tempos de inspeção que faz nas empresas, chegando à seguinte distribuição de frequências:
Tabela 49
Tempo de inspeção em minutos
Número de inspeções realizadas
10 ï‑‑‑‑ 20 3
20 ï‑‑‑‑ 30 6
30 ï‑‑‑‑ 40 15
40 ï‑‑‑‑ 50 36
50 ï‑‑‑‑ 60 19
O desvio‑padrão do tempo de inspeção nessa repartição é:
A) 10,2
B) 9,5
C) 12,3
D) 11,9
E) 8,3
5.2.2 Medidas de dispersão relativas
A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é por meio de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta (desvio médio, variância ou desvio‑padrão). O mais comum é o par de informações média – desvio‑padrão.
Frequentemente, no entanto, é interessante utilizar as chamadas medidas de dispersão relativas, que analisam simultaneamente uma medida de posição e a mediada de dispersão correspondente. São especialmente interessantes essas medidas quando fazemos comparações entre amostras diferentes.
A rigor, podemos obter essas medidas, costumeiramente chamadas de coeficientes de variação, dividindo uma medida de dispersão por uma medida de posição; no entanto, as mais comuns são:
1. Coeficiente de variação de Pearson: divisão do desvio‑padrão pela média:
CvS
XCv
S
Xp p= = ×ou 100
84
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
2. Coeficiente de variação de Thorndike: divisão do desvio‑padrão pela mediana:
CvS
MeCv
SMep p= = ×ou 100
O Exemplo 1 a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática.
Exemplo 1. Um especialista estudou, estatisticamente, dois tipos de investimentos, chegando às conclusões da tabela que segue. Qual é o investimento que apresenta menor risco?
EstatísticasAplicações
ObservaçõesX Y
Retorno esperado 12% 20%
O especialista teria chegado a essas conclusões através de um estudo estatístico no qual pesquisou e resumiu os retornos ocorridos no passado, conforme vimos no item 3.1.1
Desvio‑padrão 9% 10%Analogamente o especialista teria calculado o desvio‑padrão conforme vimos no item 3.2.1.4
Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele preferiria a aplicação X, uma vez que essa aplicação tem um desvio‑padrão menor que Y (9% versus 10%). Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”. No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes:
EstatísticasAplicações
X Y
Retorno esperado 12% 20%
Desvio‑padrão 9% 10%
Coeficiente de Variação de Pearson 75% 50%
Cv Cvpa pa= × => =9
12100 75%
Cv Cvpb pa= × => =10
20100 50%
A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a dispersão relativa, ou risco, das aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50% versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor porque este também considera o tamanho relativo, ou retorno esperado, das aplicações.
85
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Exemplo de aplicação
13. A tabela a seguir relaciona médias e desvios‑padrões de três diferentes amostras de investimentos feitos por um aplicador financeiro:
Tabela 50
Investimento Rendimento médio Desvio-padrão
A 18,0% 6,0%
B 14,5% 4,9%
C 9,3% 5,0%
Acerca dessas informações, não podemos dizer que:
A) A maior rentabilidade média é a do investimento C.
B) O investimento que apresenta maior homogeneidade é o investimento B.
C) O melhor compromisso entre posição e variabilidade é o do investimento C.
D) O maior coeficiente de variação é o do investimento A e vale 33,3%.
E) O coeficiente de variação do investimento C é o menor e vale 25,9%.
14. Foram comparados os dados referentes a acidentes de trabalho em dois grupos de ramos diferentes de indústria. Nas 35 indústrias do ramo A foi notada uma taxa média de 2,62 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,72. Nas 35 empresas das indústrias do ramo B foi notada taxa média de 3,10 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,80. Com base nesses dados, informou‑se:
I – Em termos absolutos, as empresas do ramo A apresentaram menor variação na taxa de acidentes porque o desvio‑padrão delas é menor.
II – Em termos relativos, as empresas do ramo A também apresentam menor variação na taxa de acidentes, porque têm maior coeficiente de variação.
III – As empresas do ramo B apresentam menor variação relativa, pois têm menor coeficiente de variação.
Em relação a essas afirmativas, podemos garantir que:
A) Todas estão corretas.
B) Estão corretas as afirmativas I e II.
86
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
C) Estão corretas as afirmativas I e III.
D) Estão corretas as afirmativas II e III.
E) Todas estão erradas.
6 RELAÇÕES GRÁFICAS ENTRE AS MEDIDAS ESTATÍSTICAS
Nos estudos e análises estatísticos, é interessante e importante visualizar as informações contidas nos dados por meio do uso dos diversos gráficos, assunto que tratamos na unidade I.
Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá tirar conclusões importantes no tópico da Estatística Indutiva, porque, via de regra, ocorre de modo repetitivo.
Observações do padrão de comportamento das distribuições mostram que grande parte delas tende a apresentar‑se da maneira conhecida como distribuição normal.
A figura 22 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e os mais afastados, menor frequência. Observe também a curva que se forma pela distribuição das colunas.
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105
Peso em quilos
Freq
uênc
ia s
impl
es
40
35
30
25
20
15
10
5
0
Figura 23 – Pesos corporais
No curso de Estatística Aplicada, retornaremos ao assunto, quando diremos, por exemplo, que é pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para determinar qual é essa probabilidade, se houver.
87
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva normal, curva de Gauss ou, ainda, de curva do sino.
Em teoria, espera‑se que essa curva tenha o comportamento mostrado nas curvas desenhadas em linha contínua nas Figuras 23 e 24. Na prática, porém, ocorrem deformações nessas curvas, demonstradas nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de assimetria (Figura 23) e curtose (Figura 24).
Média00 Variável
Freq
uênc
ia si
mpl
es Assimétrica positiva Assimétrica negativa
Simétrica
Figura 24 – Assimetria
Curva platicúrtica
Curva mesocúrtica
Curva leptocúrtica
Freq
uênc
ia si
mpl
es
Média Variável
Figura 25 – Curtose
6.1 Assimetria
A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa.
O grau de assimetria é dado, frequentemente, pelo chamado 1º coeficiente de Pearson:
As X MeS= −
88
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Onde:
As = Coeficiente de assimetria.
X = Média.
Me = Mediana.
S = Desvio‑padrão.
Esse coeficiente pode assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:
As = 0 – A distribuição é simétrica.
As > 0 – A distribuição é assimétrica positiva ou à direita.
As < 0 – A distribuição é assimétrica negativa ou à esquerda.
Por esse critério, costuma‑se classificar as distribuições da seguinte maneira:
Caso As ≤ ‑1: assimétrica negativa forte.
Caso ‑1 < As < 0: assimétrica negativa fraca.
Caso As = 0: simétrica.
Caso 0 < As < 1: assimétrica positiva fraca.
Caso As ≥ 1: assimétrica positiva forte.
6.2 Curtose
A curtose mede o quanto a distribuição se alonga ou se achata em relação à curva teórica. A curva teórica é chamada de mesocúrtica; as mais alongadas, de leptocúrticas; e as mais achatadas, de platicúrticas.
O grau de curtose é dado, frequentemente, pelo coeficiente:
K
d f
f
S
i i
i=
×
−
∑∑
4
4 3
89
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Onde:
K = Coeficiente de curtose.
di = Desvios.
fi = Frequências simples.
S = Desvio‑padrão.
Assim como na assimetria, também na curtose os coeficientes podem assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:
K = 0: a distribuição é mesocúrtica.
K > 0: a distribuição é leptocúrtica.
K < 0: a distribuição é platicúrtica.
Lembrete
Existem outras medidas de assimetria e curtose além das apresentadas aqui, mas que não são objeto do nosso curso.
Vamos usar o exemplo a seguir para demonstrar o cálculo da assimetria e da curtose de uma distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região.
Observando os resultados obtidos (expostos a seguir), notamos que a distribuição (e a curva dela decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a nossa direita, e que é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada da figura que segue (a curva pontilhada é a do exercício; a cheia é a padrão):
Média Variável
Freq
uênc
ia si
mpl
es
Figura 26 – Assimetria e curtose
90
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Tabela 51
Classes número
Consumo mensal por número
de famílias
Pontos médios
de classe
Frequência acumulada crescente
Pontos médios x
FrequênciasDesvios
Desvios ao
quadrado
Desvio ao
quadrado x
Frequências
Desvios à quarta
potência
Desvios à quarta potência x
Frequências
Valor Frequência
li | ‑‑‑‑ ls fi pmi fac pmi x fi di = xi ‑ X di2 di
2 x fi di4 di
4 x fi
1 0 | ‑‑‑‑ 50 158 25 158 3.950 ‑192 36.944 5.837.189 1.364.876.602 215.650.503.107
2 50 | ‑‑‑‑ 100 100 75 258 7.500 ‑142 20.223 2.022.335 408.984.000 40.898.400.046
3 100 | ‑‑‑‑ 150 112 125 370 14.000 ‑92 8.502 952.277 72.291.984 8.096.702.259
4 150 | ‑‑‑‑ 200 164 175 534 28.700 ‑42 1.782 292.180 3.174.048 520.543.855
5 200 | ‑‑‑‑ 250 175 225 709 39.375 8 61 10.623 3.685 644.833
6 250 | ‑‑‑‑ 300 280 275 989 77.000 58 3.340 935.149 11.154.389 3.123.228.929
7 300 | ‑‑‑‑ 350 84 325 1.073 27.300 108 11.619 975.991 134.999.655 11.339.970.993
8 350 | ‑‑‑‑ 400 63 375 1.136 23.625 158 24.898 1.568.577 619.912.976 39.054.517.468
9 400 | ‑‑‑‑ 450 56 425 1.192 23.800 208 43.177 2.417.921 1.864.267.846 104.398.999.377
10 450|
‑‑‑‑ |500 53 475 1.245 25.175 258 66.456 3.522.183 4.416.437.760 234.071.201.262
Somatórios 1.245 270.425 18.534.426 657.154.712.129
• Cálculo da média:
x f
fi i
i= =>= =>=∑
∑270 4251 245
217 2.
.,
• Cálculo do desvio‑padrão:
Sd f
fS S Si
ni i
i
ni
=×
−=> =
−=> = => ==
=
∑∑
12
11
18 534 4261 245 1
14 899 1. ..
. 222 1,
• Cálculo da mediana:
— elemento mediano:
EN
E Eme me me= + => = + => =12
1 245 12
623.
º
— mediana:
Me liE f
fh MeMe
me ac ant
Me= + −
× = + −
× =>200623 534
17550 == 225 4,
91
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Cálculo da assimetria:
AsX
SAs As= − => = − => = −Me 217 2 225 4
122 10 067
, ,,
,
Portanto, a curva é fracamente assimétrica negativa.
• Cálculo da curtose:
K
d f
f
SK K
i i
i=
×
− => = − => = −
∑∑
4
4 43
657 154 712 1291245
122 13 0 6
. . .
( , ), 225
Portanto, a curva é platicúrtica.
Exemplo de aplicação
15. Com relação à assimetria e à curtose das distribuições, foram feitas as seguintes afirmações:
I – Uma curva assimétrica positiva tem uma média superior à curva simétrica.
II – Curvas platicúrticas têm desvio‑padrão maior do que curvas leptocúrticas.
III – Curvas com coeficiente menor do que zero têm deslocamento para a esquerda em relação à curva simétrica.
IV – Análise da curtose consiste em estudar o achatamento ou o alongamento da distribuição.
Em relação a essas afirmações, podemos dizer que:
A) Todas estão incorretas.
B) Existe uma alternativa incorreta.
C) Existem duas alternativas incorretas.
D) Existem três alternativas incorretas.
E) Todas estão corretas.
16. Duas distribuições foram estudadas e chegou‑se aos seguintes coeficientes mostrados a seguir:
92
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Tabela 52
Distribuição Coeficiente de assimetria
Coeficiente de curtose
A ‑ 1,34 1,89
B 0,87 ‑1,34
A partir desses coeficientes, não podemos afirmar:
A) A distribuição A tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
B) A distribuição B tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
C) Ambas as distribuições não são simétricas nem mesocúrticas.
D) A curva A é mais alongada do que a curva B.
E) As duas curvas têm assimetrias opostas.
7 TEORIA ELEMENTAR DAS PROBABILIDADES
Em Estatística, quando nos referimos a uma previsão de comportamento de uma população a partir do conhecimento de uma amostra, ou, ao contrário, à previsão do comportamento esperado de uma amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra provavelmente antes de cada informação.
Assim, por exemplo, quando após uma pesquisa eleitoral o veículo de comunicação informa que se a eleição fosse naquele momento o candidato X teria 35% dos votos, ele quer dizer que provavelmente o candidato X tivesse essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer que certamente ocorrerá. Uma tolerância nessa informação é esperada.
Neste tópico veremos o que significa e como são calculadas as probabilidades, ramo de estudo da Matemática, e não exatamente da Estatística. Inicialmente iremos verificar casos absolutamente teóricos e posteriormente evoluiremos para situações mais próximas da realidade.
Tentaremos utilizar o raciocínio lógico para resolver as questões e, no final do tópico, faremos uma revisão teórica, apresentando os conceitos e as fórmulas utilizadas na Teoria Elementar das Probabilidades. O importante é você dominar o mecanismo de cálculo da probabilidade.
7.1 Definições de probabilidades
Caso você procure a definição de probabilidade em um dicionário, o Houaiss (2009), por exemplo, irá encontrar algo do tipo:
93
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
“Probabilidade: característica do que é provável; perspectiva favorável de que algo venha a ocorrer; possibilidade, chance.”
Como é fácil de notar, essa definição não acrescenta nada ao conceito intuitivo que temos de probabilidade; isso porque esse conceito é circular, ou seja, define‑se probabilidade utilizando‑se seus próprios termos.
Desenvolve‑se atualmente uma abordagem axiomática na definição de probabilidade, mantendo‑se seu conceito indefinido, algo semelhante ao que acontece em Geometria com as definições de ponto e reta.
Estatisticamente, no entanto, adotam‑se três abordagens diferentes na definição de probabilidades: a abordagem clássica, a abordagem como frequência relativa e a abordagem subjetiva.
Antes de seguirmos, no entanto, na definição de probabilidade, é necessário definir alguns termos que serão utilizados.
• Experimento: significará, para nós, observar ou executar determinado processo sob certas circunstâncias controladas. Todas as nossas questões e problemas trabalhados em estatísticas são experimentos que devem ser corretamente definidos. Podemos citar alguns exemplos para clarear nosso entendimento. O comportamento das ações numa Bolsa de Valores; a produtividade de um processo; a variação de estoques ao longo de determinado período; o controle de qualidade dos produtos recebidos por um empresa; os resultados de um jogo, por exemplo, a Mega‑Sena, entre outros, são exemplos de experimentos.
• Experimento aleatório: são aqueles que, apesar de serem repetidos exatamente da mesma maneira, não apresentam resultados obrigatoriamente iguais. Por exemplo: você pode jogar um dado exatamente da mesma maneira duas vezes, e nada garantirá que irá obter o mesmo resultado. Rigorosamente, experimentos aleatórios são, exclusivamente, jogos de azar. Em Administração, vamos trabalhar, normalmente, com experimentos aproximadamente aleatórios, os quais, apesar de apresentarem determinado grau de aleatoriedade, não são exclusivamente aleatórios. Por exemplo, o jogo de cartas conhecido como 21 é aleatório; já o “buraco” é aproximadamente aleatório.
Saiba mais
A obra a seguir é um interessante estudo sobre o efeito do acaso (aleatoriedade) nas nossas vidas. Vale a pena ler:
MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.
94
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
• Espaço amostral (ou conjunto universo ou espaço das probabilidades): é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de um jogo de um dado “honesto” é dado por:
S = {1, 2, 3, 4, 5, 6}. O dado deve ser “honesto”; se não for, o experimento não será aleatório.
• Evento: é um determinado subconjunto formado por um ou mais elementos do espaço amostral. Por exemplo, num jogo de dados, o evento número primo é formado por:
E = {1, 2, 3, 5}
Observação
Por definição, um número positivo será primo se for maior do que 1 e for divisível apenas por 1 e por ele mesmo. Por essa definição, o número 1 seria primo, apesar de que, por conveniência, normalmente não é considerado como tal. Neste material, será incluído entre os números primos.
7.2 Cálculos das probabilidades elementares
Usando esses conceitos, podemos determinar estatisticamente o termo probabilidade.
• Abordagem clássica: probabilidade é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um determinado evento e o número total de elementos (ou resultados) do espaço amostral, ou seja:
P An An S
( )( )( )
=
Sendo:
P(A) a probabilidade de ocorrer o evento A.
n(A) o número de elementos favoráveis ao evento A.
n(S) o número total de elementos do espaço amostral.
Por exemplo:
Qual é a probabilidade de, ao jogarmos um dado “honesto”, obtermos um número primo?
E A n An meros primosú : , , , ( )= { }∴ =12 3 5 4 S n A= { }∴ =12 3 4 5 6 6, , , , , ( )
95
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
P An An S
P A( )( )( )
( ) , , %= ⇒ = = =46
0 667 66 7
• Abordagem como frequência relativa: probabilidade é a razão entre o número de vezes em que determinado resultado ocorre, quando repetimos o experimento aleatório (ou aproximadamente aleatório) por um número elevado de vezes. Por exemplo: jogamos uma moeda mil vezes, e em 512 dessas vezes saiu cara. Podemos dizer, por esta definição, que a probabilidade de sair cara nessa moeda é de 512/1000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma:
P A fff
P A fRAA
TRA
( ) ( ) , , %= = ⇒ = = = =5121000
0 512 512
Esse resultado não é o mesmo que o calculado pela definição anterior (50%). Isso pode decorrer do fato de a moeda usada não ser “honesta” (portanto, com resultados aleatórios), ou do fato de o número de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade tenderá ao valor teórico de 50%, se a moeda for “honesta”.
• Abordagem subjetiva: ao contrário das definições anteriores, nesta, a probabilidade não é um valor objetivo, mas algo que indica a “crença” do analista naquela ocorrência. Evidentemente essa probabilidade não é fruto de um “palpite, um chute”, mas algo embasado em dados objetivos, mas complementados por aspectos pessoais. É o caso, por exemplo, do meteorologista que prevê 80% de chances de ocorrerem chuvas num determinado período. Esse tópico da Estatística é estudado em Análise Bayesiana de Decisão.
Durante nosso curso iremos utilizar as duas primeiras abordagens, de acordo com o campo de estudo em que estivermos. Deve‑se notar que a primeira abordagem é eminentemente teórica e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não totalmente aleatórias.
Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas, existem axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes de nos preocuparmos com a teoria envolvida, porém, iremos nos ater à lógica que permeia o cálculo de probabilidades. Para tanto, analisaremos as questões a seguir.
1. Uma moeda “honesta” é jogada uma única vez; qual é a probabilidade de que o resultado seja cara?
Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o número de elementos favoráveis ao evento cara e o número total de elementos possíveis.
Número de elementos do evento cara: n(A) = 1, porque A = {cara}
Número de elementos total: n(S) = 2, porque S = {cara; coroa}
96
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
P An An S
P cara( )( )( )
( )= ⇒ = 12
2. Duas moedas “honestas” são jogadas simultaneamente; qual é a probabilidade de que pelo menos uma seja cara?
Neste caso, o espaço amostral tornou‑se ligeiramente mais complexo:
S = {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa)
O evento pedido é:
E = {CaraCara; CaraCoroa; CoroaCara)
Logo, a probabilidade é:
Pn An S
P( )( )( )
( )pelo menos uma cara pelo menos uma cara= ⇒ = =34
00 75 75, %=
Observação
Do ponto de vista do cálculo de probabilidade, jogar simultaneamente duas moedas é o mesmo que jogar uma, anotar o resultado e depois jogar outra.
7.3 Árvores de decisões
O cálculo de probabilidades é, no fundo, um exercício de lógica, característica na qual, muitas vezes, reside sua dificuldade. Para facilitar esse raciocínio lógico, costuma‑se usar a árvore de decisões, que, por meio de uma sistemática de análise e síntese, conduz à compreensão do experimento. Trata‑se de uma ferramenta relativamente trabalhosa, mas costuma ser importante no entendimento de problemas mais complexos ou extensos. Por meio da continuação da sequência de exercícios, aprenderemos o funcionamento dessa ferramenta.
3. Quatro moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham pelo menos duas caras?
Ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas também aumentaram.
Para facilitar nosso raciocínio, introduziremos a árvore de decisões e, na sequência, a análise combinatória.
97
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
A árvore de decisões consiste em representar graficamente todas as possibilidades de resultados dos experimentos aleatórios, de modo que não percamos nenhum evento e, ao mesmo tempo, compreendamos a mecânica do experimento.
Joga‑se umamoeda “honesta”.
Os resultadospodem ser:
Coroa
Cara
Figura 27
A seguir está desenhada a árvore de decisões do experimento “jogar quatro moedas ‘honestas’ simultaneamente”. Com certeza, não esquecemos nenhum dos resultados possíveis.
Coroa
CaraCara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Cara
Coroa
Coroa
Coroa
Joga‑se uma
moeda “honesta” sucessiva‑ mente 4
vezes
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Coroa
Caminho 2
Caminho 4
Caminho 6
Caminho 8
Caminho 10
Caminho 12
Caminho 14
Caminho 16
Caminho 1
Resulta‑ dos da:
1ª moeda jogada
2ª moeda jogada
3ª moeda jogada
4ª moeda jogada
Caminho 3
Caminho 5
Caminho 7
Caminho 9
Caminho 11
Caminho 13
Caminho 15
Figura 28
De posse da árvore de decisões, conseguimos responder mais facilmente ao solicitado na Questão 3. Depois de jogarmos a moeda pela quarta vez, teremos um total de 16 soluções (caminhos) possíveis.
98
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Observe o caminho nº 1: na primeira vez em que jogamos a moeda, saiu cara; na segunda jogada, saiu cara de novo, assim como na terceira e na quarta jogada, ou seja, o caminho nº 1 formado pelos eventos sucessivos: cara – cara – cara – cara.
Da mesma forma, teremos outras 15 combinações possíveis, das quais as de números 1, 2, 3, 4, 5, 6, 7, 9, 10, 11 e 13 apresentam a resposta que desejamos, ou seja, pelo menos duas caras; as demais apresentam uma ou nenhuma cara, portanto não nos interessam. Assim, temos uma total de 16 elementos no espaço amostral, e 11 deles são favoráveis à nossa pergunta, portanto a probabilidade de que ocorra pelo menos uma cara é de 11 possibilidades em 16, ou seja:
P An An S
P( )( )( )
( ) , , %= ⇒ = = =pelo menos uma cara1116
0 6875 68 75
O número de possibilidades (ou seja, elementos) do espaço amostral cresce continuamente. Caso jogássemos uma quinta vez a moeda, teríamos 32 resultados diferentes. Uma maneira de trabalharmos com essa grande quantidade de números é o uso da análise combinatória.
Observação
Aqui trabalharemos superficialmente com esse assunto. Utilizaremos apenas as ferramentas que nos são importantes neste tópico.
Saiba mais
Com a leitura dos textos a seguir, você poderá recordar e complementar seus conhecimentos sobre análise combinatória:
MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
7.4 Análises combinatórias
O cálculo de probabilidade continuará a ser feito por meio da razão entre o número de elementos favoráveis ao evento que estamos estudando e o número total de elementos do espaço amostral. A análise combinatória nos servirá para calcular de maneira menos trabalhosa essas quantidades.
99
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Se você olhar a árvore de decisões do jogo de moedas, perceberá que o espaço amostral aumenta em número de elementos da seguinte maneira:
Tabela 53
Número de jogadas da moeda Número de resultados diferentes
1 2
2 4
3 8
4 16
É fácil notar que a relação matemática existente entre o número de jogadas e o número de resultados possíveis é de ab, onde a é o número de resultados possíveis de ocorrer numa única repetição do experimento (no caso, a = 2, porque os resultados possíveis são cara ou coroa) e b é o número de repetições do experimento (no caso da tabela anterior, temos n variando de 1 a 4). Desse modo, se quisermos saber o número de elementos do espaço amostral de seis jogadas de uma moeda, bastaria fazermos o cálculo 26 = 64 resultados diferentes.
Em análise combinatória, esse procedimento é conhecido como cálculo do número de arranjos com repetição.
Ar an xb
, =
Observação
A fórmula anterior é lida da seguinte forma: “número de arranjos com repetições de a elementos repetidos b vezes”.
Em contrapartida, observando a árvore de decisões, podemos contar o número de caras que podem aparecer na quarta jogada montando a tabela que segue.
Tabela 54
Número de coroas que apareceu
Número de caras que apareceu
“Caminhos” Quantidade de caminhos
4 0 16 1
3 1 8‑12‑14‑15 4
2 2 4‑6‑7‑10‑11‑13 6
1 3 2‑3‑5‑9 4
0 4 4 1
100
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Segundo a análise combinatória, o número de caminhos é dado pelo número de combinações, obtido por meio da fórmula:
Cn
x n xn x,!
!( )!=
−
Onde:
n = número total de repetições do experimento; no caso, n = 4 (quatro vezes em que a moeda é jogada).
x = números de resultados desejados; no caso, x varia de 0 a 4 (número de caras desejadas).
Observação
A fórmula anterior é lida da seguinte forma: “número de combinações de n elementos tomados x a x vezes”. Utiliza o conceito de fatorial (!).
Lembrete
Fatorial de um número a, simbolizado por a!, é a multiplicação de todos os números inteiros e positivos desde a unidade até o valor a, ou seja:
a! = 1 x 2 x 3 x 4 x..... x a
Por exemplo: 6! é igual a 720 porque:
6! = 1 x 2 x 3 x 4 x 5 x 6 = 720
Por definição, 0! é igual a 1.
A tabela a seguir mostra o cálculo das combinações do exemplo dado. Verifique que coincide com os números obtidos por meio da árvore de decisões.
101
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Tabela 55
Número de caras que queremos obter Fórmula do cálculo das combinações Números de
combinações obtidas
Zero cara C4 04
0 4 04
0 424
1 241,
!!
!! !
=−( ) = ( ) =
×= 1
Uma cara C4 14
1 4 14
0 124
1 64,
!!
!! !
=−( ) = ( ) =
×= 4
Duas caras C4 24
2 4 24
2 224
2 26,
!!
!! !
=−( ) = ( ) =
×= 6
Três caras C4 34
3 4 34
3 124
6 14,
!!
!! !
=−( ) = ( ) =
×= 4
Quatro caras C4 44
4 4 44
4 024
24 14,
!!
!! !
=−( ) = ( ) =
×= 1
Temos agora todas as informações necessárias para o cálculo das probabilidades envolvidas no experimento referente a “quatro jogadas sucessivas de uma moeda ‘honesta’”. A tabela a seguir resume esses valores.
Tabela 56
Eventos
Número total de resultados do espaço amostral
(número de “caminhos”) Calculado usando-se
arranjos com repetições
Número total de resultados favoráveis ao evento Calculado usando-se
combinações
Probabilidade de ocorrência
Obter zero cara 16 11
160 0625 6 25= =, , %
Obter uma cara 16 44
160 2500 25 00= =, , %
Obter duas caras 16 66
160 3750 37 50= =, , %
Obter três caras 16 44
160 2500 25 00= =, , %
Obter quatro caras 16 11
160 0625 6 25= =, , %
Somatório 100%
102
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Essa tabela resume todos os possíveis resultados do experimento de “jogar quatro vezes uma moeda ‘honesta’”. Cada um desses resultados é um evento diferente, e a probabilidade de cada um destes ocorrer é obtida pela divisão do número de vezes em que ocorre pelo número total de resultados do experimento.
O evento pedido na questão, “pelo menos duas caras”, é a soma dos eventos, encontrados no quadro anterior, “obter duas ou três ou quatro caras”, ou seja:
0,3750 + 0,2500 + 0,0625 = 0,6875 = 68,75
Como já havíamos determinado anteriormente.
Com esses conceitos podemos calcular o exemplo a seguir, mais trabalhoso:
4. Vinte moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham exatamente oito caras?
Essa questão é muito semelhante à anterior, mas envolve uma quantidade de moedas e resultados que inviabiliza o uso da árvore de decisões. Sabemos, porém, calcular questões desse tipo usando os conceitos de análise combinatória:
• O número total de resultados possíveis é o número de arranjos com repetições de vinte moedas que podem apresentar dois resultados diferentes.
Ar an xb
, . .= = =2 1 048 57620
• O número total de resultados que nos interessam é o número de combinações de vinte moedas das quais oito sejam caras.
Cn
x n xCn x, ,
!!( )!
!!( )!
!! !
. . .=−
⇒ =−
=×
=20 820
8 20 820
8 122 432 902 008.. . .
. . ..
176 640 00040 320 479 001 600
125 970×
=
• A probabilidade de ocorrer oito caras é de:
P An An S
P( )( )( )
( ).
. .,= ⇒ = =exatamente 8 caras
125 9701 048 576
0 12001 12 01= , %
Observação
Os números envolvidos no exemplo anterior são relativamente grandes, mas, com uma calculadora científica ou na planilha de Excel®, o trabalho é
103
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
relativamente simples. Mesmo o cálculo do número de combinações poderá ser facilitado se utilizarmos o conceito de simplificação, como mostrado a seguir:
C20 8
220
8 1212 13 14 15 16 17 18 19 20
1 2 3 4 5 6, ! !=
×= × × × × × × × ×
× × × × ×
••
• • •
×× × ×=
7 8 12125 970
!.
Vamos utilizar esses conhecimentos adquiridos para fazer um cálculo que talvez não deixe você satisfeito.
5. Qual é a probabilidade de se ganhar o prêmio máximo na Mega‑Sena fazendo‑se um jogo com sete dezenas?
Observe que na Mega‑Sena é necessário acertar seis dezenas para se ganhar o prêmio máximo. Caso se jogue sete dezenas, temos sete chances de acertar as seis dezenas:
Cn
x n xCn x, ,
!!( )!
!!( )!
!! !
=−
⇒ =−
=×
=×
=7 67
6 7 67
6 15040
720 17
Mas quantos resultados diferentes podem ocorrer?
Na Mega‑Sena existem sessenta números possíveis, dos quais você deve acertar seis, ou seja:
Cn
x n xCn x, ,
!!( )!
!!( )!
!! !
=−
⇒ =−
=×
=60 660
6 60 660
6 5450.063.860
Resumindo, você tem 7 chances em 50.063.860 de acertar na Mega‑Sena, o que dá uma probabilidade de:
P An An S
P( )( )( )
( ). .
= ⇒ = =ganhar na mega sena 0,00000017
50 063 86044 0,000014 = %
Melhor continuar estudando, não é?
7.5 Experimentos aproximadamente aleatórios
Até aqui, sempre que nos referimos às moedas, frisamos que eram honestas. Por que isso? Porque uma moeda “honesta” é absolutamente aleatória, ou seja, por mais que a joguemos, nunca iremos saber qual o próximo resultado que irá ocorrer, e também porque a probabilidade de cair cara numa moeda “honesta” é de 50% assim como de sair coroa.
104
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Nem sempre será assim. Poderemos ter moedas “viciadas”, e, em situações mais próximas da realidade do dia a dia, com certeza os experimentos não serão absolutamente aleatórios, mas aproximadamente aleatórios, e as probabilidades de ocorrência serão dadas pelas frequências relativas observadas.
Imagine que você tenha nas mãos uma moeda, que não sabe se é “honesta” ou “viciada”. Como poderia saber? Testando‑a, ou seja, jogando‑a repetidas vezes e anotando os resultados.
Caso os resultados tendam para 50% de sair cara e 50% de sair coroa, a moeda é “honesta”; caso contrário, é “viciada”. Obviamente, quanto maior o número de vezes que a testar, maior a segurança que terá nessa resposta.
O quadro a seguir mostra uma sucessão teórica de testes em duas moedas:
Tabela 57
Número de vezes em que a moeda foi lançada
Moeda A Moeda B
Nº de caras
Probabilidade de cara
Nº de coroas
Probabilidade de coroa
Nº de caras
Probabilidade de cara
Nº de coroas
Probabilidade de coroa
10 6 60,0% 4 40,0% 5 50,0% 5 50,0%
30 14 46,7% 16 53,3% 16 53,3% 14 46,7%
40 19 47,5% 21 52,5% 23 57,5% 17 42,5%
50 27 54,0% 23 46,0% 29 58,0% 21 42,0%
100 52 52,0% 48 48,0% 57 57,0% 43 43,0%
500 249 49,8% 251 50,2% 290 58,0% 210 42,0%
1000 505 50,5% 495 49,5% 589 58,9% 411 41,1%
10000 5010 50,1% 4990 49,9% 5809 58,1% 4191 41,9%
Algumas características importantes:
• Para poucos lançamentos, não é possível assumir se as moedas são “honestas” ou “viciadas”. O número de observações não é suficiente. Isso é constante na Estatística Indutiva. Precisamos de uma quantidade de observações mínima para chegarmos a alguma conclusão.
• À medida que o número de observações vai crescendo, cristalizamos a ideia de que a moeda A é “honesta”, e a moeda B, “viciada”. Perceba que, em dez jogadas, não há nada de estranho em obtermos seis caras e quatro coroas, mas, quando jogamos a moeda cem vezes e obtemos 57 caras, algo não acidental está ocorrendo. Não é possível que seja uma questão de “sorte” ou “azar”.
• A partir dessas observações, podemos assumir que a moeda A é “honesta” e que a probabilidade de obtermos cara é igual à de obtermos coroa, no valor de 50% (o fato de os cálculos não resultarem exatamente em 50% é efeito de variações aceitáveis).
105
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
• Já a moeda B é “viciada”: a probabilidade de obtermos cara é de 58% (aproximadamente), e a de obtermos coroa é de 42%.
A partir desses conceitos, podemos expandir um pouco mais os nossos cálculos, resolvendo a questão do próximo tópico.
7.6 Eventos soma e Eventos produto
6. Jogamos a moeda B, mencionada anteriormente, três vezes em sequência. Qual é a probabilidade de obtermos pelo menos duas caras?
Vamos entender a questão por meio do uso da árvore de decisões. É a mesma árvore usada anteriormente, com uma diferença: sobre cada decisão (simbolizada pelas flechas) colocaremos a probabilidade correspondente:
Cada “caminho” será formado por várias decisões em sequência, cada uma delas com probabilidades diferentes. A probabilidade de ocorrência de um caminho em especial é dada pela multiplicação das probabilidades individuais. A isso chamamos evento produto.
Observe, na figura a seguir, o cálculo dos vários caminhos:
Cara
0,58
0,58
0,58
0,58
0.42
0.42
0.42
0.42
0.42
0.42
0.42
0,58
0,58
0,58
Cara
Cara
Cara
Cara
Cara
Cara
Coroa
Coroa
Coroa
Joga‑se uma
moeda “viciada”
sucessiva‑ mente 4
vezes
Coroa
Coroa
Coroa
Coroa
Caminho 2 0.58 x 0.58 x 0.42 = 0.582 x 0.42 = 0.1413
Probabilidades de cada caminho:
Somatório = 1 ou 100%
Caminho 4 0.58 x 0.42 x 0.42 = 0.58 x 0.422 = 0.1023
Caminho 6 0.42 x 0,58 x 0.42 = 0.58 x 0.422 = 0.1023
Caminho 8 0.42 x 0.42 x 0,42 = 0.423 = 0,0741
Caminho 1 0.58 x 0.58 x 0.58 = 0.583 = 0.1951
Resulta‑ dos da:
1ª moeda jogada
2ª moeda jogada
3ª moeda jogada
Caminho 3 0.58 x 0.42 x 0.58 = 0.582 x 0.42 = 0.1413
Caminho 5 0.42 x 0.58 x 0,58 = 0.582 x 0.42 = 0.1413
Caminho 7 0.42 x 0.42 x 0,58 = 0.58 x 0.422 = 0.1023
Figura 29
106
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Pelo menos duas caras significa duas ou três caras, logo os caminhos 1, 2, 3, e 5 nos interessam; os demais ou têm apenas uma cara, ou nenhuma.
Qualquer um desses quatro caminhos que vierem a ocorrer responderá à nossa pergunta, ou seja, a probabilidade de ocorrer pelo menos duas caras é a soma das probabilidades de ocorrer o caminho nº 1, ou então o nº 2, ou então o nº 3, ou, ainda, o nº 5. Poderíamos escrever isso assim:
P P P P( ( ( (pelo menos uma cara) ca-ca-ca) ca-ca-co) ca-co-ca)= + + ++ P(co-ca-ca) Logo, o resultado seria:
P( , , , , ,pelo menos uma cara) = + + + = =0 1951 0 1413 0 1413 0 1413 0 6190 66190, %
Essa soma de eventos gera o que chamamos de evento soma.
Cada vez que jogamos a moeda, ocorre um resultado diferente. A cada um desses resultados damos o nome de evento. Vários eventos podem ser combinados, criando os eventos soma e os eventos produto, já mostrados anteriormente.
O evento soma representa uma alternativa entre vários eventos simples, caracterizando‑se pela palavra ou. Por exemplo, a questão “Qual é a probabilidade de um aluno passar em Estatística?” é respondida por um evento soma: o aluno pode passar sem exame ou com exame. A probabilidade será a soma das probabilidades dos dois eventos simples.
O evento produto representa uma obrigação entre várias situações e caracteriza‑se pela palavra e. Por exemplo, “Qual é a probabilidade de um aluno cursar Administração e passar em Estatística?”. O aluno tem de cursar Administração e passar em Estatística. A probabilidade será o produto entre a probabilidade de um aluno estudar Administração e a probabilidade de passar de Estatística.
Vamos firmar esse conceito por meio do seguinte exemplo:
7. Dois caçadores, Pedro e João, atiram contra uma caça simultaneamente. Sabemos que Pedro tem uma probabilidade de acertar esse tipo de caça de 40%, enquanto João acerta em 55% das vezes. Calcular a probabilidade de:
a) A caça ser atingida.
b) Ambos atingirem simultaneamente a caça.
Antes de resolvermos a questão, vamos sublinhar como foram obtidas essas probabilidades. Presumimos que Pedro e João já foram caçar diversas vezes esse tipo de caça e, a cada tiro que deram, anotaram o resultado. Após algum tempo, eles têm uma série de observações suficientemente grande para calcular as probabilidades relacionadas.
107
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Pedro atirou um número x de vezes e acertou quatro a cada dez tiros que deu; assim, ele pode afirmar que tem 40% de chances de acertar um tiro qualquer nessas mesmas condições. João, em raciocínio semelhante, chegou à probabilidade de 55%.
Se Pedro tem 40% de chances de acertar, tem 60% de chances de errar, assim como João tem 55% de probabilidade de acertar e 45% de errar. Chegamos a essa conclusão porque acertar e errar são eventos complementares, ou seja, um completa o outro sem a existência de um terceiro, e a soma dos dois resulta em 100%.
Com essas probabilidades individuais, podemos montar a árvore de decisões apropriada:
Pedro atira
0,40
0,45
Cálculo das Probabilidades
0,40 x 0,55 = 0,22 ou 22%
0,40 x 0,45 = 0,18 ou 18%
0,60 x 0,55 = 0,33 ou 33%
0,60 x 0,45 = 0,27 ou 27%
0,45
0,55
0,55
0,60
Acerta o tiro
Acerta o tiro
Acerta o tiro
João atira
Erra o tiro
Erra o tiro
Erra o tiro
João atira
Figura 30
Podemos então responder às questões.
A caça será atingida se Pedro ou João ou os dois a atingirem. Existe alternativa, portanto é um evento soma:
P(caça ser atingida) == P (Pedro acertar e João acertar) + P(Pedro acertar e João errar) + P(Pedro errar e João acertar)P(caça ser atingida) = 0,22 + 0,18 + 0,33 = 0,73 = 73%
Portanto, a resposta ao item a) é: a probabilidade de a caça ser atingida é de 73%.
108
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Já para ambos atingirem a caça, é necessário que Pedro e João a atinjam, ou seja, é um evento produto:
P(ambos atingirem a caça) = P(Pedro acertar) x P(João acertar)
P(ambos atingirem a caça) = 0,40 x 0,55 = 0,22 = 22%
Portanto, a resposta ao item b) é: a probabilidade de ambos acertarem a caça é de 22%.
7.7 Eventos independentes e eventos vinculados
Na questão anterior, os tiros de Pedro não interferem nos tiros de João e vice‑versa, ou seja, o fato de Pedro acertar ou errar não torna mais ou menos provável os acertos ou erros de João. É o que se chama de eventos independentes.
Nem sempre, entretanto, isso ocorre. Eventualmente, a ocorrência de um evento altera a probabilidade de ocorrência do evento seguinte. São os eventos vinculados, ou condicionados, ou dependentes.
A próxima questão exemplifica esse conceito:
8. Temos uma caixa que contém um total de 45 bolinhas, sendo 20 verdes, 15 brancas e 10 pretas. Retiramos dessa caixa uma bolinha, anotamos sua cor, colocamos de lado e, em seguida, retiramos da caixa uma segunda bolinha.
a) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação verde e branca?
b) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação preta e branca?
Uma combinação verde e branca corresponde a retirar uma primeira bolinha verde e uma segunda bolinha branca, ou uma primeira bolinha branca e uma segunda bolinha verde. Raciocínio semelhante é utilizado para a combinação preta e branca.
Novamente vamos utilizar a árvore de decisões para entender e esquematizar o problema, seguindo o raciocínio anteriormente estabelecido:
109
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Total de 45 bolinhas
Cálculo das Probabilidades
1
2
3
4
5
6
7
8
9
Total de 44 bolinhas
Total de 44 bolinhas
Depois de retirada a 1ª bolinha a caixa irá ficar com:
Depois de retirada a 1ª bolinha a caixa irá ficar com:
Depois de retirada a 1ª bolinha a caixa irá ficar com:
Bolinha verde
Bolinha verde
Bolinha verde
Bolinha verde
Bolinha branca
Bolinha branca
Bolinha branca
Bolinha branca
Bolinha preta
Bolinha preta
Bolinha preta
Bolinha preta
Caixa contendo:20 bolinhas verdes;
15 brancas e 10 pretas
Caixa contendo:19 bolinhas verdes;
15 brancas e 10 pretas
Caixa contendo:20 bolinhas verdes;
14 brancas e 10 pretas
Caixa contendo:20 bolinhas verdes;
15 brancas e 9 pretas
2045
1545
1045
1944 15
44
2044
1444
1044
2044 15
44
944
2045
1944
3801980
0 1919× = = ,
2045
1544
3001980
0 1515× = = ,
2045
1044
2001980
0 1010× = = ,
1545
2044
3001980
0 1515× = = ,
1545
1444
2101980
0 1061× = = ,
1545
1044
1501980
0 0757× = = ,
1045
2044
2001980
0 1010× = = ,
1045
1544
1501980
0 0757× = = ,
1045
944
901980
0 0455× = = ,
Figura 31
Observe que, dos nove caminhos existentes (eventos produtos), dois correspondem a uma combinação verde e branca: os caminhos 2 e 4. Portanto, um ou outro atendem ao solicitado (portanto, evento soma). Dessa forma:
P(combinação verde e branca) = P(1ª verde / 2ª branca) + P(1ª bolinha branca / 2ª verde)P(combinação verde e branca) = 0,1515 = 0,1515 = 0,3030 = 30,30%
A probabilidade de obtermos uma combinação verde e branca é de 30,30%.
Raciocínio semelhante é feito para a combinação preta e branca (siga os caminhos 6 e 8):
P(combinação verde e branca) = P(1ª branca / 2ª preta) + P(1ª bolinha preta/ 2ª branca)P(combinação preta e branca) = 0,0757 + 0,0757 = 0,1514 = 15,14%
Exemplo de aplicação
17. Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que ambas não sejam defeituosas e de que uma seja perfeita e a outra não são, respectivamente, de:
A) 88,33% e 45,00%
B) 43,33% e 45,00%
110
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
C) 43,33% e 55,00%
D) 23,33% e 45,00%
E) 23,33% e 55,00%
18. Certo tipo de motor pode apresentar dois tipos de falhas: mancais presos e queima do induzido. Sabendo‑se que as probabilidades de ocorrência dos defeitos são de 0,2 e 0,03, respectivamente, determine a probabilidade de que, num motor daquele tipo, selecionado ao acaso, não ocorram, simultaneamente, as duas falhas.
A) 6%
B) 19,4%
C) 99,4%
D) 21,8%
E) 77,6%
8 REVISÃO TEÓRICA DOS CONCEITOS ESTUDADOS
• Experimento: processo pelo qual ocorre uma determinada sucessão de acontecimentos. Por exemplo: realizar uma reação química; investir em ações; jogar dados.
• Experimento matemático ou determinístico: é aquele em que os resultados podem ser previstos de modo exato utilizando‑se a ciência. Por exemplo: realizar uma reação química.
• Experimento aleatório: é aquele cujos resultados não são sempre os mesmos, apesar de se repetirem várias vezes em condições semelhantes. Por exemplo: jogar dados.
• Experimentos aproximadamente aleatórios: são aqueles que, apesar de terem uma tendência de ocorrência, não podem ter seus resultados definidos de modo exato pela ciência. Por exemplo: investir em ações.
• Espaço amostral ou conjunto universo: conjunto formado por todos os resultados possíveis de um experimento. Por exemplo: o conjunto formado pelos números 1; 2; 3; 4; 5 e 6, resultados possíveis de um jogo de dados.
• Evento: é qualquer subconjunto de um espaço amostral. Por exemplo, os números 2; 4 e 6, evento “números pares” de um jogo de dados.
111
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
• Evento simples: é aquele formado por um único elemento do espaço amostral. Por exemplo, o número 5 num jogo de dados.
• Evento composto: é aquele formado por mais de um elemento do espaço amostral. Por exemplo, os números 1; 3 e 5, evento “números ímpares” de um jogo de dados.
• Evento complementar: de um evento A qualquer, é o evento B (chamado complementar de A), tal que todos os elementos do espaço amostral que não pertençam a A pertençam a B e vice‑versa. Observar que S = A + B. Por exemplo, o conjunto A = {1, 3, 5} é complementar ao conjunto B = {2, 4, 6}, num jogo de dados, visto que, ao serem somados, dão origem ao espaço amostral S = {1, 2, 3, 4, 5, 6}. Não falta nem sobra elemento algum.
• Eventos mutuamente exclusivos: Suponha dois eventos A e B, no qual a ocorrência de A impede a ocorrência de B e vice‑versa. Dizemos que eles são mutuamente exclusivos. Por exemplo: num jogo de dados, a ocorrência de um número par (1, 2, 3) impede a ocorrência de um número ímpar (2, 4, 5), portanto tais eventos são mutuamente exclusivos. Não confunda eventos complementares com eventos mutuamente exclusivos. Todos os eventos complementares são mutuamente exclusivos, mas o contrário não é verdade.
• Eventos independentes: dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas, comportando‑se cada um da maneira que lhe é própria, sem influenciar os demais. Por exemplo: o lançamento de duas moedas, simultaneamente.
• Eventos vinculados ou condicionados: são eventos cujo aparecimento de um dependa do aparecimento de outro (ou seja influenciado por este), no mesmo experimento. Por exemplo: retirada de duas cartas de um baralho. Quando você retira a primeira carta, existem 52 cartas no baralho, 26 vermelhas e 26 pretas. Quando você for retirar a segunda carta, o baralho terá apenas 51 cartas, e poderão ser 25 vermelhas e 26 pretas ou 26 vermelhas e 25 pretas, dependendo da cor da primeira carta. Portanto, o segundo evento está condicionado ou vinculado ao primeiro.
• Evento soma: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um ou de outro nos interessa, temos o evento soma. Perceba a importância da palavra ou na formulação do princípio e da ideia de alternativa. Por exemplo: jogo um dado e quero que saia um número par ou um número primo. Os números pares são {2, 4, 6}, e os números primos são {1, 2, 3, 5}. Como me interessam os números pares ou primos, fico satisfeito com a ocorrência de qualquer um dos seguintes números {1, 2, 3, 4, 5}. Esse conjunto é a soma dos dois anteriores, descontadas as intersecções (no caso, o número 2).
• Evento produto: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um e simultaneamente a do outro nos interessa, temos o evento produto. Perceba a importância da palavra e na formulação do princípio, e da ideia de obrigação. Por exemplo: jogo um dado e quero que saia um número par e primo. Os números pares são {2, 4, 6}, e os números primos são {1, 2, 3, 5}. Como me interessa que o número seja par e simultaneamente primo, fico satisfeito
112
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
somente com a ocorrência do número: {2}. Note que esse conjunto é a intersecção dos dois anteriores, ou seja, valores que pertencem simultaneamente aos dois conjuntos.
• Definição de probabilidades matemática: é a razão (divisão) entre o número de elementos do evento estudado pelo número de elementos do espaço amostral, ou seja:
P An An S
( )( )( )
=
• Definição de probabilidades estatística: presumindo que um experimento seja repetido uma quantidade considerável de vezes e seus resultados sejam anotados, definimos a probabilidade de ocorrência de eventos daquele experimento como a frequência relativa deste:
P A fffRAA
T( ) = =
• Axiomas das probabilidades: são verdades a partir das quais se estabelecem os conceitos de probabilidades:
— Dado um evento A, dentro de um espaço amostral S, temos:
0 1≤ ≤P A( )
— A probabilidade do espaço amostral, ou da soma de todos os eventos possíveis, é:
P(S) = 1
Para dois eventos mutuamente exclusivos, temos:
P A B P A P B( ) ( ) ( )∪ = +
Se o evento A é complementar de B, então:
P(A) + P(B) = 1 ou P(A) = 1 ‑ P(B)
Lembrete
Houaiss (2009) define axioma como “premissa considerada necessariamente evidente e verdadeira, fundamento de uma demonstração, porém ela mesma indemonstrável, originada, segundo a tradição racionalista, de princípios inatos da consciência ou, segundo os empiristas, de generalizações da observação empírica”.
113
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Teorema da Soma: se A e B são dois eventos não mutuamente exclusivos, a probabilidade da ocorrência de A ou B ou ambos é dada por:
P A B P A P B P A B( ) ( ) ( ) ( )∪ = + − ∩
Exemplo: numa caixa existem oito bolinhas idênticas, numeradas de 1 a 8. Qual a probabilidade de, ao retirarmos uma bolinha, ela ser múltiplo de 2 ou de 5?
Espaço amostral: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} ‑> n(S) = 10
Evento A – múltiplos de 2: A = {2, 4, 6, 8, 10) ‑> n(A) = 5
Evento B – múltiplos de 5: B = {5, 10) ‑> n(B) = 2
Intersecção entre A e B: A∩B = {10} ‑> n(A∩B) = 1
P A B P A P B P A B P A Bn An S
n Bn S
n A Bn S
( ) ( ) ( ) ( ) ( )( )( )
( )( )
( )(
∪ = + − ∩ ⇒ ∪ = + − ∪))
P A B( ) , %∪ = + − = = =510
210
110
610
0 60 60
• Teorema do Produto para eventos independentes: caso tenhamos dois eventos, A e B, que não sejam mutuamente exclusivos, a probabilidade de ocorrer um resultado que pertença simultaneamente aos dois eventos é dada por:
P A B P A xP B( ) ( ) ( )∩ =
Esse conceito pode ser estendido para mais de dois eventos.
Por exemplo: temos duas caixas com bolinhas nas seguintes quantidades:
— Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Total 55: bolinhas.
— Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Total: 60 bolinhas.
Retiramos uma bolinha de cada urna. Qual é a probabilidade de que ambas as bolinhas retiradas sejam azuis?
— Caixa A: probabilidade de uma bolinha retirada ser azul:
114
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
P Azul( ) = 1055
— Caixa B: probabilidade de uma bolinha retirada ser azul:
P Azul( ) = 2060
Probabilidade de ambas serem azuis:
P Azul Azul P xP( ) ( ) ( )∩ = Urna A/bolinha Azul Urna B/bolinha Azul == × =1055
2060
2003300
P Azul Azul( ) , , %∩ = =0 0606 6 06
• Teorema do Produto para eventos vinculados: a probabilidade de ocorrência simultânea de dois eventos A e B vinculados é dada pelo produto da probabilidade de um dos eventos pela probabilidade condicional do outro evento:
P A B P A xP B A( ) ( ) ( / )∩ =
O símbolo P(B/A) é lido como: probabilidade de ocorrência do evento B tendo ocorrido o evento A. É a chamada probabilidade condicional. Esse conceito pode ser estendido para mais de dois eventos.
O exemplo a seguir deixa essa situação mais evidente:
Retiramos sem reposição três caras de um baralho de 52 cartas. Qual a probabilidade de que as três sejam vermelhas?
Probabilidade de a primeira carta ser vermelha:
P vermelha( ) = 2652
Probabilidade de a segunda carta ser vermelha:
P vermelha( ) = 2551
Probabilidade de a terceira carta ser vermelha:
115
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
P vermelha( ) = 2450
Probabilidade de as três serem vermelhas:
P Vrm Vrm Vrm P xP( ) ( ) ( /∩ ∩ = 1 2 1a a a carta Vrm carta Vrm carta Vrm)) ( / )xP 3 2a a carta Vrm carta Vrm
P Vrm Vrm Vrm( )..
∩ ∩ = × × = × ×× ×
=2652
2551
2450
26 25 2452 51 50
15 626132 6000
0 1178 1178= =, , %
Exemplo de aplicação
19. Suponhamos que existam, num certo mercado, duas fábricas de lâmpadas. A fábrica A produz 500 lâmpadas, das quais 25% apresentam defeitos, e a fábrica B produz 550 lâmpadas, das quais 26% são defeituosas; vamos supor também que as 1.050 lâmpadas sejam vendidas por um único vendedor. Por fim, suponhamos que um cliente vá comprar uma lâmpada sem especificar marca e que estas tenham sido dispostas ao acaso na prateleira. Calcular:
I – A probabilidade de ele receber uma lâmpada defeituosa.
II – A probabilidade de, tendo recebido uma lâmpada perfeita, ela ser da marca B.
A alternativa que apresenta as respostas corretas é a:
A) I = 47,62% e II = 26,00%
B) I = 26,00% e II = 52,05%
C) I = 25,52% e II = 26,00%
D) I = 25,50% e II = 50,00%
E) I = 25,52% e II = 52,05%
Resumo
Nesta unidade voltamos nossos olhares para o cálculo das chamadas medidas estatísticas e, em seguida, para o estudo elementar das probabilidades. Esses assuntos são importantes porque a partir do conhecimento de uma amostra e da probabilidade de o comportamento dessa amostra reproduzir uma população é que poderemos prever ou induzir acontecimentos.
116
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Medidas ou parâmetros estatísticos são informações resumidas e focadas de uma população e vão, em estudos posteriores, permitir a extensão dessas informações para as populações.
Iniciamos estudando as medidas de posição, também chamadas de medidas de tendência central, que, como o próprio nome indica, dão uma ideia central da amostra. Vimos as médias, as medianas e as modas, as mais importantes, porém não únicas, medidas de posição. Para cada uma dessas medidas, verificamos como devem ser feitos os cálculos, seja quando apresentados de maneira isolada, seja quando agrupados em classes. Alguns termos muito importantes para a Estatística foram definidos, como média aritmética, média ponderada etc. Além disso, foram consideradas as diferenças entre média, mediana e moda, bem como enfatizado que, apesar de muito importantes, as medidas de posição não são suficientes para entendermos uma amostra.
Para o correto entendimento de uma amostra e, posteriormente, de uma população, conceituamos as medidas de dispersão, também chamadas de medidas de variabilidade. Essas medidas tentam mostrar como cada um e todos os elementos de uma amostra se desviam da medida de posição. São especialmente importantes, nesse campo, o desvio‑padrão e a variância. Observamos também a maneira de se comparar duas ou mais amostras utilizando os coeficientes de variação, em especial o de Pearson. Por fim, nesta etapa, vimos o comportamento gráfico das distribuições de frequência, assimetria e curtose, assunto que iremos recuperar no próximo semestre.
Com medidas desses três grupos é possível entendermos como uma amostra se comporta e, futuramente, em Estatística Aplicada, como a população da qual essa amostra foi retirada se comporta. Essa relação entre populações e amostras é possível porque uma amostra retirada de uma população tem comportamentos provavelmente iguais.
Isso nos conduziu ao último item do nosso curso, a Teoria Elementar das Probabilidades, na qual verificamos o que é probabilidade, como podemos calcular uma probabilidade e os conceitos que envolvem o estudo das probabilidades. Neste momento, conceituamos o que são experimentos e eventos aleatórios; como se encadeiam esses eventos em eventos soma e eventos produto e, também, em eventos vinculados e independentes, e abrimos frente para o estudo das distribuições de probabilidades, a ser feito na disciplina de Estatística Aplicada. Nessa linha de raciocínio, passamos os olhos também sobre análise combinatória, que foi e será importante para os cálculos mais complexos, ainda a serem feitos.
117
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
Como resultado deste nosso curso, sabemos como coletar, organizar e trabalhar dados estatísticos de uma amostra, permitindo entendê‑la e obter conclusões, e, em contrapartida, compreender como probabilidades são importantes para entender as relações entre populações e amostras. De posse dessas informações, estamos preparados para adentrar a Estatística Indutiva, nosso próximo campo de trabalho.
Exercícios
Questão 1 (SEFAZ 2011 – Adaptado). Com base no resultado do concurso para o cargo de Especialista em Políticas Públicas e Gestão Governamental da Seplag, prova realizada pelo Ceperj em 1º ago. 2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos 1.535 candidatos que realizaram a prova estão mostradas na tabela a seguir:
Tabela 58
Nenhum acerto → 393 candidatos
1 acerto → 627 candidatos
2 acertos → 417 candidatos
3 acertos → 81 candidatos
4 acertos → 12 candidatos
5 acertos → 5 candidatos
Total 1.535 candidatos
A figura que segue mostra a frequência relativa dos acertos.
45,0%
40,0%
35,0%
30,0%25,6%
40,8%
Estatística – Prova para EPPGG
27,2%
5,3%
0,8% 0,3%
25,0%
20,0%
15,0%
10,0%
5,0%
0,0%
Figura 32
118
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Unidade II
Com base na tabela e na figura, julgue as afirmativas a seguir:
I – A moda e a mediana da distribuição são iguais.
II – A amplitude interquartílica é igual a 2.
III – A média da distribuição é igual a 2.
IV – A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no máximo duas questões é igual a 66,4%.
São corretas apenas as afirmativas:
A) I e II.
B) I e III.
C) I, III e IV.
D) II, III e IV.
E) II e IV.
Resposta correta: alternativa A.
Análise das afirmativas
I) Afirmativa correta.
Justificativa: a moda será igual a 1 (valor com maior frequência) e a mediana também será igual a 1 (neste valor, a frequência já alcançará 50% da distribuição).
II) Afirmativa correta.
Justificativa: o primeiro quartil será igual a 0 (neste valor, a frequência já alcançará 25% da distribuição), e o terceiro quartil será igual a 2 (neste valor, a frequência já alcançará 75% da distribuição). A amplitude interquartílica será: Q3 ‑ Q1 = 2 ‑ 0 = 2.
III) Afirmativa incorreta.
Justificativa: podemos usar a frequência relativa para calcular a média do número de acertos, igual a: (0 × 0,256) + (1 × 0,408) + (2 × 0,272) + (3 × 0,053) + (4 × 0,008) + (5 × 0,003) = 0 + 0,408 + 0,544 + 0,159 + 0,032 + 0,015 = 1,158.
119
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ESTATÍSTICA
IV) Afirmativa incorreta.
Justificativa: a probabilidade de ter acertado, no máximo, duas questões (acertar 0, 1 ou 2 questões) será de: 25,6% + 40,8% + 27,2% = 93,6%.
Questão 2. Fez‑se uma pesquisa sobre o número de pacientes que frequentaram os estabelecimentos de saúde públicos e particulares no Brasil. Os dados a seguir representam o sumário da pesquisa.
Tabela 59
EspécieEstabelecimentos
Públicos (PU) Particulares (PA)
Hospital (H)
Pronto‑socorro (PS)
Policlínicas (P)
Outros¹ (O)
1.002
150
1.531
14.393
5.132
156
6.136
472
¹ Inclui postos de saúde, centros de saúde e unidades mistas
Fonte: VIEIRA (2008, p.18).
Retira‑se, ao acaso, um estabelecimento da população de 28.972 unidades. Sejam H, PS, P e O os eventos que representam se o estabelecimento retirado é hospital, pronto‑socorro, policlínicas ou outros, respectivamente. Da mesma forma, PU e PA são eventos que representam o tipo de estabelecimento (público ou particular). Assinale a alternativa incorreta.
A) A probabilidade de o paciente ter escolhido o estabelecimento público é de aproximadamente 0,5894, ou 58,94%.
B) A probabilidade de o paciente ter escolhido o hospital ou ser um estabelecimento particular é de 0,6223, ou 62,23%.
C) A probabilidade de o paciente ter escolhido o pronto‑socorro e ser um estabelecimento público é de 0,0052, ou 0,52%.
D) A probabilidade de o paciente ter escolhido o hospital ou policlínicas é de 0,4764, ou 47,64%.
E) A probabilidade de o paciente ter escolhido o hospital e ser um estabelecimento particular é de 0,1771, ou 17,71%.
Resolução desta questão na plataforma.
120
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
REFERÊNCIAS
ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, 2007.
BRUNI, A. B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007.
BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986.
COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1979.
COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 1998.
FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.
GITMAN, L. J. Princípios de administração financeira. São Paulo: Harbra, 2003.
GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991.
HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2009. 1 CD‑ROM.
KAZMIER, L. J. Estatística aplicada a economia e administração. São Paulo: Makron Books, 1982.
KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993.
LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005.
MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1997. v. 1‑2.
______. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1999.
MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1976.
MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995.
MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
121
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.
MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000.
MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006.
SALSBURG, D. Uma senhora toma chá: como a Estatística revolucionou a ciência no século XX. Rio de Janeiro: Zahar, 2009.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993.
STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981.
TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005.
VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Elsevier, 2008. p. 18.
WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.
Sites
<http://super.abril.com.br/>.
<http://www.alea.pt>.
<www.ibge.gov.br>.
Exercícios
Unidade I – Questão 3: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração. Questão 7, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.
Unidade I – Questão 11: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração. Questão 6, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.
Unidade II – Questão 1: CEPERJ. Prova do Concurso Público de Fiscal da Fazenda. Rio de Janeiro, 2011. Questão 42, p.7. Disponível em: <http://www.concurso.ceperj.rj.gov.br/concursos/sefazfazenda/prova.pdf>. Acesso em: 23 dez. 2013.
122
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
ANEXO 1 – GABARITO
Unidade I
1. B.
2. B.
3. E.
4. C.
5. D.
6. D.
7. B.
8. B.
9. C.
10. C.
11. A.
Unidade II
1. A.
2. E.
3. A.
4. D.
5. D.
6. C.
7. B.
8. A.
123
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
9. E.
10. D.
11. C.
12. A.
13. D.
14. C.
15. B.
16. A.
17. B.
18. C.
19. E.
124
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
125
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
126
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
127
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
128
ADM
/ CC
TB -
Rev
isão:
Julia
na M
aria
Men
des -
Dia
gram
ação
: Luc
as M
ansin
i - d
ata
13/1
2/20
13 /
/ Ex
ercí
cios
- Ju
liana
- D
iagr
amaç
ão: M
árci
o -
26/1
2/20
13
Informações:www.sepi.unip.br ou 0800 010 9000
top related