- 1 -
EDITAL ANTERIOR | PRF 2013 | Matemática Noções de estatística.
MÉDIA ARITMÉTICA (�̅�)
Sejam x1, x2, ..., xn, portanto n valores da variável X. A média aritmética simples, ou simplesmente média de X, representada por �̅� é definida por:
ou simplesmente
onde n é o número de elementos do conjunto.
Exemplo:
Determinar a média aritmética simples dos valores: 3, 7, 8, 10, 11.
Observação: O símbolo 𝜇 (mi) é usado para denotar a média de uma população e �̅� (x barra) para
denotar a média de uma amostra.
Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética
dos valores x1, x2, x3, ..., xn, ponderados pelas respectivas frequências absolutas: f1, f2, f3, ..., fn. Assim,
�̅� =∑ 𝒙𝒊 ∙ 𝒇𝒊
𝒏𝒊=𝟏
∑ 𝒇𝒊𝒏𝒊=𝟏
ou simplesmente
�̅� =∑ 𝒙𝒊 ∙ 𝒇𝒊
∑ 𝒇𝒊
Exemplo: Determinar a média da distribuição:
- 2 -
Neste caso, a nota corresponde à variável X pesquisada. Na primeira coluna estão os valores xi da
variável e, na segunda coluna, suas respectivas frequências fi. Assim, temos a seguinte tabela:
xi fi xi . fi
0 2 0
1 10 10
2 20 40
3 47 141
4 46 184
Total 125 375
Daí:
�̅� =∑ 𝑥𝑖 ∙ 𝑓𝑖
∑ 𝑓𝑖=
375
125⇒ �̅� = 3
Caso os dados estejam agrupados em intervalos, utilizamos a mesma técnica dos dados agrupados sem
intervalos, tomando o ponto médio de cada classe como seu respectivo valor da variável xi. As fórmulas são as mesmas.
Exemplo:
Determinar a média da distribuição:
A partir dos dados, temos a seguinte tabela:
classes Renda Familiar
xi (ponto médio)
fi Nº de Familias
xi . fi
2 ⊢ 4 3 5 15
4 ⊢ 6 5 10 50
6 ⊢ 8 7 14 98
8 ⊢ 10 9 8 72
10 ⊢ 12 11 3 33
Total 40 268
Daí:
�̅� =∑ 𝑥𝑖 ∙ 𝑓𝑖
∑ 𝑓𝑖=
268
40⇒ �̅� = 6,7
�̅� = 6,7
- 3 -
MEDIANA (Me) A mediana é outra medida de posição definida como o número que se encontra no centro de uma série
de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo número de elementos.
A mediana de um conjunto de dados ordenados é o termo do conjunto que o divide em duas partes
iguais, isto é, divide o conjunto em dois subconjuntos com o mesmo número de elementos tais que a cada um deles pertencem todos os elementos menores ou todos os elementos maiores que a mediana.
A mediana é geralmente simbolizada por Me ou por Md.
1º Caso: número de dados ímpar
A mediana será o valor da variável que ocupa a posição 𝑛+1
2.
2º Caso: número de dados par
A mediana será a média entre os valores das variáveis que ocupam a posição 𝑛
2 e
𝑛+2
2.
Por exemplo, consideremos os pesos ao nascer, em kg, de 9 cordeiros, dados abaixo:
2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,5 4,0
Nesse caso, como n = 9 (ímpar), a mediana será o dado que ocupa a 5ª posição, pois 9+1
2= 5 .
Assim, Me = 3,1, ou seja, o peso mediano é 3,1 kg.
Suponhamos agora que fossem 10 cordeiros, com os seguintes pesos:
2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0
Nesse caso, como n = 10 (par), a mediana será a média entre o 5º e o 6º dados, pois 10
2= 5 e
10+2
2= 6
.
Assim:
𝑀𝑒 =3,1 + 3,2
2= 3,15
Assim, Me = 3,15, ou seja, o peso mediano é 3,15 kg.
Importante: Observe que os dados já estão em ordem crescente. Caso isso não aconteça, devemos
primeiro colocar os dados em ordem crescente, para depois determinar o valor da mediana.
Importante: Observe ainda que a Mediana não é influenciada por valores extremos (é uma medida robusta).
Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe, usaremos a mesma técnica que utilizamos no caso dos dados não agrupados, para determinar a posição
da mediana. Depois de determinada a posição da mediana, basta tomar como referência a primeira frequência acumulada que ultrapasse essa posição. O dado correspondente à essa frequência acumulada
será a mediana.
Exemplos:
- 4 -
a) Dada a distribuição:
Como n = 11, n é impar, logo a mediana (Me) será o elemento de posição:
𝑛 + 1
2=
11 + 1
2= 6º
Será, portanto, o 6º dado. Para identifica-lo, a partir da distribuição dada, construímos a coluna Fi das
frequências acumuladas, somando as frequências simples fi até cada linha (1; 1+3=4; 1+3+5=9 e 1+3+5+2=11). A primeira frequência acumulada que ultrapassar o número 6 corresponde à linha que
contém o 6º dado. Assim,
O valor do dado xi que se encontra nessa linha será o valor da mediana. No nosso exemplo, temos
Me = 3
Importante: Observe que a mediada é o xi correspondente à classe que contiver a ordem calculada.
b) Seja:
Como n = 42, n é par, logo a mediana (Me) será a média entre os elementos de posição:
𝑛
2=
42
2= 21º
e 𝑛 + 2
2=
42 + 2
2= 22º
Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela frequência acumulada:
Assim, o 21º corresponde a 87 e o 22º corresponde a 87. Então,
- 5 -
𝑀𝑒 =87 + 87
2= 87
Me = 87
ATENÇÃO: é preciso ter cuidado quando, numa quantidade par de dados, as posições 𝑛
2 e
𝑛+2
2 forem
correspondentes a duas linhas diferentes da tabela dada. Quando isso acontecer, os dados xi utilizados
para calcular a mediana serão diferentes. Isso vai acontecer quando a posição 𝑛
2 corresponder a um
valor exato da coluna das frequências acumuladas (Fi), e a posição 𝑛+2
2 corresponder a linha seguinte.
MODA (Mo) Denominamos moda o valor que ocorre com maior frequência em uma série de valores. Desse modo,
por exemplo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria.
De acordo com o comportamento das observações, podemos ter: o Conjunto amodal: não existe moda, pois todos os valores do conjunto ocorrem com a mesma
frequência. Por exemplo, no conjunto 2, 2, 3, 3, 4, 4, 7, 7, 5 e 5, todos os elementos têm a mesma frequência
(2).
o Conjunto modal (ou unimodal): existe uma única moda.
Por exemplo, a moda do conjunto 3, 4, 4, 8, 4, 5, 4, 3, 5, 4, 9, 4, 3 e 6, é Mo = 4.
o Conjunto bimodal: existem duas modas. Por exemplo, o conjunto 3, 5, 5, 5, 5, 10, 10, 10, 10 e 15, é bimodal, pois possui duas modas,
Mo = 5 e Mo = 10. o Conjunto multimodal: existem mais de duas modas.
Por exemplo, o conjunto 2, 2, 2, 4, 4, 5, 5, 5, 6, 6, 8, 8, 8, 9 e 10, é multimodal, pois possui três modas,
Mo = 2, Mo = 5 e Mo = 8.
Por exemplo, vamos retomar o caso dos pesos ao nascer, em Kg, de 10 cordeiros, dados a seguir:
2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0
Observamos que Mo = 3,2, ou seja, a moda é o peso de 3,2 Kg. (unimodal)
Quando os dados estiverem agrupados numa distribuição de frequência sem intervalos de classe, a moda
será o dado (xi) que corresponde à maior frequência (fi).
Assim, por exemplo, para a distribuição
a moda será 245, pois corresponde à maior frequência, que é 17. Então,
Mo = 245
- 6 -
VARIÂNCIA (V) Dado um conjunto de dados, a variância é uma medida de dispersão que mostra o quão distante cada
valor desse conjunto está do valor central (média).
Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais
os valores estão distantes da média.
Considere que 𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏 são os n elementos de uma amostra e que �̅� é a média aritmética desses
elementos. O cálculo da variância amostral (V) é dado por:
𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏
𝒊=𝟏
𝒏 − 𝟏
Se quisermos calcular a variância populacional (V), consideraremos todos os elementos da população, e não apenas de uma amostra. Nesse caso, o cálculo possui uma pequena diferença. Observe:
𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏
𝒊=𝟏
𝒏
DESVIO PADRÃO (DP) O desvio padrão é capaz de identificar o “erro” em um conjunto de dados, caso quiséssemos substituir
um dos valores coletados pela média aritmética.
O desvio padrão aparece junto à média aritmética, informando o quão “confiável” é esse valor. Ele é
apresentado pelo intervalo: [�̅� − 𝑫𝑷; �̅� + 𝑫𝑷]
O cálculo do desvio padrão é feito a partir da raiz quadrada positiva da variância, ou seja:
𝑫𝑷 = √𝑽
Vamos agora aplicar o cálculo da variância e do desvio padrão em um exemplo: Considere que, em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas
as notas acima da média em todas as disciplinas. Para tanto, considerou a amostra de uma turma do 9º ano do Ensino Fundamental, ao longo de um ano. Os dados obtidos foram:
Quantidade de alunos acima da média
9º ano
1º Bimestre 2º Bimestre 3º Bimestre 4º Bimestre
8 13 9 4
Para facilitar os cálculos, vamos dispor os dados coletados em uma tabela, sempre com a seguinte estrutura:
nº de alunos (𝒙𝒊)
(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐
8
13
9
4
34
- 7 -
Inicialmente, calculamos a média:
�̅� =∑ 𝑥𝑖
𝑛=
34
4= 8,5
Com o valor da média, calculamos a segunda coluna da tabela, fazendo “dado menos média” (observe que a soma dessa coluna (𝒙𝒊 − �̅�) será sempre igual a zero.
nº de alunos (𝒙𝒊)
(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐
8 8 – 8,5 = –0,5
13 13 – 8,5 = 4,5
9 9 – 8,5 = 0,5
4 4 – 8,5 = –4,5
TOTAL 34 0
Agora, tomamos os resultados da coluna (𝒙𝒊 − �̅�) e elevamos cada um deles ao quadrado, preenchendo
a terceira coluna da tabela:
nº de alunos (𝒙𝒊)
(𝒙𝒊 − �̅�) (𝒙𝒊 − �̅�)𝟐
8 8 – 8,5 = –0,5 (−0,5)2 = 0,25
13 13 – 8,5 = 4,5 (4,5)2 = 20,25
9 9 – 8,5 = 0,5 (0,5)2 = 0,25
4 4 – 8,5 = –4,5 (−4,5)2 = 20,25
TOTAL 34 0 41
Com a tabela preenchida e os totais calculados, podemos calcular a variância, lembrando que, nesse caso, trata-se de uma amostra:
𝑽 =∑ (𝒙𝒊 − �̅�)𝟐𝒏
𝒊=𝟏
𝒏 − 𝟏
𝑉 =41
4 − 1
𝑉 =41
3
𝑉 = 13,67
Conhecida a variância, vamos calcular agora o desvio padrão:
𝑫𝑷 = √𝑽
𝐷𝑃 = √13,67
𝐷𝑃 = 3,7
- 8 -
EXERCÍCIOS 01. Ano: 2008 / Banca: CESPE / Órgão: TJ-DFT A tabela acima apresenta a distribuição de frequência absoluta das notas
dadas por 125 usuários de um serviço público, em uma avaliação da qualidade do atendimento. Considerando essas informações, julgue os
próximos itens.
A média, a moda e a mediana dos valores apresentados na tabela são superiores a 2,8 e inferiores a 3,3.
( ) Certo ( ) Errado
02. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE
A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. A média das idades dessas crianças, em anos, é
a) 5,0
b) 5,2 c) 5,4
d) 5,6 e) 5,8
03. Ano: 2010 / Banca: CESGRANRIO / Órgão: IBGE
(MESMO TEXTO DA QUESTÃO 02) A mediana da distribuição de frequências apresentada é
a) 5,5
b) 5,6 c) 5,7
d) 5,8 e) 5,9
04. Ano: 2016 Banca: ESAF Órgão: ANAC
Os valores a seguir representam uma amostra 3 3 1 5 4 6 2 4 8
Então, a variância dessa amostra é igual a
a) 4,0 b) 2,5.
c) 4,5. d) 5,5
e) 3,0
05. Ano: 2010 Banca: CESGRANRIO Órgão: BNDES Em uma pesquisa de preços de determinado produto, foram obtidos os
valores, em reais, de uma amostra aleatória colhida em 6 estabelecimentos
que o comercializam. A variância dessa amostra é a) 1,50
b) 1,75 c) 2,00
d) 2,25 e) 2,50
06. Ano: 2010 Banca: FGV Órgão: SEAD-AP
Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é igual a:
a) 0,8
b) 1,2 c) 1,6
d) 2,0 e) 2,4
- 9 -
07. Ano: 2010 Banca: CESGRANRIO Órgão: IBGE No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão
apresentadas no rol abaixo. 5 2 11 8 3 8 7 4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é a) 3,1
b) 2,8
c) 2,5 d) 2,2
e) 2,0
08. Ano: 2009 Banca: CESPE Órgão: CEHAP-PB O custo médio nacional para a construção de habitação com padrão de acabamento normal, segundo
levantamento realizado em novembro de 2008, foi de R$ 670,00 por metro quadrado, sendo R$ 400,00/m2 relativos às despesas com materiais de construção e R$ 270,00/m2 com mão-de-obra. Nessa
mesma pesquisa, os custos médios regionais apontaram para os seguintes valores por metro quadrado:
R$ 700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e R$ 630,00 (Nordeste).
Sistema Nacional de Pesquisa de Custos e Índices da Construção Civil. SINAPI/IBGE, nov./2008 (com adaptações).
O desvio padrão dos custos médios regionais por metro quadrado foi a) inferior a R$ 30,00.
b) superior a R$ 30,01 e inferior a R$ 40,00. c) superior a R$ 40,01 e inferior a R$ 50,00.
d) superior a R$ 50,01.
RESPOSTAS
01) C 02) C 03) A 04) C 05) C 06) B 07) B 08) A
- 10 -
QUESTÕES DE PROVAS – PRF 01. CESPE - PRF/PRF/2008
Ficou pior para quem bebe
O governo ainda espera a consolidação dos dados do primeiro mês de aplicação da Lei Seca para avaliar seu impacto sobre a cassação de CNHs. As primeiras projeções indicam, porém, que as apreensões
subirão, no mínimo, 10%. Antes da vigência da Lei Seca, eram suspensas ou cassadas, em média,
aproximadamente 155.000 CNHs por ano. Se as previsões estiverem corretas, a média anual deve subir para próximo de 170.000. A tabela a seguir mostra esses resultados nos últimos anos (fonte:
DENATRAN).
Veja, ed. 2.072, 6/8/2008, p. 51 (com adaptações).
Para que a média de CNHs suspensas ou cassadas, de 2003 a 2008, atinja o valor previsto de 170.000,
será necessário que, em 2008, a quantidade de CNHs suspensas ou cassadas seja um número a) inferior a 180.000.
b) superior a 180.000 e inferior a 200.000.
c) superior a 200.000 e inferior a 220.000. d) superior a 220.000 e inferior a 240.000.
e) superior a 240.000.
02. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito
nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base
nessas informações, julgue o item seguinte.
A média aritmética de acidentes de trânsito nos cinco
estados citados é superior a 7.000. ( ) Certo ( ) Errado
03. CESPE - AA (PRF)/PRF/2012 A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas,
incluindo o condutor,
por veículo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o sistema de transporte local.
Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. Com base nessas
informações, julgue o seguinte item. Em média, cada veículo de passeio que circula no referido município transporta duas pessoas. Portanto,
se, em determinado momento, houver 10 mil veículos circulando nesse município, a quantidade esperada de pessoas que estão sendo transportadas por todos esses veículos, incluindo-se os condutores, será
igual a 20 mil.
( ) Certo ( ) Errado
Q P
(%)
1 50
2 20
3 15
4 10
5 5
- 11 -
04. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito
nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base
nessas informações, julgue o item seguinte. Se, no ano de 2004, com relação ao ano de 2001, o
número de acidentes de trânsito no Acre crescesse 10%,
o do Mato Grosso do Sul diminuísse 20%, o do Amazonas aumentasse 15% e os demais permanecessem
inalterados, então a média aritmética da série numérica formada pelo número de acidentes de trânsito em cada
estado, em 2004, seria maior que a mediana dessa mesma série.
( )Certo ( ) Errado
05. CESPE - PRF/PRF/2013
Considerando os dados apresentados no gráfico, julgue o item seguinte.
A média do número de acidentes ocorridos no período de
2007 a 2010 é inferior à mediana da sequência de dados apresentada no gráfico.
( ) Certo ( ) Errado
06. CESPE - AA (PRF)/PRF/2012 A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas,
incluindo o condutor, por veículo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o
sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5.
Com base nessas informações, julgue o seguinte item. Como a moda da distribuição descrita representa a maior frequência observada, seu
valor é igual a 50%.
( ) Certo ( ) Errado
07. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito
nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base
nessas informações, julgue o item seguinte. Se, no ano de 2004, com relação ao ano de 2001, o número
de acidentes de trânsito no Acre passasse para 2.500, o
número de acidentes de trânsito no Espírito Santo fosse reduzido para 10.000, o de Minas Gerais fosse reduzido para
13.000 e os demais permanecessem inalterados, então o desvio-padrão da série numérica formada pelo número de
acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001.
( ) Certo ( ) Errado
Q P
(%)
1 50
2 20
3 15
4 10
5 5
- 12 -
08. CESPE - AA (PRF)/PRF/2012 A tabela acima apresenta as estatísticas produzidas em um
levantamento acerca do número diário de acidentes que envolvem motocicletas em determinado local. Com base
nessas informações, julgue o próximo item. A variância da distribuição do número diário de acidentes
com motocicletas no referido local é inferior a 100.
( ) Certo ( ) Errado
09. CESPE - PRF/PRF/2003 O gráfico acima ilustra o número de acidentes de trânsito
nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base
nessas informações, julgue o item seguinte.
Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito em cada um dos estados
considerados aumentasse de 150, então o desvio-padrão da série numérica formada pelo número de acidentes de
trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de
acidentes de trânsito em cada estado em 2001. ( ) Certo ( ) Errado
RESPOSTAS
01) D 02) C 03) C 04) C 05) E 06) E 07) E 08) E 09) E
ESTATÍSTICA VALOR
(acidentes por
dia)
Média 10
Mediana 8
Desvio padrão 12
Primeiro quartil 5
Terceiro quartil 15