est - bacen 2013 - est - aula 04

70
Curso Regular de Estatística Prof. Vítor Menezes – Aula 4 Prof. Vítor Menezes www.estrategiaconcursos.com.br 1 AULA 4: Assimetria e curtose 1. MOMENTOS 2 2. ASSIMETRIA 3 2.1. Introdução 3 2.2. Formas da curva de frequência e posicionamento relativo de média, mediana e moda 8 2.3. Outros tipos de posicionamento relativo de média, mediana e moda 20 2.4. Assimetria e diferença entre os quartis 30 2.5. Coeficientes de assimetria 34 3. CURTOSE 49 3.1. Introdução 49 3.2. Coeficientes de curtose 51 4. QUESTÕES APRESENTADAS EM AULA 59 5. GABARITO 70

Upload: mauro-valim

Post on 29-Oct-2015

229 views

Category:

Documents


25 download

TRANSCRIPT

Page 1: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 1

AULA 4: Assimetria e curtose

1. MOMENTOS 2

2. ASSIMETRIA 3

2.1. Introdução 3

2.2. Formas da curva de frequência e posicionamento relativo de média, mediana e moda 8

2.3. Outros tipos de posicionamento relativo de média, mediana e moda 20

2.4. Assimetria e diferença entre os quartis 30

2.5. Coeficientes de assimetria 34

3. CURTOSE 49

3.1. Introdução 49

3.2. Coeficientes de curtose 51

4. QUESTÕES APRESENTADAS EM AULA 59

5. GABARITO 70

Page 2: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 2

1. MOMENTOS

Para um dado conjunto de dados, o momento de ordem k, em relação à média, é:

�� =1���� − ����

��

Trata-se de uma média de desvios elevados a k, onde os desvios são calculados em relação à média aritmética.

O momento de ordem k, em relação à origem, é:

��′ =1������

��

Trata-se de uma média de valores elevados a k.

Observe que o momento de ordem 1 em relação à origem coincide com a média aritmética. Note também que o momento de ordem 2 em relação à média é exatamente a variância dos dados.

Exemplo 1

Considere a seguinte sequência de dados: 1, 3, 5.

Calcule:

a) o momento de ordem 3 em relação à origem

b) o momento de ordem 2 em relação à média

Resolução:

Letra A

O momento de ordem 3 em relação à origem fica:

��� =1������

��

Como o momento é de ordem 3, então k vale 3. Como temos três valores, n também vale 3.

��� =13�����

��

��� =13 × �1� + 3� + 5�� = 153

3

Letra B

Para calcularmos o momento de ordem 2 em relação à média, precisamos primeiro achar a média. A média fica:

Page 3: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 3

�� = 1 + 3 + 53 = 3

Agora podemos calcular o momento de ordem 2 em relação à média:

�� =1���� − ����

��

Como o momento é de ordem 2, k vale 2. Como temos três valores, n vale 3.

�� =13��� − 3��

��

�� =13 × ��1 − 3�� + �3 − 3�� + �5 − 3��� = 8

3

Alguns momentos são usados no cálculo de medidas de assimetria e curtose. Vamos a elas.

2. ASSIMETRIA

2.1. Introdução

Em vez de definir assimetria, vamos a alguns exemplos.

Considere a seguinte sequência de dados, que representam as idades de 16 pessoas.

ROL: 2, 4, 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8, 8, 10

Vamos colocar estes dados em uma tabela:

Idade Frequência

2 1

4 2

5 3

6 4

7 3

8 2

10 1

TOTAL 16

Esta sequência acima é simétrica. Temos sete valores diferentes (2, 4, 5, 6, 7, 8, 10).

Por enquanto, vamos esquecer a coluna de frequências. Vamos considerar apenas a coluna das idades. O valor do meio é o 6.

Page 4: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 4

Analisemos agora os termos vizinhos ao seis. Temos o 5 e o 7. Os dois estão igualmente distantes de 6.

Na sequência, afastando-nos do 6, temos o 4 e o 8. E ambos estão igualmente espaçados em relação a 6.

Na sequência, afastando-nos ainda mais de 6, temos o 2 e o 10. E ambos estão igualmente espaçados em relação a 6.

Pronto, vimos que, à medida que nos afastamos de 6, os valores estão, aos pares, à mesma distância do centro.

Analisemos agora as frequências.

A frequência que corresponde ao 6 é 4.

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

considerando apenas

a coluna de idades, este é o

termo do meio

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

6-1=5

6+1=7

estão a uma distância de1

em relação a 6

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

6-2=4

6+2=8

estão a uma distância de 2

em relação a 6

Idade Freqüência2 13 04 25 36 47 38 29 010 1

TOTAL 16

6-4=2

6+4=10

Estão a uma distância de

4 em relação a 6

Page 5: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 5

A partir da frequência 4, analisemos as demais frequências.

As frequências imediatamente vizinhas são 3 e 3.

Afastando-nos mais do 4, as próximas frequências também são iguais entre si (2 e 2).

E, afastando-nos ainda mais da frequência 4, as frequências continuam iguais.

Quando isto acontece, ou seja, quando os valores estão igualmente espaçados em relação ao valor central, e quando as frequências igualmente espaçadas em relação à frequência central são iguais entre si, dizemos que a sequência de dados é simétrica.

Quando uma sequência é simétrica, a média e a mediana são iguais ao termo do meio.

Neste caso, a média, a mediana (e a moda) são iguais a 6.

A visualização de uma sequência simétrica é mais fácil por meio de gráficos.

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

frequencia correspondente

ao 6

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

frequencias iguais

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

frequencias iguais

Idade Freqüência2 14 25 36 47 38 210 1

TOTAL 16

frequencias iguais

Page 6: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 6

Observe o gráfico de colunas correspondente à nossa série de dados. Se você colocar um espelho bem em cima da coluna correspondente à idade 6, as duas partes vão se sobrepor perfeitamente.

Quando os dados estão em classes, o raciocínio é análogo.

Vamos criar um outro exemplo, bem parecido:

Classes de idade Frequência

2 – 3 1

3 – 4 2

4 – 5 3

5 – 6 4

6 – 7 3

7 – 8 2

8 – 9 1

TOTAL 16

Agora, em vez de fazer um gráfico de colunas, vamos fazer um histograma.

Novamente, observe que, se colocássemos um espelho bem no meio da classe central (classe de 5 a 6), a parte esquerda se sobreporia com perfeição à parte direita.

Esta sequência de dados é simétrica.

0

1

2

3

4

5

2 3 4 5 6 7 8 9 10

Idades

Fre

qu

en

cia

Page 7: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 7

A visualização também fica facilitada por meio do polígono de frequência:

Nestes casos, a média e a mediana são justamente iguais ao ponto médio da classe central. Ou seja, são iguais ao ponto médio da classe 5 – 6. Portanto, a média e a mediana são iguais a 5,5.

Ainda em relação às sequências simétricas, em geral, a moda também coincidirá com a média e a mediana.

Usei a expressão “em geral” porque seria perfeitamente possível a seguinte situação:

Numa situação assim, a sequência continua simétrica. A média e a mediana continuam sendo iguais a 5,5 (o ponto médio da classe central).

Mas a moda não é 5,5. Pelo contrário. A classe central é a classe com menor frequência. As classes modais são as classes extremas. Nesta situação, talvez nem seja adequado falar em moda, pois os valores com maior frequência não dão mais indicação de centro. O autor Gilberto de Andrade Martins fala que se trata de um conjunto antimodal.

Mas esta situação, embora possível, não é usual. O mais “normal” é que, em sequências simétricas, a moda seja igual à média e à mediana.

0

1

2

3

4

5

2 3 4 5 6 7 8 9

Idades

Fre

qu

en

cia

s

0

1

2

3

4

5

2 3 4 5 6 7 8 9

Idades

Fre

qu

en

cia

s

Page 8: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 8

Pois bem, sempre que um conjunto de dados não for simétrico, dizemos que ele é assimétrico. Nesses casos, não será possível construir um gráfico de colunas (ou um histograma, se tivermos dados em classes) de tal forma que existam duas partes que se sobreponham com perfeição.

2.2. Formas da curva de frequência e posicionamento relativo de

média, mediana e moda

As curvas de frequência (ou os polígonos de frequência) podem ter vários formatos. Um, em especial, é algumas vezes perguntado em provas. É o que tem formato de sino:

As maiores frequências correspondem aos valores do meio. Um exemplo deste tipo de gráfico poderia ser as notas dos alunos em uma dada prova.

A grande maioria das notas girou em torno de 7.

Algumas poucas pessoas tiraram notas baixa. E tivemos algumas poucas notas altas. Note que, se colocarmos um espelho sobre o valor 7, as duas partes se sobrepõem

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

Page 9: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 9

com perfeição. A sequência é simétrica. A média é igual à mediana que é igual à moda, e todas elas são iguais a 7.

A partir deste gráfico simétrico, podemos imaginar outras curvas, assimétricas.

A primeira é a que segue:

Este gráfico já representa uma prova mais difícil, em que não houve muitas notas altas. Observe que há uma “cauda” mais alongada na parte esquerda do gráfico. Dizemos que a curva é assimétrica negativa, ou desviada à esquerda.

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

média = moda = mediana = 7

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

Page 10: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 10

Como lembrar desses nomes?

Bom, lembre sempre da cauda. A cauda está à esquerda, então a curva é desviada à esquerda. E como a cauda está mais próxima dos números negativos da reta real, então a curva é assimétrica negativa.

Para encontrar a moda não tem erro. A moda corresponde ao termo de maior frequência que, no caso, é o 7.

A média sempre estará do lado da cauda. E a mediana estará entre a média e a moda. Assim, se tivéssemos que apontar, “mais ou menos”, onde se encontram cada uma destas medidas, ficaria assim:

A moda seria igual a 7. A média estaria a esquerda de 7 (portanto, do lado da cauda). E a mediana estaria entre a média e a moda.

Agora imagine uma outra prova, em que as questões foram bem fáceis. A curva de frequências das notas seria:

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

cauda

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

média: está em

algum lugar à esquerda do 7

(portanto, do lado da cauda)

moda = 7

mediana: entre a média e a moda

Page 11: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 11

Observe que, agora, as notas são bem altas. Há uma cauda mais alongada do lado direito. Dizemos que a curva é desviada à direita ou assimétrica positiva.

Como lembrar desses nomes?

É só lembrar da cauda. Se a cauda está do lado direito, a curva é assimétrica à direita. Como a cauda está do lado dos números positivos, a assimetria é positiva.

Vamos localizar as medidas de tendência central? A moda é fácil. A moda é igual a 7.

A média, novamente, estará do lado da cauda. Será, portanto, um pouco maior que 7. E a mediana estará entre a média e a moda.

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

cauda

Page 12: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 12

Questão 1 MPE PE/2006 [FCC]

Considere a tabela a seguir:

A tabela acima apresenta a distribuição de frequências relativas do valor do salário pago aos funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário pago pela fábrica Y no mês de abril de 2006 são, respectivamente,

a) R$ 200,00 e R$ 400,00

b) R$900,00 e R$1.000,00

c) R$1.050,00 e R$1.000,00

d) R$800,00 e R$800,00

e) R$900,00 e R$900,00

Resolução:

Repare que a distribuição fornecida é simétrica.

Nesse caso, a média coincide com a mediana. Portanto, já descartamos as letras A, B e C.

0

1

2

3

4

5

6

4 5 6 7 8 9 10

Notas

freq

uen

cia

média: está em

algum lugar à direita do 7

(portanto, do lado da cauda)

moda = 7

mediana: entre a média e a moda

Page 13: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 13

Ficamos entre as letras “D” e “E”. E para achar a média (ou a mediana), não precisa de muita conta. Simplesmente adotamos o ponto médio da classe central.

9002

1000800=

+== MedianaMedia

Gabarito: E.

Questão 2 GDF SEJUS 2010 [UNIVERSA]

Considere a posição relativa da média, da moda e da mediana. É correto afirmar que nas distribuições assimétricas

(A) positivas Mo ≤ Me ≤ �� e a cauda da direita é mais comprida que a da esquerda.

(B) positivas Me ≤ Mo ≤ �� e a cauda da direita é mais comprida que a da esquerda.

(C) positivas Mo ≤ Me ≤ �� e a cauda da esquerda é mais comprida que a da direita.

(D) negativas �� ≤ Mo ≤ Me e a cauda da direita é mais comprida que a da esquerda.

(E) �� ≤ Me ≤ Mo e a cauda da esquerda é mais comprida que a da direita.

Resolução.

Observe que a questão não define qual símbolo usa para se referir à mediana e à moda. Usando o bom senso, temos que “Me” se refere à mediana e “Mo” se refere à moda.

Nas distribuições assimétricas positivas, a média é maior que a mediana, que é maior que a moda. Nesta situação, temos uma cauda do lado direito.

Gabarito: A

Questão 3 INMETRO 2010 [CESPE]

Considere que, no estudo de um processo de fabricação de rebites para uso industrial, tenham sido analisadas 36 peças, tomadas da linha de produção, ao longo de um dia, estando as medidas relacionadas ao diâmetro da cabeça dos rebites sumarizadas nas estatísticas e no gráfico seguintes.

Page 14: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 14

Considere, ainda, que �̅, � , � representam, respectivamente, a média amostral, o valor da i-ésima medida e o tamanho da amostra, e que as unidades dos valores apresentados estão de acordo com as unidades utilizadas na obtenção dos valores da tabela e do gráfico.

Com relação à média e à mediana, citadas na tabela do texto, assinale a opção correta.

A Como interpretação da média, é correto concluir que 50% dos diâmetros dos rebites estão abaixo de 6,7261 e 50% das medidas estão acima desse valor.

B Tanto média quanto mediana medem o grau de assimetria de uma distribuição de frequência.

C A mediana é corretamente calculada por

��

��÷ �

D Para o cálculo da média, é necessário que os dados estejam ordenados.

E Para distribuições simétricas, a média e a mediana são coincidentes.

Page 15: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 15

Resolução.

Letra A: não é a média quem divide os dados em duas partes com o mesmo número de elementos. É a mediana quem faz isso. Alternativa errada.

Letra B: média e mediana são medidas de posição (e não de dispersão). Alternativa errada.

Letra C: A fórmula fornecida é para o cálculo da média, e não da mediana. Alternativa errada.

Letra D: A média não depende de ordenação entre as observações. Precisamos somar todos os dados, independente da ordem em que estejam apresentados. Isto ocorre porque a ordem das parcelas não altera a soma.

Feita a soma, dividimos pelo número de observações.

Letra E: de fato, para distribuições simétricas, a média é igual à mediana.

Gabarito: E

Questão 4 INEP 2008 [CESGRANRIO]

Analise as afirmações a seguir.

Numa distribuição simétrica, a média e a mediana coincidem.

PORQUE

Numa distribuição simétrica a moda nem sempre existe.

Quanto às afirmações acima, pode-se concluir que

(A) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira.

(B) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da primeira.

(C) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa.

(D) a primeira asserção é uma proposição falsa e a segunda, uma proposição verdadeira.

(E) tanto a primeira como a segunda são proposições falsas.

Resolução.

A primeira frase está certa. Numa distribuição simétrica, média e mediana sempre coincidem.

A segunda frase também está certa. Numa distribuição simétrica, a moda pode não existir. Isso ocorre num gráfico em forma de “U” ou de “V”. Exemplo:

Page 16: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 16

A classe central tem a menor frequência. Nesta situação, as classes com maior frequência estão nas extremidades. Não seria muito apropriado falar em moda, dado que perde-se a noção de centro. Há autores que classificam estas sequências como antimodais.

E ainda teria o caso de um gráfico totalmente horizontal. Nesse caso, a curva seria amodal. Exemplo:

1, 1, 1, 2, 2, 2, 3, 3, 3.

A curva correspondente seria horizontal. Média e mediana coincidiriam (seriam iguais a 2). E a moda não existiria, pois todos os valores possuem a mesma frequência.

Entre as duas assertivas não há qualquer nexo de causalidade.

Gabarito: B

Questão 5 PM Manaus 2004 [CESGRANRIO]

A tabela apresenta uma distribuição hipotética de frequência do número de anos trabalhados, em uma amostra de 100 aposentados.

Essa distribuição:

(A) tem moda igual à média.

(B) tem moda menor que a média.

(C) é simétrica.

(D) é assimétrica à direita.

0

1

2

3

4

5

2 3 4 5 6 7 8 9

Idades

Fre

qu

en

cia

s

Page 17: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 17

(E) é assimétrica à esquerda

Resolução.

Repare que as maiores frequências se concentram nas últimas classes. Isso faz com que a moda esteja na classe 30 – 40. Note que as frequências menores (correspondentes à cauda) são pertencentes às primeiras classes. A cauda ficaria do lado esquerdo do gráfico. Seria uma curva assimétrica à esquerda. A média é menor que a mediana, que é menor que a moda.

Gabarito: E

Questão 6 TCE RO [CESGRANRIO]

A distribuição de frequência está representada no histograma a seguir.

Essa distribuição:

(A) é simétrica.

(B) apresenta assimetria à esquerda.

(C) apresenta assimetria à direita.

(D) tem média igual à mediana.

(E) tem histograma de frequência em forma de J.

Resolução.

A cauda está do lado esquerdo. A assimetria é negativa, ou “à esquerda”.

Gabarito: B

Page 18: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 18

Questão 7 Capes 2008 [CESGRANRIO]

A tabela a seguir apresenta algumas estatísticas das notas dos alunos de determinada área, que participaram do ENADE 2006.

Analisando-se os dados da tabela conclui-se que

(A) a distribuição das notas é assimétrica à esquerda nos dois grupos de estudantes.

(B) a distribuição das notas dos concluintes apresenta-se mais homogênea do que a dos ingressantes.

(C) pelo menos metade dos alunos ingressantes não alcançou a média de 1,9.

(D) mais de 90,0% dos alunos dessa área compareceram ao ENADE 2006.

(E) mais alunos ingressantes do que concluintes dessa área compareceram ao ENADE 2006.

Resolução.

Notem que a média é maior que a mediana, o que indica que a cauda está do lado direito da curva. Seria uma distribuição assimétrica à direita. A letra “A” está errada.

Na letra “B”, temos uma afirmação sobre qual distribuição é mais homogênea. Uma distribuição é dita homogênea quando apresenta baixa dispersão relativa (isto é, seu coeficiente de variação é baixo).

A alternativa “B” pretende comparar os ingressantes com os concluintes, segundo a homogeneidade da distribuição. Em resumo, temos que ver qual apresenta menor coeficiente de variação.

26,29,1

3,4_ ==esingressantCV ; 27,2

6,3

2,8int_ ==esconcluCV

Temos que o menor CV é o dos ingressantes. Portanto, estes apresentam uma distribuição mais homogênea. A alternativa está errada.

Page 19: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 19

Na verdade, os dois coeficientes foram muito altos, e praticamente iguais. Isto indica que as duas distribuições são bastante heterogêneas.

O livro “Princípios de Estatística” de Gilberto de Andrade Martins e Denis Donaire, apesar de não usar a expressão “homogêneo”, indica que:

“Para efeitos práticos, costuma-se considerar que CV superior a 50% indica alto grau de dispersão e, consequentemente, pequena representatividade da média. Enquanto que para valores inferiores a 50%, a média será tanto mais representativa do fato quanto menor for o valor de seu CV”

A letra “C” está correta. Se a mediana dos ingressantes é igual a zero é porque metade dos alunos tirou nota menor ou igual a zero. Esses mesmos alunos, portanto, não alcançaram a média de 1,9.

Gabarito: C

Questão 8 Petrobras 2005 [CESGRANRIO]

A tabela apresenta uma distribuição hipotética de frequência do número de anos trabalhados, em uma amostra de 100 aposentados.

A distribuição:

(A) é simétrica.

(B) é assimétrica à esquerda.

(C) é assimétrica à direita.

(D) tem moda menor que a média.

(E) tem moda igual à média.

Resolução.

A cauda está do lado esquerdo do gráfico de frequências. É uma curva assimétrica à esquerda.

Gabarito: B

Questão 9 TRT 3ª REGIAO 2009 [FCC]

Considere uma curva de uma distribuição estatística unimodal apresentando o valor da mediana superior ao valor da moda e o valor da média aritmética superior ao valor da

Page 20: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 20

mediana. Então, com relação às medidas de assimetria e curtose é correto afirmar que se trata de uma curva apresentando uma distribuição

(A) leptocúrtica.

(B) platicúrtica.

(C) assimétrica à esquerda.

(D) assimétrica à direita.

(E) com coeficiente de curtose igual ao da curva normal.

Resolução:

Quando a média é maior que a mediana, que é maior que a moda, temos uma curva positivamente assimétrica, ou assimétrica à direita.

Gabarito: D

As alternativas “a”, “b” e “e” se referem à curtose, que veremos mais adiante.

2.3. Outros tipos de posicionamento relativo de média, mediana e

moda

Agora vamos ver um assunto pouquíssimo cobrado. Na verdade, encontrei uma única questão sobre ele. De todo modo, como está relacionado com o posicionamento relativo de média, mediana e moda, vamos vê-lo.

O posicionamento relativo de média, mediana e moda que estudamos vale para conjuntos de dados “bem comportados”.

Assim, na distribuição positivamente assimétrica, a média é maior que a mediana, que é maior que a moda.

No conjunto negativamente assimétrico, a média é menor que a mediana, que é menor que a moda.

Pois bem. Existem conjuntos de dados que não se enquadram em nenhuma destas configurações. Para entender melhor o porquê disso, vamos fazer uma analogia com a física.

Se imaginarmos que o histograma (se os dados estiverem em classes) ou o gráfico de colunas (se os dados estiverem agrupados por valor) corresponde a um conjunto de “pesinhos” (ou de “barrinhas”) dispostos ao longo de uma haste inflexível, que equivale à reta real, o ponto de apoio em que o sistema fica em equilíbrio corresponde justamente à média.

Como exemplo, considerem o seguinte conjunto de dados, representado por um gráfico de colunas.

Page 21: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 21

A média desse conjunto é igual a 3,38 (aproximadamente). Se considerarmos que cada coluna corresponde a uma barra e que todas elas são feitas de material homogêneo, então seus pesos são diretamente proporcionais às suas alturas. Como todas elas têm a mesma base, as barras com maior altura serão mais pesadas.

Caso o eixo das abscissas seja uma haste em que se pretendem equilibrar as barras, o ponto de apoio de tal forma que o equilíbrio se mantenha é justamente 3,38, indicado, na figura abaixo, pela seta vermelha.

Não vou colocar a demonstração disso aqui, mas, para quem tiver curiosidade, é basicamente a mesma coisa que aprendemos lá no ensino médio, quando estudamos física. Basta considerar que as forças são proporcionais às alturas das barras e fazer a condição de que a soma dos produtos força×distância é nula. Você encontrará que o

Page 22: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 22

ponto de apoio em relação ao qual devem ser calculadas as distâncias para que isso aconteça é justamente a média aritmética.

Reparem que as barrinhas à direita da seta são mais leves. A soma de suas alturas é 48.

As barrinhas à esquerda da seta são mais pesadas (a soma de suas alturas é 85).

Acontece que as barrinhas mais leves estão mais distantes do ponto de apoio, o que compensa o seu peso menor e faz com que a soma de momentos total seja nula. Em resumo, os torques que atuam no sentido horário compensam os que atuam no sentido anti-horário e o sistema fica em equilíbrio.

A analogia da média com os braços de alavanca lá da física ajuda a entender porque, numa distribuição positivamente assimétrica, a média é maior que a mediana.

Caso o ponto de apoio seja fixado junto à mediana, a soma dos pesos das barras à sua direita seria igual à soma dos pesos das barras à sua esquerda. Contudo, as barras da direita, mais afastadas do ponto de apoio, ganhariam a “batalha”, fazendo um braço de alavanca maior, fazendo com que a haste (representada pela reta real) tombasse para a direita.

Logo, o ponto de apoio deve estar um pouco à direita da mediana, tendo um efeito duplo: diminuir a distância das barras da direita até o ponto de apoio; diminuir o peso total das barras da direita. Esses dois efeitos permitem o equilíbrio do sistema, que ocorrerá justamente quando o apoio for colocado sobre a média aritmética.

É claro que, numa distribuição negativamente assimétrica, o raciocínio é análogo.

Então, neste gráfico padrão, bem representativo de uma distribuição positivamente assimétrica, temos:

Page 23: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 23

O problema surge quando o conjunto de dados não é “bem comportado”.

Se fizermos qualquer alteração neste padrão, pode ser que o posicionamento relativo de média, mediana e moda fique prejudicado.

Exemplo: se tivermos uma barra grande afastada da média, ou se tivermos uma barra pequena muito próxima da média, ou se tivermos barras grandes tanto do lado direito quanto do lado esquerdo, ou se tivermos barras pequenas tanto do lado esquerdo, quanto do lado direito.

Enfim, há várias formas de fugirmos do padrão.

A título de exemplo, considere a seguinte sequência:

Page 24: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 24

É uma sequência positivamente assimétrica, com média 4,2. Há uma cauda do lado direito. As barrinhas menores estão mais afastadas da média do que as barras grandes.

A média (=4,2) é maior que a mediana (=4), que é maior que a moda (=3).

A partir do gráfico acima, vamos construir outro conjunto, “criando buracos”. Serão as mesmas barras, mas, entre elas, haverá alguns espaços vazios:

O que é que acabamos de fazer?

Fizemos com que uma barra grande ficasse afastada da média, o que antes só acontecia para barras pequenas.

Isso altera tudo.

Agora a média é 6,81, a mediana é 7 e a moda é 6.

O posicionamento relativo de média, mediana e moda “já era”. Agora a média está entre a mediana e a moda, o que não é característico nem de uma curva assimétrica positiva, nem de uma assimétrica negativa. E por que é que isso aconteceu? Porque,

Page 25: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 25

para uma das barras mais pesadas, nós criamos uma distância grande em relação ao ponto de apoio, o que, antes, só acontecia com as barras leves.

Vamos ver duas questões sobre isso. Na primeira, o intuito da questão não era trabalhar com estes casos “fora do padrão”. Houve claramente um erro no enunciado.

Na segunda questão, aí sim, a banca queria claramente cobrar o posicionamento relativo de média, mediana e moda para estes casos “fora do padrão”.

Questão 10 Prefeitura Municipal de Natal – 2008 [ESAF]

A coleta de dados do município, relativa ao ensino fundamental, apresentou a seguinte composição etária:

Composição Etária dos Alunos do Ensino Fundamental:

Faixa Etária Masc. Fem.

Até 06 anos 9.000 10.200

De 07 a 08 anos 10.000 9.300

De 09 a 10 anos 8.000 8.500

De 11 a 12 anos 7.000 5.500

De 12 a 14 anos 5.000 3.500

De 15 a 18 anos 3.000 2.500

Acima de 18 anos 1.000 1.500

Total 43.200 40.800

Com base nos dados acima, temos as seguintes sentenças:

I. A Moda está na faixa etária até os 06 anos.

II. A Média de alunos está na faixa etária de 12 a 14 anos.

III. A Mediana é superior à média.

Apontando nos 3 (três) itens acima como V – Verdadeiro e F – Falso, a opção correta é:

a) V, V, V

b) V, F, V

c) F, V, F

d) F, F, F

e) V, V, F

Resolução:

Observe que as classes têm amplitudes diferentes.

O primeiro item é sobre a moda. Não se pediu o cálculo da moda. Apenas se afirmou que a classe modal era a primeira, o que é falso.

Page 26: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 26

A segunda classe (de 7 a 8 anos) tem a maior frequência absoluta (19.300) e, o que é

realmente importante, a maior relação hf (densidade de frequência).

Algumas críticas à questão. Em primeiro lugar, a última linha (com os totais) está errada, não representando realmente as somas das colunas.

Em segundo lugar, ‘faltaram classes’. De acordo com a tabela acima, não há nenhum aluno com 8 anos e tantos meses. Ou com 10 anos e tantos meses. Ou com 14 anos e tantos meses. Embora seja uma situação possível, é bastante improvável.

Estas classes faltantes dificultam um pouco a resposta ao item III, sendo necessário que o candidato faça algumas suposições.

Reescrevendo a tabela, corrigindo a linha com os totais, temos:

Faixa Etária Masc. Fem. Total

Até 06 anos 9.000 10.200 19.200

De 07 a 08 anos 10.000 9.300 19.300

De 09 a 10 anos 8.000 8.500 16.500

De 11 a 12 anos 7.000 5.500 12.500

De 12 a 14 anos 5.000 3.500 8.500

De 15 a 18 anos 3.000 2.500 5.500

Acima de 18 anos 1.000 1.500 2.500

Total 43.000 41.000 84.000

O segundo item afirma que a média está na classe 12 a 14 anos. Sem fazer contas, isto é falso.

Notem como as quatro primeiras classes têm muito mais alunos que as três últimas. A média deve ser menor que 12 anos.

De todo modo, vamos fazer as contas.

Para achar a média, supomos que todas as idades correspondam ao ponto médio das classes. Só que para a primeira e a última classes não foram fornecidos os dois limites. Na primeira classe só foi fornecido o limite superior. Na última classe só foi fornecido o limite inferior.

Vamos tentar elevar ao máximo a média. Vamos supor que a primeira classe represente um valor único (represente apenas as crianças com exatamente 6 anos). E vamos supor que o limite superior da última classe seja 50 anos (uma idade extremamente alta para o ensino fundamental).

A média, nesta situação ‘exagerada’, ficaria:

Page 27: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 27

Faixa Etária Ponto médio da classe ( X )

f fX ×

6 anos 6 19.200 115.200,00

De 07 a 08 anos 7,5 19.300 144.750,00

De 09 a 10 anos 9,5 16.500 156.750,00

De 11 a 12 anos 11,5 12.500 143.750,00

De 12 a 14 anos 13 8.500 110.500,00

De 15 a 18 anos 16,5 5.500 90.750,00

De 18 a 50 anos 34 2.500 85.000,00

Total 84.000 846.700

08,10000.84

700.846≅=X

Ou seja, mesmo numa situação exagerada, a média não ficou na classe de 12 a 14 anos. Ficou bem longe disso. O segundo item está falso.

Agora vamos à mediana.

Creio que a intenção da questão era que o candidato usasse as propriedades de assimetria. Esta curva seria assimétrica à direita. A média é maior que a mediana, que é maior que a moda. Concluímos que o terceiro item também está falso. E a resposta é a letra D.

Gabarito: D

Pronto, utilizamos o posicionamento relativo de média, mediana e moda para sequências assimétricas. Esse era provavelmente o intuito da banca.

Só que tem um porém.

Essa questão tem uma falha que atrapalha um pouco as coisas. Esse posicionamento relativo de média, mediana e moda vale quando a curva é mais “bem comportada”. Não é o caso desses dados acima. Como já dissemos, há várias classes faltantes, o que tornam esta curva atípica. Em situações assim, não há garantias que média, mediana e moda obedeçam ao posicionamento visto.

Basta retomar o exemplo que demos acima, em que criamos um “buraco” no gráfico, um espaço vazio entre as barras. Isso fez com que uma barra grande ficasse afastada da média, e alterasse o posicionamento relativo de média, mediana e moda.

Para resolver com segurança a questão, teríamos que fazer mais algumas contas.

Contudo, vou deixar de faze-lo. Acho que não vale a pena perdermos tempo com trabalho meramente “braçal” por conta de um enunciado com falhas.

E, agora sim, vejamos uma questão sem falhas, em que a banca claramente quis cobrar o posicionamento relativo de média, mediana e moda para dados “fora do padrão”.

Page 28: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 28

Questão 11 TRE PI 2009 [FCC]

Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico em que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o número de eleitores verificado por domicílio.

Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e a moda (Mo) correspondentes tem-se que:

(A) Me = Md e Md < Mo

(B) Me < Md < Mo

(C) Me < Md e Md > Mo

(D) Me < Md e Md = Mo

(E) Me > Md e Md = Mo

Resolução

As menores barras, de longe, são as que têm altura 5.

No gráfico, há uma barra pequena do lado direito, outra do lado esquerdo. Ou seja, uma de cada lado da média. Isso pode atrapalhar o posicionamento “padrão” de média, mediana e moda.

A moda é fácil de identificar. A moda é igual a 2, que é o termo de maior frequência.

� = 2

Vamos à mediana. São 160 termos. A mediana é igual à média dos termos centrais (X80 e X81).

Page 29: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 29

X Frequência simples Frequência acumulada

0 5 5

1 20 25

2 50 75

3 40 115

4 30 145

5 10 155

6 5 160

Concluímos que �� = ��� = ��! = ��" = �!# = �!� = ⋯ = ���% = 3

A mediana vale 3.

& = 3

Falta a média. Vamos determinar onde se encontra a média, sem efetivamente calculá-la, para ganhar tempo.

Para tanto, vamos lembrar do paralelo com a física. A média corresponde ao ponto de apoio em que o sistema fica em equilíbrio.

Se o ponto de apoio ficasse sob o 3, a haste penderia para a esquerda. Vejam:

Logo, para que a haste não penda para a esquerda, o ponto de apoio deve ficar um pouco a esquerda de 3. Ou seja, a média é menor que 3.

Disto concluímos que a média é menor que a mediana.

Juntando tudo, a moda é menor que a média, que é menor que a mediana.

Este posicionamento não é característico nem de uma distribuições positivamente assimétrica, nem de uma negativamente assimétrica.

Gabarito: C

Page 30: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 30

2.4. Assimetria e diferença entre os quartis

As diferenças entre os quartis ajudam a identificar se a curva é positivamente assimétrica ou negativamente assimétrica.

Vejamos alguns exercícios sobre isso.

Questão 12 PM Manaus 2004 [CESGRANRIO]

Os quartis de uma distribuição são Q1 = 4, Q2 = 6 e Q3 = 10. Essa distribuição:

(A) é simétrica.

(B) é assimétrica à direita.

(C) é assimétrica à esquerda.

(D) tem moda maior que a média.

(E) tem moda igual à média

Resolução.

As diferenças entre os quartis podem nos indicar a assimetria da curva.

Considere os seguintes conjuntos:

A: 1, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5

B: 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 6, 7, 8, 9

C: 1, 2, 3, 4, 5, 5, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9

O conjunto “A” é simétrico. Se você fizer um gráfico de colunas, perceberá isso.

Os quartis do conjunto A são:

5,21 =Q ; 32 =Q ; 5,33 =Q

Observe que:

Page 31: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 31

5,01223 =−=− QQQQ

Quando o conjunto é simétrico, a diferença entre o terceiro e o segundo quartil é igual à diferença entre o segundo e o primeiro quartil. Logo:

0)()( 1223 =−−− QQQQ

Vamos para o conjunto B. Se você fizer seu gráfico de colunas, verá que ele é assimétrico à direita (positivamente assimétrico).

Observe a cauda do lado direito.

Vamos calcular seus quartis.

21 =Q ; 5,32 =Q ; 5,53 =Q

Observe que:

1223 QQQQ −>−

Ou ainda:

0)()( 1223 >−−− QQQQ

Por fim, o conjunto C é assimétrico à esquerda. Observe o gráfico.

Page 32: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 32

Agora temos:

5,41 =Q ; 5,62 =Q ; 83 =Q

Observe que:

1223 QQQQ −<−

Ou ainda:

0)()( 1223 <−−− QQQQ

Podemos montar o seguinte quadro resumo:

)()( 1223 QQQQ −−− Resultado

= 0 indicativo de que o conjunto é simétrico

< 0 indicativo de que o conjunto é negativamente assimétrico

> 0 indicativo de que o conjunto é positivamente assimétrico

Aplicando esse resultado à questão da Cesgranrio, temos:

)()( 1223 QQQQ −−− = )46()610( −−−

)()( 1223 QQQQ −−− = 224 =−

A distribuição é positivamente assimétrica (ou assimétrica à direita).

Gabarito: B

Page 33: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 33

Questão 13 ABIN 2010 [CESPE]

A figura acima apresenta esquematicamente as distribuições das alturas (em cm) dos estudantes das três turmas de uma escola. As linhas verticais de cada box-plot se estendem até os valores extremos da distribuição. Com base nessas informações, julgue os itens consecutivos.

86 A turma 3 tem a maior amplitude de alturas.

87 As distribuições das alturas referentes às turmas 2 e 3 são simétricas.

88 Entre os estudantes da turma 1, 75% possuem alturas iguais ou superiores a 160 cm, enquanto metade dos estudantes da turma 3 tem altura igual ou inferior a 160 cm.

Resolução.

Item 86.

As amplitudes são:

- Turma 1: 180 – 120 = 60

- Turma 2: 180 – 110 = 70

- Turma 3: 190 – 110 = 80

A maior amplitude é a da Tuma 3.

Item certo.

Item 87.

Para a turma 2, temos:

�'� − '�� − �'� − '�� = �160 − 140� − �140 − 130� = 20 − 10 = 10

Page 34: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 34

Isto indica assimetria positiva.

Já podemos afirmar que o item está errado.

Item 88.

Para os estudantes da turma 1, o terceiro quartil é 160 cm. Logo, 75% dos estudantes têm altura menor que 160 cm. O item está errado.

Gabarito: certo, errado, errado

2.5. Coeficientes de assimetria

Vimos que, quando é possível colocar um espelho sobre a curva de frequências, de forma que as duas partes do gráfico se sobreponham com perfeição, temos uma curva simétrica.

Caso contrário, temos uma curva assimétrica. Pode ser assimétrica negativa ou positiva.

Só que existem curvas que são bastante assimétricas (ou seja, as duas partes da curva são bem diferentes uma da outra). E existem curvas pouco assimétricas (as duas partes ‘por pouco’ não se sobrepõem).

A partir de agora veremos medidas que nos indicam o quão assimétrica é uma curva. São as medidas de assimetria.

Iremos trabalhar com as seguintes medidas de assimetria:

• Primeiro coeficiente de Assimetria de Pearson (A1)

• Segundo coeficiente de Assimetria de Pearson (A2)

• Coeficiente quartílico de Assimetria (As)

• Índice momento de assimetria (a3)

Para distribuições pouco assimétricas, existe uma fórmula (aproximada) que relaciona média, mediana e moda. É a relação empírica de Pearson.

� ≈ 3& − 2��

Onde M representa a moda, D a mediana e X a média.

Como vimos, em distribuições simétricas, a média e a moda coincidem. Assim, uma medida que nos permite avaliar o quanto uma curva é assimétrica ou, contrariamente, o quanto se aproxima de uma curva simétrica, é justamente a diferença entre a média e a moda. O primeiro coeficiente de assimetria de Pearson trabalha justamente com essas duas grandezas. Sua fórmula é dada por:

-� =�� −�.

Page 35: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 35

Onde �� é a média, M é a moda, S é o desvio padrão e A1 é o primeiro coeficiente de assimetria de Pearson.

Primeiro coeficiente de assimetria de Pearson:

-� =�� −�.

Se a média e a moda forem bastante diferentes, então o conjunto de dados é bastante assimétrico. Se a moda for praticamente igual à média, o coeficiente de assimetria é praticamente nulo. Isto significa que a sequência é praticamente simétrica.

O que acontece se o primeiro coeficiente de assimetria de Pearson for positivo? A curva é assimétrica à direita ou à esquerda?

Bom, se o primeiro coeficiente de assimetria for positivo, isto significa que a média é maior que a moda. Portanto, a média está mais à direita. E, se a média está à direita, a cauda também está à direita. Portanto, a curva é assimétrica à direita ou positiva.

A partir da fórmula do primeiro coeficiente de assimetria, podemos fazer algumas transformações.

Lembrando da aproximação � ≈ 3& − 2��, temos:

�� − �. ≈ �� − �3& − 2���

. = 3�� − 3&.

A expressão acima representa o segundo coeficiente de assimetria de Pearson.

Segundo coeficiente de assimetria de Pearson:

-� =3�� − 3&

.

Se a média é maior que a mediana, então a sequência é assimétrica positiva e o coeficiente de assimetria acima definido será maior que zero.

Se a média for menor que a mediana, então a sequência é assimétrica negativa e o coeficiente de assimetria acima será menor que zero.

Outro coeficiente de assimetria comumente empregado é o coeficiente quartílico de assimetria, dado por:

Page 36: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 36

-/ =�'� − '�� − �'� − '��

'� − '�

Em que Q3 representa o terceiro quartil, Q2 representa o segundo quartil Q1 representa o primeiro quartil.

Coeficiente quartílico de assimetria

-/ =�'� − '�� − �'� − '��

'� − '�

Se )( 23 QQ − for maior que )( 12 QQ − , então o coeficiente acima será positivo.

Significa também que os valores entre o segundo e o terceiro quartil estão mais espalhados, mais distantes um dos outros, o que sugere uma cauda do lado direito (assimetria positiva).

Se )( 23 QQ − for menor que )( 12 QQ − , o coeficiente será negativo, sugerindo uma

assimetria negativa.

Temos ainda o índice momento de assimetria, dado pela seguinte fórmula:

0� =��.�

Onde,

�� =1� ×��� − ����

��

e

.� = . × .�

Vale lembrar que m3 é o momento de ordem 3 em relação à média. E S é o desvio padrão, S2 é a variância e n é o número de dados.

Vamos agora entender o numerador da fórmula do coeficiente momento de assimetria.

Para tanto, vamos relembrar da analogia com a física. Consideramos o gráfico de barras correspondente a um conjunto de dados. As barrinhas estão apoiadas em uma haste inflexível (reta real). O ponto de apoio para o qual o sistema fica em equilíbrio é a média aritmética.

Relembrando o exemplo já trabalhado nessa aula:

Page 37: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 37

Se o ponto de apoio for colocado em 3,38 (seta vermelha, correspondente à média aritmética), o sistema fica em equilíbrio.

Agora vejam o numerador do coeficiente de assimetria:

1� ×��� − ����

��

Quando subtraímos todos os valores da média aritmética, todas as barrinhas são deslocadas para perto da origem. Agora, o ponto de equilíbrio não é mais em torno da média (3,38), e sim em torno de zero.

Depois, elevamos todos os valores ao cubo. Aquelas barras que estavam mais distantes da origem ficarão ainda mais distantes. Aquelas que estavam bem perto ficarão só um pouco mais distantes (ou, conforme o caso, podem até ficar mais perto ainda).

Deste modo, se o ponto de apoio continuar em zero, não haverá mais equilíbrio. As barrinhas mais leves terão a seu favor braços de alavanca bem maiores, pois agora estão ainda mais distantes do ponto de apoio. Se quisermos manter o equilíbrio, teremos que deslocar o ponto de apoio para a direita de zero. Isso indica que a média dos cubos dos desvios é maior que zero, o que implica num índice momento de assimetria também positivo.

Isso tudo aconteceu porque partimos de uma sequência assimétrica positiva. Caso contrário, se partíssemos de uma sequência assimétrica negativa, aí o coeficiente de assimetria seria, também, negativo.

Page 38: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 38

Índice momento de assimetria

0� =��.�

Resumindo tudo. Quando uma distribuição é simétrica, todos os coeficientes de assimetria são nulos. Quanto maior o módulo do coeficiente, mais assimétrica é a distribuição. Quando os coeficientes são positivos, a assimetria é positiva. Quando os coeficientes são negativos, a assimetria é negativa.

Como vocês podem ver, todos os coeficientes de assimetria são simplesmente combinações de medidas que já estudamos. Envolvem cálculo de média, mediana, moda, desvio padrão, variância, etc. Todas estas medidas, combinadas, fornecem cada um dos coeficientes.

Então o trabalho é meio que decorar as fórmulas das medidas de assimetria e aplicá-las em cada exercício.

Questão 14 AFRF 2002/1 [ESAF]

Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de frequências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes com os extremos das classes.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. (Obs: considere que você já sabe que a média é igual a 138)

a) 3/S

b) 4/S

c) 5/S

Page 39: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 39

d) 6/S

e) 0

Resolução:

Em outra questão dessa mesma prova o candidato já precisava ter calculado a média (que vale 138). Como nosso objetivo aqui é treinar as medidas de assimetria, vamos considerar que o valor da média é conhecido.

Lembrando a fórmula do primeiro coeficiente de Pearson:

S

MXA

−=1

Onde X é a média, M é a moda e S é o desvio padrão.

A média é conhecida. Portanto, para encontrar o coeficiente de Pearson, basta encontrar a moda.

Ou seja, no fundo, o exercício é de moda para dados em classes. Nós vimos lá na aula 2 que basta aplicar a fórmula de Czuber.

Antes de fazermos qualquer coisa, lembrem-se de que, para achar a moda, sempre trabalhamos com frequências simples. Pode ser absoluta ou relativa, mas tem que ser simples. A tabela fornecida contém frequências acumuladas. Temos que transformá-las para frequências simples.

Classes Memória De cálculo

Frequência relativa simples

(%)

Frequência relativa acumulada

(%)

70-90 =5 5 5

90-110 =15-5 10 15

110-130 =40-15 25 40

130-150 =70-40 30 70

150-170 =85-70 15 85

170-190 =95-85 10 95

190-210 =100-95 5 100

Pronto, já temos as frequências simples.

Agora encontramos a classe modal. A classe modal é a classe com maior frequência simples.

Page 40: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 40

Classes Frequência relativa simples (%)

70-90 5

90-110 10

Classe anterior 110-130 25

Classe modal 130-150 30

Classe posterior 150-170 15

170-190 10

190-210 5

Tendo a classe modal, determinamos as classes anterior e posterior, bem como suas frequências. A frequência da classe anterior é 25. E da classe posterior é 15.

Agora encontramos a amplitude da classe modal e seus limites inferior e superior.

O limite inferior é 130. O superior é 150. E a amplitude é 20.

Agora é só aplicar a fórmula:

)()( postMantM

antM

Mffff

ffhlM

−+−

−+=

13520

520130

)1530()2530(

253020130 =×+=

−+−

−×+=M

Agora já temos a média e a moda. Já dá para calcular o coeficiente de Pearson.

S

MXA

−=1

SSA

31351381 =

−=

Gabarito: A.

Questão 15 AFRF/2002-2 [ESAF]

O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequências seguinte (obs: considere que você já sabe que a mediana é igual a 71,04):

Classes Frequência (f)

29,5-39,5 4

39,5-49,5 8

49,5-59,5 14

59,5-69,5 20

69,5-79,5 26

79,5-89,5 18

89,5-99,5 10

Assinale a opção que dá o valor do coeficiente quartílico de assimetria

Page 41: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 41

a) 0,080

b) -0,206

c) 0,000

d) -0,095

e) 0,300

Resolução:

A fórmula do coeficiente quartílico de assimetria é:

13

1223 )()(

QQ

QQQQAs

−−−=

Ou seja, precisamos encontrar o primeiro, o segundo e o terceiro quartis.

Conclusão: mais uma questão de medidas separatrizes para dados em classes.

Para trabalhar com medidas separatrizes sempre usamos frequências acumuladas. Pode ser relativa ou simples, mas tem que ser acumulada.

A tabela deu frequências simples. Vamos passar para frequências acumuladas.

Classes Frequência simples (f)

Frequência Acumulada (F)

Memória de Cálculo

29,5-39,5 4 4 =4

39,5-49,5 8 12 =4+8

49,5-59,5 14 26 =12+14

59,5-69,5 20 46 =26+20

69,5-79,5 26 72 =46+26

79,5-89,5 18 90 =72+18

89,5-99,5 10 100 =90+10

Vamos achar os quartis.

O primeiro quartil é o valor que não é superado por 25% das observações. Como temos 100 observações, então o primeiro quartil não é superado por 25 valores.

Se a pergunta fosse qual o valor que não é superado por 12 observações, a resposta seria 49,5. Sem contas, bastando consultar a tabela.

E se a pergunta fosse qual o valor que não é superado por 26 observações, a resposta seria 59,5. Contudo, a pergunta é: qual o valor que não é superado por 25 observações. E 25 não tem na coluna de frequência acumulada.

Page 42: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 42

Classes Frequência Acumulada (F)

29,5-39,5 4

39,5-49,5 12

49,5-59,5 26

59,5-69,5 46

69,5-79,5 72

79,5-89,5 90

89,5-99,5 100

49,5 12 49,5 corresponde a 12

Z 25 Quem corresponde a 25?

59,5 26 59,5 corresponde a 26

Primeira linha 49,5 12

Segunda linha Z 25

Terceira linha 59,5 26

Subtraindo as linhas:

5,49−Z 1225 −

5,495,59 − 1226 −

Essas diferenças são proporcionais:

1226

1225

5,495,59

5,49

−=

−Z

14

13

10

5,49=

−Z

8,5814

1305,49 ≅+=Z

Portanto, o primeiro quartil é (aproximadamente) igual a 58,8.

8,581 =Q

O segundo quartil corresponde à mediana. Nós já o calculamos lá na aula 3 (EC 4).

04,712 =Q

O terceiro quartil é o valor que não é superado por 75 observações.

Page 43: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 43

Classes Frequência Acumulada (F)

29,5-39,5 4

39,5-49,5 12

49,5-59,5 26

59,5–69,5 46

69,5-79,5 72

79,5-89,5 90

89,5-99,5 100

79,5 72 79,5 corresponde a 72

Z 75 Quem corresponde a 75?

89,5 90 89,5 corresponde a 90

Primeira linha 79,5 72

Segunda linha Z 75

Terceira linha 89,5 90

Subtraindo as linhas:

5,79−Z 7275 −

5,795,89 − 7290 −

Essas diferenças são proporcionais:

7290

7275

5,795,89

5,79

−=

−Z

18

3

10

5,79=

−Z

17,8118

305,79 ≅+=Z

17,813 =Q

E o coeficiente de assimetria fica:

13

1223 )()(

QQ

QQQQAs

−−−=

094,037,22

11,2

37,22

24,1213,10

8,5817,81

)8,5804,71()04,7117,81(−≅

−=

−=

−−−=sA

Gabarito: D.

Questão 16 AFRF/2003 [ESAF]

Considere a tabela de frequências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes.

Page 44: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 44

Classes Frequências Acumuladas

2.000 - 4.000 5

4.000 - 6.000 16

6.000 - 8.000 42

8.000 - 10.000 77

10.000 - 12.000 89

12.000 - 14.000 100

Assinale a opção que corresponde ao valor do coeficiente de assimetria percentilico da amostra de X, baseado no 1º, 5º e 9º decis.

a) 0,024

b) 0,300

c) 0,010

d) - 0,300

e) - 0,028

Resolução:

O único coeficiente de assimetria que vimos, baseado em medidas separatrizes, foi o coeficiente quartílico de assimetria. Sua fórmula é:

13

1223 )()(

QQ

QQQQAs

−−−=

Pois bem, aqui a questão fala em coeficiente percentílico, baseado nos decis 1, 5 e 9.

Confesso que eu não conhecia este coeficiente. Só fui ver sua cobrança nesta questão da ESAF. A primeira vez que eu a vi, resolvi por analogia.

Se o coeficiente quartílico é dado por

13

1223 )()(

QQ

QQQQAs

−−−= ,

então um coeficiente que seja baseado nos decis 9, 5 e 1 ficaria:

( ) ( )

19

1559

DD

DDDD

−−−

E, de fato, esta é a fórmula que leva à resposta correta. Então, fica a informação sobre este “novo coeficiente”.

Coeficiente percentílico de assimetria baseado nos decis 1, 5 e 9:

( ) ( )

19

1559

DD

DDDD

−−−

Para encontrarmos a resposta, precisamos, portanto, achar o primeiro decil, o quinto decil, e o nono decil.

Page 45: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 45

No fundo, é uma questão sobre medidas separatrizes para dados em classes, matéria que, como já frisamos lá na aula 3, é a mais importante do curso de estatística descritiva (tomando como base o número de questões cobradas).

As frequências fornecidas já são acumuladas. Não precisamos fazer transformação alguma.

Comecemos encontrando o primeiro decil. O primeiro decil é o valor que não é superado por 10% das observações. Como temos 100 observações, o primeiro decil é o valor que não é superado por 10 observações.

Classes Frequências Acumuladas

2.000 - 4.000 5

4.000 - 6.000 16

6.000 - 8.000 42

8.000 - 10.000 77

10.000 - 12.000 89

12.000 - 14.000 100

4.000 5 4.000 corresponde a 5

Z 10 Quem corresponde a 10?

6.000 16 6.000 corresponde a 16

Primeira linha 4.000 5

Segunda linha Z 10

Terceira linha 6.000 16

Subtraindo as linhas:

000.4−Z 510 − 000.4000.6 − 516 −

Essas diferenças são proporcionais:

516

510

000.4000.6

000.4

−=

−Z

11

5

000.2

000.4=

−Z

909.411

000.10000.4 ≅+=Z

O primeiro decil vale 4.909.

909.41 =D

Agora vamos encontrar o quinto decil. O quinto decil é o valor que não é superado por 50% observações. Coincide com a mediana.

Page 46: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 46

Classes Frequências Acumuladas

2.000 - 4.000 5

4.000 - 6.000 16

6.000 - 8.000 42

8.000 - 10.000 77

10.000 - 12.000 89

12.000 - 14.000 100

8.000 42 8.000 corresponde a 42

Z 50 Quem corresponde a 50?

10.000 77 10.000 corresponde a 77

Primeira linha 8.000 42

Segunda linha Z 50

Terceira linha 10.000 77

Subtraindo as linhas:

000.8−Z 4250 − 000.8000.10 − 4277 −

Estas diferenças são proporcionais:

4277

4250

000.8000.10

000.8

−=

−Z

35

8

000.2

000.8=

−Z

457.835

000.28000.8 ≅

×+=Z

O quinto decil é igual a 8.457.

457.85 =D

Por fim, o nono decil. O nono decil não é superado por 90% das observações.

Classes Frequências Acumuladas

2.000 - 4.000 5

4.000 - 6.000 16

6.000 - 8.000 42

8.000 - 10.000 77

10.000 - 12.000 89

12.000 - 14.000 100

Page 47: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 47

12.000 89 12.000 corresponde a 89

Z 90 Quem corresponde a 90?

14.000 100 14.000 corresponde a 100

Primeira linha 12.000 89

Segunda linha Z 90

Terceira linha 14.000 100

Subtraindo as linhas:

000.12−Z 8990 − 000.12000.14 − 89100 −

Estas diferenças são proporcionais:

8910

8990

000.12000.14

000.12

−=

−Z

11

1

000.2

000.12=

−Z

182.1211

000.2000.12 ≅+=Z

Portanto, o nono decil vale 12.182.

Agora vamos encontrar o coeficiente de assimetria:

( ) ( )

19

1559

DD

DDDD

−−−

O coeficiente fica:

( ) ( )024,0

273.7

177

273.7

3548725.3

909.4182.12

909.4457.8457.8182.12≅=

−=

−−−

Gabarito: A.

Questão 17 Ministério da Integração Nacional 2012 [ESAF]

A distribuição de frequências em classes do salário mensal x, medido em número de salários mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a seguir.

Page 48: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 48

Pelo valor do quociente entre o momento centrado de terceira ordem e o cubo do desvio padrão da distribuição de frequências apresentada acima, pode-se concluir que a distribuição

a) é mesocúrtica

b) é simétrica

c) possui assimetria negativa

d) possui assimetria positiva

e) é leptocúrtica

Resolução

Pessoal, nem pensar em fazer o cálculo dos momentos citados. A curva apresenta claramente uma assimetria positiva. Para ficar claro, segue esboço do histograma:

Observem como temos uma cauda do lado direito. Isso indica assimetria positiva. A média é maior que a mediana, que é maior que a moda.

Gabarito: D

Page 49: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 49

Questão 18 CGU 2008 [ESAF]

A distribuição de frequências de um conjunto de dados apresentou um momento de

terceira ordem centrado em relação à média amostral 83 −=m e um momento de

segunda ordem centrado em relação à média amostral 42 =m . O valor do coeficiente

2/3

2

3

m

m permite concluir que essa distribuição de freqüências:

a) é leptocúrtica.

b) é platicúrtica.

c) possui assimetria positiva.

d) possui assimetria negativa.

e) é mesocúrtica.

Resolução:

A questão forneceu momentos.

Analisemos o denominador. Nele temos o momento de ordem 2 em relação à média. Este valor é igual à variância dos dados. Portanto, no denominador temos:

( ) 32/322/3

2 SSm ==

Portanto, o coeficiente dado foi o seguinte:

3

3

2/3

2

3

S

m

m

m=

Que é um coeficiente de assimetria. Descartamos as letras A, B e E. Ficamos entre as letras C e D.

Para marcar a resposta correta, precisaria saber que, quando o terceiro momento é negativo, a assimetria também é negativa.

Gabarito: D

3. CURTOSE

3.1. Introdução

As medidas de curtose visam avaliar o quanto uma curva de frequências é “achatada” ou “afilada”.

Repare a curva abaixo.

Page 50: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 50

Ela é nossa curva “normal”, que usaremos como parâmetro. Não é nem achatada, nem afilada. Ela recebe um nome especial: mesocúrtica. Pesquisando no ‘google’, ‘meso’ é um radical grego que significa ‘meio’. Lembram da ‘mesóclise’ lá da gramática. Quando colocamos o pronome no meio do verbo. Queixar-me-ei, deixar-te-ei, cantá-la-ei, etc.

Pois é, então ‘meso’ significa meio. Esta curva acima está numa situação intermediária. Não é nem afilada, nem achatada. É normal.

Tomando a curva acima como parâmetro, analise a curva abaixo.

Agora já temos uma curva achatada. Ela recebe um nome especial: platicúrtica. Dando uma rápida pesquisada no google, ‘platy’ vem do grego e significa largo, chato. Não sei se a origem é a mesma, mas dá para lembrar de “prato”. Prato também é um objeto achatado. E a pronúncia parece um pouco.

Outra opção é lembrar dos platelmintos lá da biologia. São vermes achatados. Para quem quiser ver uma figura: http://pt.wikipedia.org/wiki/Platelmintos.

Um outro tipo de curva seria:

Page 51: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 51

Já é uma curva afilada no centro. Ela também tem um nome especial: leptocúrtica. Outra vez usando o google, ‘lepto’ vem do latim e significa estreito. Não sei se vocês já ouviram falar daquela doença, leptospirose. A bactéria que causa a doença se chama leptospira. Ela é bem afilada, parece um macarrão retorcido. Para quem quiser ver a foto: http://pt.wikipedia.org/wiki/Leptospirose

Então, quando o exercício falar em leptocúrtica, lembrem-se da bactéria, bem afilada.

Curva mesocúrtica: normal, nem afilada e nem achatada

Curva platicúrtica: curva achatada

Curva leptocúrtica: curva afilada

3.2. Coeficientes de curtose

Já vimos que uma curva pode ser mais achatada, mais afilada, ou ser normal. Os coeficientes de curtose procuram indicar o quão achatada ou afilada é uma curva.

Dois coeficientes geralmente utilizados para determinar a curtose de uma curva são:

• Coeficiente momento de curtose ( 4a )

• Coeficiente percentílico de curtose (k)

O coeficiente momento de curtose é dado por:

4

4

4S

ma = , onde:

Page 52: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 52

• ( )∑=

−=n

i

i XXn

m1

4

4

1

• 224SSS ×=

Lembrando que m4 é o momento de ordem 4 em relação à média aritmética.

Coeficiente momento de curtose

01 =�1.1

Para o coeficiente momento de curtose, tem-se a seguinte classificação das curvas:

⇒= 34a a curva é mesocúrtica

⇒< 34a a curva é platicúrtica

⇒> 34a a curva é leptocúrtica

Jogando bem aberto: isso cai muito pouco em prova. Já caiu mais, quando esses tópicos eram cobrados na prova do AFRFB, até 2003. De lá para cá, praticamente desapareceram as questões sobre curtose.

Deste modo, só vale a pena preocupar em decorar essas faixas (coeficiente menor que 3, maior que 3 e igual a 3) se constar do edital do seu concurso. E, mesmo assim, a chance de cair ainda será mínima. Então deixe para decorar isso às vésperas da prova. Certo?

Continuando com a matéria.

Outro coeficiente, chamado de coeficiente percentílico de curtose, é dado por:

2 = '� − '�2�3"# − 3�#�

Onde 3Q é o terceiro quartil, 1Q é o primeiro quartil, 90P é o nonagésimo percentil e

10P é o décimo percentil.

Page 53: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 53

Coeficiente percentílico de curtose

2 = '� − '�2�3"# − 3�#�

Para o coeficiente percentílico de curtose, tem-se:

⇒= 263,0k a curva é mesocúrtica

⇒< 263,0k a curva é leptocúrtica

⇒> 263,0k a curva é platicúrtica

Aqui vale a mesma dica – não se preocupe muito em decorar essas faixas. Se constar do seu edital (“medidas de curtose”), deixe para decorar isso na véspera da prova, porque mesmo assim a chance de isso ser cobrado é mínima.

A exemplo das medidas de assimetria, as medidas de curtose são apenas derivadas das medidas que já estudamos (média, medidas separatrizes).

Questão 19 AFRF 2002/1 [ESAF]

Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente:

Page 54: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 54

1090 PP

Qk

−=

onde Q é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respecitvamente. Assinale a opção que dá o valor da curtose K para a distribuição de X.

a) 0,263

b) 0,250

c) 0,300

d) 0,242

e) 0,000

Resolução:

Distância interquartílica é a diferença entre o terceiro e o primeiro quartis.

Assim, teremos que encontrar o terceiro quartil, o primeiro quartil, o nonagésimo percentil e o décimo percentil. Conclusão: a questão, no fundo, é de medidas separatrizes para dados em classes.

E observem as alternativas: são muito próximas entre si, o que não é um bom sinal. A vantagem é que, como vocês verão logo abaixo, as contas envolvidas para a resolução deste exercício não foram assim tão complicadas.

Vamos começar pelo primeiro quartil. O primeiro quaritl é o valor que não é superado por 25% das observações.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

110 15 110 corresponde a 15

Z 25 Quem corresponde a 25?

130 40 130 corresponde a 40

Primeira linha 110 15

Segunda linha Z 25

Terceira linha 130 40

Page 55: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 55

Subtraindo as linhas:

110−Z 1525 −

110130 − 1540 −

Essas diferenças são proporcionais:

1540

1525

110130

110

−=

−Z

25

10

20

110=

−Z

11811025

200=+=Z

O primeiro quartil é igual a 118.

1181 =Q

Vamos agora calcular o terceiro quartil. O terceiro quartil é o valor que não é superado por 75% das observações.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

150 70 150 corresponde a 70

Z 75 Quem corresponde a 75?

170 85 170 corresponde a 85

Primeira linha 150 70

Segunda linha Z 75

Terceira linha 170 85

Subtraindo as linhas:

150−Z 7075 −

150170 − 7085 −

Essas diferenças são proporcionais:

7085

7075

150170

150

−=

−Z

Page 56: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 56

15

5

20

150=

−Z

7,15615

100150 ≅+=Z

O terceiro quartil é igual a 156,7.

7,1563 =Q

Agora vamos calcular o décimo percentil. O décimo percentil é o valor que não é superado por 10% das observações.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Observe que a freqüência 10% está bem no meio entre 5% e 15%. Portanto, o valor que lhe é correspondente vai estar bem no meio entre 90 e 110. OU seja, vai ser igual a 100. De todo modo, vamos fazer as contas

90 5 90 corresponde a 5

Z 10 Quem corresponde a 10?

110 15 110 corresponde a 15

Primeira linha 90 5

Segunda linha Z 10

Terceira linha 110 15

As diferenças são proporcionais:

515

510

90110

90

−=

−Z

10

5

20

90=

−Z

1009010 =+=Z

O décimo percentil é igual a 100.

10010 =P

Agora vamos calcular o nonagésimo percentil. Trata-se do valor que não é superado por 90% das observações.

Page 57: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 57

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Observe que a freqüência 90% está bem no meio entre 85% e 95%. Portanto, o valor que lhe é correspondente vai estar bem no meio entre 170 e 190. Ou seja, vai ser igual a 180. De todo modo, vamos fazer as contas.

170 85 170 corresponde a 85

Z 90 Quem corresponde a 90?

190 95 190 corresponde a 95

Primeira linha 170 85

Segunda linha Z 90

Terceira linha 190 95

As diferenças são proporcionais:

8595

8590

170190

170

−=

−Z

10

5

20

170=

−Z

18017010 =+=Z

O nonagésimo percentil é igual a 180.

18090 =P

O coeficiente de curtose fica:

243,0160

7,38

)100180(2

1187,156

)(2 1090

13 ≅=−×

−=

−×

PP

QQ

Gabarito: D.

Questão 20 AFRF 2002/2 [ESAF]

O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte:

Page 58: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 58

Classes Freqüência ( f )

29,5-39,5 4

39,5-49,5 8

49,5-59,5 14

59,5-69,5 20

69,5-79,5 26

79,5-89,5 18

89,5-99,5 10

Para a distribuição de freqüências do atributo X sabe-se que:

( )∑=

=−7

1

2

500.24i

ii fXX

( )∑=

=−7

1

4

500.682.14i

ii fXX

Nessas expressões os Xi representam os pontos médios das classes e X a média amostral. Assinale a opção correta. Considere para sua resposta a fórmula da curtose com base nos momentos centrados e suponha que o valor de curtose encontrado é populacional.

a) A distribuição do atributo X é leptocúrtica.

b) A distribuição do atributo X é platicúrtica.

c) A distribuição do atributo X é indefinida do ponto de vista da intensidade da curtose.

d) A informação dada se presta apenas ao cálculo do coeficiente de assimetria com base nos momentos centrados de X.

e) A distribuição de X é normal.

Resolução:

O coeficiente momento de curtose é dado por:

4

4

4S

ma = , onde:

( )∑=

−=n

i

i XXn

m1

4

4

1 e

224SSS ×=

Mas o enunciado informou que:

( )100

500.682.141

1

4

4=−= ∑

=

n

i

i XXn

m

100

500.242=S

Portanto, o coeficiente de curtose fica:

Page 59: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 59

4

4

4S

ma =

45,2500.24

100500.682.14

100

500.24

100

500.682.1422

2

4 ≅×

=÷=a

Para o coeficiente momento de curtose, tem-se a seguinte classificação das curvas:

⇒= 34a a curva é mesocúrtica

⇒< 34a a curva é platicúrtica

⇒> 34a a curva é leptocúrtica

Logo, a curva é platicúrtica.

Gabarito: B

4. QUESTÕES APRESENTADAS EM AULA

Questão 1 MPE PE/2006 [FCC]

Considere a tabela a seguir:

A tabela acima apresenta a distribuição de frequências relativas do valor do salário pago aos funcionários da fábrica Y no mês de abril de 2006. A média e a mediana do valor do salário pago pela fábrica Y no mês de abril de 2006 são, respectivamente,

a) R$ 200,00 e R$ 400,00

b) R$900,00 e R$1.000,00

c) R$1.050,00 e R$1.000,00

d) R$800,00 e R$800,00

e) R$900,00 e R$900,00

Questão 2 GDF SEJUS 2010 [UNIVERSA]

Considere a posição relativa da média, da moda e da mediana. É correto afirmar que nas distribuições assimétricas

(A) positivas Mo ≤ Me ≤ �� e a cauda da direita é mais comprida que a da esquerda.

(B) positivas Me ≤ Mo ≤ �� e a cauda da direita é mais comprida que a da esquerda.

(C) positivas Mo ≤ Me ≤ �� e a cauda da esquerda é mais comprida que a da direita.

Page 60: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 60

(D) negativas �� ≤ Mo ≤ Me e a cauda da direita é mais comprida que a da esquerda.

(E) �� ≤ Me ≤ Mo e a cauda da esquerda é mais comprida que a da direita.

Questão 3 INMETRO 2010 [CESPE]

Considere que, no estudo de um processo de fabricação de rebites para uso industrial, tenham sido analisadas 36 peças, tomadas da linha de produção, ao longo de um dia, estando as medidas relacionadas ao diâmetro da cabeça dos rebites sumarizadas nas estatísticas e no gráfico seguintes.

Considere, ainda, que �̅, � , � representam, respectivamente, a média amostral, o valor da i-ésima medida e o tamanho da amostra, e que as unidades dos valores apresentados estão de acordo com as unidades utilizadas na obtenção dos valores da tabela e do gráfico.

Com relação à média e à mediana, citadas na tabela do texto, assinale a opção correta.

A Como interpretação da média, é correto concluir que 50% dos diâmetros dos rebites estão abaixo de 6,7261 e 50% das medidas estão acima desse valor.

Page 61: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 61

B Tanto média quanto mediana medem o grau de assimetria de uma distribuição de frequência.

C A mediana é corretamente calculada por

��

��÷ �

D Para o cálculo da média, é necessário que os dados estejam ordenados.

E Para distribuições simétricas, a média e a mediana são coincidentes.

Questão 4 INEP 2008 [CESGRANRIO]

Analise as afirmações a seguir.

Numa distribuição simétrica, a média e a mediana coincidem.

PORQUE

Numa distribuição simétrica a moda nem sempre existe.

Quanto às afirmações acima, pode-se concluir que

(A) as duas asserções são verdadeiras e a segunda é uma justificativa correta da primeira.

(B) as duas asserções são verdadeiras e a segunda não é uma justificativa correta da primeira.

(C) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição falsa.

(D) a primeira asserção é uma proposição falsa e a segunda, uma proposição verdadeira.

(E) tanto a primeira como a segunda são proposições falsas.

Questão 5 PM Manaus 2004 [CESGRANRIO]

A tabela apresenta uma distribuição hipotética de frequência do número de anos trabalhados, em uma amostra de 100 aposentados.

Essa distribuição:

(A) tem moda igual à média.

(B) tem moda menor que a média.

(C) é simétrica.

(D) é assimétrica à direita.

Page 62: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 62

(E) é assimétrica à esquerda

Questão 6 TCE RO [CESGRANRIO]

A distribuição de frequência está representada no histograma a seguir.

Essa distribuição:

(A) é simétrica.

(B) apresenta assimetria à esquerda.

(C) apresenta assimetria à direita.

(D) tem média igual à mediana.

(E) tem histograma de frequência em forma de J.

Questão 7 Capes 2008 [CESGRANRIO]

A tabela a seguir apresenta algumas estatísticas das notas dos alunos de determinada área, que participaram do ENADE 2006.

Page 63: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 63

Analisando-se os dados da tabela conclui-se que

(A) a distribuição das notas é assimétrica à esquerda nos dois grupos de estudantes.

(B) a distribuição das notas dos concluintes apresenta-se mais homogênea do que a dos ingressantes.

(C) pelo menos metade dos alunos ingressantes não alcançou a média de 1,9.

(D) mais de 90,0% dos alunos dessa área compareceram ao ENADE 2006.

(E) mais alunos ingressantes do que concluintes dessa área compareceram ao ENADE 2006.

Questão 8 Petrobras 2005 [CESGRANRIO]

A tabela apresenta uma distribuição hipotética de frequência do número de anos trabalhados, em uma amostra de 100 aposentados.

A distribuição:

(A) é simétrica.

(B) é assimétrica à esquerda.

(C) é assimétrica à direita.

(D) tem moda menor que a média.

(E) tem moda igual à média.

Page 64: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 64

Questão 9 TRT 3ª REGIAO 2009 [FCC]

Considere uma curva de uma distribuição estatística unimodal apresentando o valor da mediana superior ao valor da moda e o valor da média aritmética superior ao valor da mediana. Então, com relação às medidas de assimetria e curtose é correto afirmar que se trata de uma curva apresentando uma distribuição

(A) leptocúrtica.

(B) platicúrtica.

(C) assimétrica à esquerda.

(D) assimétrica à direita.

(E) com coeficiente de curtose igual ao da curva normal.

Questão 10 Prefeitura Municipal de Natal – 2008 [ESAF]

A coleta de dados do município, relativa ao ensino fundamental, apresentou a seguinte composição etária:

Composição Etária dos Alunos do Ensino Fundamental:

Faixa Etária Masc. Fem.

Até 06 anos 9.000 10.200

De 07 a 08 anos 10.000 9.300

De 09 a 10 anos 8.000 8.500

De 11 a 12 anos 7.000 5.500

De 12 a 14 anos 5.000 3.500

De 15 a 18 anos 3.000 2.500

Acima de 18 anos 1.000 1.500

Total 43.200 40.800

Com base nos dados acima, temos as seguintes sentenças:

I. A Moda está na faixa etária até os 06 anos.

II. A Média de alunos está na faixa etária de 12 a 14 anos.

III. A Mediana é superior à média.

Apontando nos 3 (três) itens acima como V – Verdadeiro e F – Falso, a opção correta é:

a) V, V, V

b) V, F, V

c) F, V, F

d) F, F, F

e) V, V, F

Questão 11 TRE PI 2009 [FCC]

Numa pesquisa realizada em 160 domicílios de uma cidade obteve-se o seguinte gráfico em que o eixo y representa a quantidade de domicílios e o eixo horizontal representa o número de eleitores verificado por domicílio.

Page 65: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 65

Com relação à média aritmética (Me), número de eleitores por domicílio, a mediana (Md) e a moda (Mo) correspondentes tem-se que:

(A) Me = Md e Md < Mo

(B) Me < Md < Mo

(C) Me < Md e Md > Mo

(D) Me < Md e Md = Mo

(E) Me > Md e Md = Mo

Questão 12 PM Manaus 2004 [CESGRANRIO]

Os quartis de uma distribuição são Q1 = 4, Q2 = 6 e Q3 = 10. Essa distribuição:

(A) é simétrica.

(B) é assimétrica à direita.

(C) é assimétrica à esquerda.

(D) tem moda maior que a média.

(E) tem moda igual à média

Page 66: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 66

Questão 13 ABIN 2010 [CESPE]

A figura acima apresenta esquematicamente as distribuições das alturas (em cm) dos estudantes das três turmas de uma escola. As linhas verticais de cada box-plot se estendem até os valores extremos da distribuição. Com base nessas informações, julgue os itens consecutivos.

86 A turma 3 tem a maior amplitude de alturas.

87 As distribuições das alturas referentes às turmas 2 e 3 são simétricas.

88 Entre os estudantes da turma 1, 75% possuem alturas iguais ou superiores a 160 cm, enquanto metade dos estudantes da turma 3 tem altura igual ou inferior a 160 cm.

Questão 14 AFRF 2002/1 [ESAF]

Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de frequências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes com os extremos das classes.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. (Obs: considere que você já sabe que a média é igual a 138)

Page 67: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 67

a) 3/S

b) 4/S

c) 5/S

d) 6/S

e) 0

Questão 15 AFRF/2002-2 [ESAF]

O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequências seguinte (obs: considere que você já sabe que a mediana é igual a 71,04):

Classes Frequência (f)

29,5-39,5 4

39,5-49,5 8

49,5-59,5 14

59,5-69,5 20

69,5-79,5 26

79,5-89,5 18

89,5-99,5 10

Assinale a opção que dá o valor do coeficiente quartílico de assimetria

a) 0,080

b) -0,206

c) 0,000

d) -0,095

e) 0,300

Questão 16 AFRF/2003 [ESAF]

Considere a tabela de frequências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes.

Classes Frequências Acumuladas

2.000 - 4.000 5

4.000 - 6.000 16

6.000 - 8.000 42

8.000 - 10.000 77

10.000 - 12.000 89

12.000 - 14.000 100

Assinale a opção que corresponde ao valor do coeficiente de assimetria percentilico da amostra de X, baseado no 1º, 5º e 9º decis.

a) 0,024

b) 0,300

Page 68: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 68

c) 0,010

d) - 0,300

e) - 0,028

Questão 17 Ministério da Integração Nacional 2012 [ESAF]

A distribuição de frequências em classes do salário mensal x, medido em número de salários mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a seguir.

Pelo valor do quociente entre o momento centrado de terceira ordem e o cubo do desvio padrão da distribuição de frequências apresentada acima, pode-se concluir que a distribuição

a) é mesocúrtica

b) é simétrica

c) possui assimetria negativa

d) possui assimetria positiva

e) é leptocúrtica

Questão 18 CGU 2008 [ESAF]

A distribuição de frequências de um conjunto de dados apresentou um momento de

terceira ordem centrado em relação à média amostral 83 −=m e um momento de

segunda ordem centrado em relação à média amostral 42 =m . O valor do coeficiente

2/3

2

3

m

m permite concluir que essa distribuição de freqüências:

a) é leptocúrtica.

b) é platicúrtica.

c) possui assimetria positiva.

d) possui assimetria negativa.

e) é mesocúrtica.

Questão 19 AFRF 2002/1 [ESAF]

Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício

Page 69: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 69

produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes.

Classes P (%)

70-90 5

90-110 15

110-130 40

130-150 70

150-170 85

170-190 95

190-210 100

Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente:

1090 PP

Qk

−=

onde Q é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respecitvamente. Assinale a opção que dá o valor da curtose K para a distribuição de X.

a) 0,263

b) 0,250

c) 0,300

d) 0,242

e) 0,000

Questão 20 AFRF 2002/2 [ESAF]

O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte:

Classes Freqüência ( f )

29,5-39,5 4

39,5-49,5 8

49,5-59,5 14

59,5-69,5 20

69,5-79,5 26

79,5-89,5 18

89,5-99,5 10

Para a distribuição de freqüências do atributo X sabe-se que:

( )∑=

=−7

1

2

500.24i

ii fXX

Page 70: Est - Bacen 2013 - Est - Aula 04

Curso Regular de Estatística

Prof. Vítor Menezes – Aula 4

Prof. Vítor Menezes www.estrategiaconcursos.com.br 70

( )∑=

=−7

1

4

500.682.14i

ii fXX

Nessas expressões os Xi representam os pontos médios das classes e X a média amostral. Assinale a opção correta. Considere para sua resposta a fórmula da curtose com base nos momentos centrados e suponha que o valor de curtose encontrado é populacional.

a) A distribuição do atributo X é leptocúrtica.

b) A distribuição do atributo X é platicúrtica.

c) A distribuição do atributo X é indefinida do ponto de vista da intensidade da curtose.

d) A informação dada se presta apenas ao cálculo do coeficiente de assimetria com base nos momentos centrados de X.

e) A distribuição de X é normal.

5. GABARITO

1 e

2 a

3 e

4 b

5 e

6 b

7 c

8 b

9 d

10 d

11 c

12 b

13 certo errado errado

14 a

15 d

16 a

17 d

18 d

19 d

20 b