aula 10 - medidas de dispersão - ferramentas úteis na análise estatística (1)

18
Ivone da Silva Salsa Jeanete Alves Moreira Marcelo Gomes Pereira Autores aula 10 Medidas de dispersão: ferramentas úteis na análise estatística Matemática e Realidade DISCIPLINA 2ª Edição

Upload: cristiano-damaceno

Post on 25-Jul-2015

396 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

Ivone da Silva Salsa

Jeanete Alves Moreira

Marcelo Gomes Pereira

Autores

aula

10

Medidas de dispersão: ferramentas

úteis na análise estatística

Matemática e RealidadeD I S C I P L I N A2ª Edição

Page 2: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

Divisão de Serviços Técnicos

Catalogação da publicação na Fonte. UFRN/Biblioteca Central “Zila Mamede”

Copyright © 2007 Todos os direitos reservados. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização

expressa da UFRN - Universidade Federal do Rio Grande do Norte.

27/06/2007

Salsa, Ivone da Silva.Matemática e realidade: interdisciplinar / Ivone da Silva Salsa, Jeanete Alves Moreira, Marcelo Gomes

Pereira. – Natal, RN: EDUFRN Editora da UFRN, 2005.292 p.1. Métodos estatísticos. 2. Análise estatística. 3. Proporção e porcentagem. 4. Dados estaísticos. 5.

Medidas de dispersão. I. Moreira, Jeanete Alves. II. Pereira, Marcelo Gomes. III. Título.

ISBN 85-7273-287-X CDD 519.5RN/UF/BCZM 2005/47 CDU 519.22

Governo Federal

Presidente da RepúblicaLuiz Inácio Lula da Silva

Ministro da EducaçãoFernando Haddad

Secretário de Educação a Distância – SEEDRonaldo Motta

Universidade Federal do Rio Grande do Norte

ReitorJosé Ivonildo do Rêgo

Vice-ReitorNilsen Carvalho Fernandes de Oliveira Filho

Secretária de Educação a DistânciaVera Lúcia do Amaral

Secretaria de Educação a Distância- SEDIS

Coordenadora da Produção dos MateriaisCélia Maria de Araújo

Projeto GráficoIvana Lima

Revisores de Estrutura e LinguagemEugenio Tavares BorgesMarcos Aurélio FelipePedro Daniel Meirelles FerreiraTatyana Mabel Nobre Barbosa

Revisoras de Língua PortuguesaJanaina Tomaz Capistrano

Sandra Cristinne Xavier da Câmara

IlustradoraCarolina Costa

Editoração de ImagensAdauto HarleyCarolina Costa

DiagramadoresBruno Cruz de Oliveira

Maurício da Silva Oliveira JúniorMariana Araújo Brito

Thaisa Maria Simplício Lemos

Imagens UtilizadasBanco de Imagens Sedis (Secretaria de Educação a Distância) - UFRN

MasterClips IMSI MasterClips Collection, 1895 Francisco Blvd, East, San Rafael, CA 94901,USA.

MasterFile – www.masterfile.cpomMorgueFile – www.morguefile.com

Pixel Perfect Digital – www.pixelperfectdigital.comFreeImages – www.freeimages.co.uk

FreeFoto.com – www.freefoto.comFree Pictures Photos – www.fre-pictures-photos.com

BigFoto – www.bigfoto.comFreeStockPhotos.com – www.freestockphotos.com

OneOddDude.net – www.oneodddude.net

Page 3: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

12ª Edição Aula 10 Matemática e Realidade

Apresentaçãoa aula 8, vimos como as Medidas de tendência central – média, moda e mediana – representam, de forma condensada, informações sobre o comportamento de dados. Entretanto, tais medidas referem-se a valores típicos, centrais do conjunto

estudado e não nos dão informações sobre como os dados estão dispostos ao redor delas. Daí, podemos ter distribuições bem diferentes, porém com a mesma média, por exemplo. Isso pode, inclusive, conduzir a interpretações equivocadas. Uma medida de centro – as referidas acima – não dá esclarecimentos para perguntas do tipo: os dados estão muito concentrados ao redor da média? Da mediana? Será que eles se apresentaram muito dispersos em relação a essas medidas? As respostas para tais questionamentos podem ser obtidas através das Medidas de Dispersão (ou Medidas de Variabilidade).

É justamente esse o assunto que abordaremos nesta aula. Estudaremos as seguintes medidas de dispersão: amplitude total, desvio quartil, variância e desvio-padrão. Elas, assim como as medidas de tendência central, são indispensáveis para a descrição do comportamento dos dados estudados. O conhecimento delas, portanto, nos possibilita melhor capacidade de análise sobre o fenômeno/fato pesquisado.

N

ObjetivosBuscamos com esta aula, ajudá-lo a construir os conceitos relacionados às medidas de dispersão, assim como, a compreender a elaboração de seus cálculos e a forma de interpretá-las. Procuraremos também fazê-lo apreender a importância de tais medidas para a descrição e análise de observações numéricas.

Page 4: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

2 Aula 10 Matemática e Realidade 2ª Edição

Descobrindo o comportamento de dados quantitativos

C

Essa é uma das possíveis situações que podem ocorrer quando descrevemos conjuntos de dados, sobretudo quando precisamos fazer comparações. Ela nos mostra como é necessário e importante ter as informações sobre a dispersão dos dados que buscamos analisar. Concluímos então, que mesmo uma descrição mais simples de um conjunto de observações numéricas deve ser feita a partir de, pelo menos, uma medida de Tendência Central e uma medida de Dispersão. Analisar dados apoiando-nos apenas no resultado de

onsidere, como exemplo, a seguinte situação: três universitários, A, B e C, se submetem a um teste de seleção para uma bolsa de apoio técnico. Nesse teste, aconteceram seis provas, mas foram escolhidas quatro para avaliar os candidatos:

Português, Matemática básica, Inglês elementar e Informática. Esses três concorrentes, no final, ficaram com a mesma média, x = 6,0 pontos nas quatro disciplinas. Será que, com essa informação, podemos dizer que as suas notas foram valores não muito diferentes, nessas provas? Em outras palavras, será que apresentaram desempenho semelhante em tais matérias? Ora, somente com a informação da média não temos condições de responder a essa questão. Não podemos saber se as pontuações dos candidatos foram valores muito próximos da média x = 6,0 ou não.

Imagine, por exemplo, que esses candidatos conseguiram os seguintes resultados para as provas de Português, Matemática básica, Inglês elementar e Informática, nesta ordem:

A =

B =

C =

Observando atentamente as notas, em cada conjunto, vemos que, em relação à média, o candidato A está muito bem representado por essa medida, pois suas notas

coincidem exatamente com ela. Já o candidato B parece ter pouco conhecimento emPortuguês e, além disso, não teve bom desempenho em Informática. O valor médio somentefoi igual a 6,0 porque suas outras notas (Matemática e Inglês) compensaram esse baixorendimento. Portanto, essa medida de tendência central (ao contrário do candidato A) nãorepresenta tão bem o conjunto das notas do candidato B, porque seus valores estão muitodispersos em relação a ela.

Quanto ao candidato C, suas notas não estão muito afastadas do valor médio,pontos. Assim, elas também estão bem representadas por essa medida.

Page 5: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

32ª Edição Aula 10 Matemática e Realidade

uma média (ou moda ou mediana), como vimos, pode nos levar a conclusões equivocadas.

Portanto, as medidas de dispersão são muito importantes e nos ajudam bastante a entender, com maior clareza, dados estatísticos.

Estudaremos as seguintes:

AMPLITUDE TOTAL : AT

DESVIO QUARTIL : Dq

VARIÂNCIA : 2 (para dados populacionais) ou s2 (para dados amostrais)

DESVIO-PADRÃO : (para dados populacionais) ou S (para dados amostrais)

AMPLITUDE TOTAL: AT

É a medida de dispersão mais simples que existe. Seu cálculo baseia-se apenas em dois valores de um conjunto numérico, os extremos, e não considera os demais. Por isso, nos dá apenas uma “rápida” indicação da dispersão e, conseqüentemente, tem pouca utilidade quando queremos dispor de informações mais apuradas sobre a variabilidade dos dados.

Definimos a Amplitude total (AT) de um conjunto numérico como o resultado da diferença entre o maior e o menor valor, observados nesse conjunto. Ou seja,

AT = (maior valor) − (menor valor)

Quando estudamos as distribuições de freqüências, na aula 5 (Dados quantitativos:como organizá-los?) Vimos essa medida, lembra?

No caso desse exemplo, o resultado dessa medida é:

candidatos: A AT = 6,0 − 6,0 = 0

B AT = 10,0 − 1,0 = 9,0

C AT = 7,0 − 5,0 = 2,0

Como podemos ver, as notas do candidato B apresentaram uma dispersão muito mais alta que as dos demais, enquanto as do candidato A apresentaram dispersão nula e, em relação ao C, a dispersão foi pequena. Isso significa que os dados em A não variaram; em B, apresentaram grande variabilidade; e em C, pouca variação.

Observação – (letra grega – sigma minúsculo)

Page 6: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

4 Aula 10 Matemática e Realidade 2ª Edição

DESVIO QUARTIL: Dq

Quando estudamos as separatrizes na aula 9 (As separatrizes na análise de dados estatísticos), vimos que os quartis dividem um conjunto de dados ordenados em 4 partes iguais. Esquematicamente, temos:

Vamos ver um exemplo?

Retome a aula 9, que trata das separatrizes. Com base na distribuição das médias de Matemática na amostra das turmas da manhã (Tabela 1), encontramos:

Q1= 6,2 e Q3= 8,5.

Então, nesse caso, o desvio quartil será:

Atividade 1

Na auto-avaliação da aula 9, a primeira questão solicitava que você calculasse algumas separatrizes, entre elas os três quartis para as notas de Matemática da amostra das turmas da noite. Com esses valores, calcule o desvio quartil para essa distribuição e compare seu resultado com o da amostra da manhã que acabamos de calcular. Qual dessas duas amostras apresenta maior variação em relação a seus dados?

pontos.

Como vemos, entre o 1o quartil ( ) e o 3o ( ) se encontram 50 (a metade) dosvalores centrais de um conjunto de dados.

O desvio quartil ( ) se baseia nesses dois quartis: e . Ele é o resultado que seobtém por meio da expressão:

Page 7: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

52ª Edição Aula 10 Matemática e Realidade

VARIÂNCIA: σ2 (para dados populacionais) ous2 (para dados amostrais)

Todas as somas foram iguais a zero! Será isso pura coincidência? Não. Isso é uma propriedade da média. Em qualquer situação, teremos: a soma dos desvios dos valores de um conjunto, em relação à sua média é sempre igual a zero.

Esse resultado significa que a média é uma medida que reflete o ponto de equilíbrio dos dados. Diante disso, a soma dos desvios não pode servir como uma medida para nos informar sobre a dispersão dos dados, em relação à média. Para contornar esse problema, podemos: ou considerar o valor absoluto desses desvios (função módulo) ou elevar cada um deles a um expoente par, pois, assim, qualquer resultado negativo passa a ser positivo. (No caso, podemos considerar os desvios ao quadrado, pois o expoente dois simplifica os cálculos). Dessa forma, a soma do quadrado de todos os desvios nunca será nula, exceto se, e somente se, todos os valores do conjunto coincidirem com a média (esse fato indicará que não há dispersão entre os dados).

média

Parece intuitivo que, quanto mais os valores de uma série se distanciarem da sua média,maior deve ser a soma desses desvios, não é mesmo? Então, talvez nós pudéssemos usaressa soma como uma medida de dispersão. Vamos, então, calcular os desvios em relaçãoà média ( ) para as notas de cada candidato (A, B e C), somar os desvios em cadaconjunto e ver o que podemos concluir?

Acompanhe os cálculos:

Portanto, média , sempre.

Essa medida de dispersão, muito utilizada na estatística mais avançada, é baseada nosdesvios de cada valor observado, em relação à média ( ). Portanto, ela considera, alémdessa medida de tendência central, todas as observações do conjunto estudado. Mas, o quequer dizer “desvios em relação à média”?

Definimos desvio em relação à média ( ) como sendo o valor obtido pela expressão:

Desvios A B C

x x

x x

x x

x x

Soma dos Desvios

Page 8: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

6 Aula 10 Matemática e Realidade 2ª Edição

Porém, utilizar apenas a soma do quadrado dos desvios para comparar situações pode nos levar a grandes equívocos, quando os conjuntos de dados tiverem números diferentes de elementos. Diante disso, como podemos usar os desvios para medir a dispersão dos dados? Uma maneira simples é utilizar a média aritmética do quadrado desses desvios (isso na realidade é a média quadrática dos desvios). Daí vem, justamente, a definição matemática dessa medida de dispersão.

A variância de um conjunto qualquer de valores é a média quadrática dos desvios tomados em relação à média desse conjunto.

Variância para dados não tabelados

Quando os dados são isolados (não tabelados), o cálculo da variância é obtido através das fórmulas:

Note que, na equação (2) (dados amostrais), o denominador é n−1. Essa pequena modificação proporciona uma estimativa melhor para a variância. Entretanto, não apresentaremos a prova desse fato, visto que requer um nível mais avançado de conhecimentos na área da Inferência Estatística, e não faz parte dos objetivos deste curso.

Atividade 2

Vamos calcular o quadrado dos desvios para os conjuntos A, B e C e depois somá-los para obter a variância? Faça os cálculos e em seguida confira com os resultados apresentados na tabela seguinte.

para dados populacionais: (equação 1);

e amostrais: (equação 2).

Page 9: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

72ª Edição Aula 10 Matemática e Realidade

Calcularemos s2, pois as quatro disciplinas escolhidas constituem uma amostra das seis.

Portanto, temos:

Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais. Daí concluímos que seus valores não estão muito concentrados ao redor da sua média.

Desenvolvendo-se algebricamente as expressões (1) e (2), e após as devidas simplificações, podemos reescrevê-las, respectivamente para 2 e s2, da forma:

Embora essas novas fórmulas possam parecer mais complicadas, elas, na verdade, exigem cálculos bastante simples. Você precisa apenas calcular duas somas: uma, referente ao quadrado de cada observação, e a outra, ao total de todos os dados.

Como exemplo, vamos calcular a variância para os dados do Censo de 2000, relativos às taxas de Mortalidade Infantil até 1 ano, dos 8 municípios que compõem a região metropolitana de Natal. Essas taxas representam a mortalidade de crianças menores de 1 ano em 1.000 nascidos vivos.

Obs.: deixe sempre o resultado da variância com pelo menos 4 casas decimais, pois isso será importante para o cálculo do desvio-padrão que veremos mais adiante.

(pontos)

(pontos) .

(equação 3) e

(equação 4)

Desvios x x A B C

x

x

x

x

Soma

Page 10: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

8 Aula 10 Matemática e Realidade 2ª Edição

Tabela 1 – Cálculos auxiliares para obtenção da variância.

A variância é uma medida de dispersão que assume valores maiores ou iguais a zero, porque é uma média quadrática, portanto nunca será um número negativo. Para efeito de análise, quanto maior a variância (quanto mais distante do zero), maior é a dispersão dos dados em relação à média.

Atividade 3

Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento Humano no Brasil e referem-se ao percentual* de analfabetismo funcional (menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis municípios da microrregião de Sousa (Paraíba), dos anos:

1991: 73 67 70 60 69 772000: 57 57 62 53 61 68

*Esses percentuais foram arredondados para facilitar os cálculos.

Calcule a média e a variância para cada ano, comparando os resultados dos mesmos em relação à variabilidade dos dados.

Os dados são:

48,86 40,16 43,96 36,53 48,41 38,10 35,26 36,99

Para facilitar os cálculos, construímos a tabela a seguir:

óbitos

xi x i

xi xi

Page 11: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

92ª Edição Aula 10 Matemática e Realidade

Variância para dados agrupados emtabelas de freqüências

Para dados agrupados em distribuições de freqüências, temos, respectivamente, as seguintes fórmulas para a variância populacional e para a amostral:

Observe que agora trabalharemos com as freqüências e que a variação do índice no somatório vai de 1 a k, que representa exatamente a quantidade de valores assumidospela variável estudada ou o número de intervalos, quando trabalhamos com dados agrupados em classes.

Os valores xi são substituídos pelos pontos médios dos intervalos quando se trabalha com dados agrupados em classes.

Vamos acompanhar duas situações através dos exemplos 1 e 2 para que você possa se familiarizar melhor com as fórmulas apresentadas.

Exemplo 1Retomaremos a aula 5 em que temos a pontuação no teste objetivo de Matemática numa

amostra de 54 alunos da 8ª série/manhã, exposta na Tabela 2, que a seguir apresentamos. Observe que as duas últimas colunas da tabela são suficientes para a obtenção dos valores que serão utilizados na fórmula da variância. Veja também que a variável pontuação (Xi)assume 6 valores distintos, isto significa que: k = 6.

(equação 5) e

(equação 6)

Page 12: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

10 Aula 10 Matemática e Realidade 2ª Edição

Fonte: Dados fictícios

Como se trata de uma amostra, calcularemos s2 ao invés de .

Agora que temos todos os elementos, deveremos aplicar a equação (6):

Atividade 4

Na aula 8, pedimos para você calcular a média para a pontuação no teste objetivo de Matemática na amostra das turmas da 8ª série/noite. Agora, calcule a variância e compare o resultado com o que acabamos de encontrar.

Exemplo 2A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Vamos aprender

como se calcula a variância, em situações como esta. Você se lembra que, nesse caso (dados agrupados em classes), xi se refere ao ponto médio de cada intervalo e representa todos os valores contidos em sua respectiva classe? Para facilitar os cálculos da variância, foram acrescentadas as três últimas colunas, tal como foi feito no exemplo 1.

Tabela 2 – Pontuação no teste objetivo de Matemática, na amostra das turmas da 8a série/manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.

pontos .

Pontuação xi Nº de alunos fi xi fi x i fi

TOTAL fi f xi fi xi fi

Page 13: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

112ª Edição Aula 10 Matemática e Realidade

Fonte: Dados fictícios

Atividade 5

A Tabela 4 mostra o percentual de indigentes, com base no Censo de 1991, dos estados brasileiros. Calcule a variância apresentada por esses dados.

Fonte: Atlas do Desenvolvimento Humano no Brasil

Tabela 3 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.

Tabela 4 – Percentual de indigentes dos estados brasileiros, 1991.

pontos .

Notas (médias) Nº de alunos (fi)Ponto

médio (xi)xi fi xi x i fi

TOTAL

% de indigentes classes

Nº de Municípios fi

TOTAL

Page 14: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

12 Aula 10 Matemática e Realidade 2ª Edição

DESVIO-PADRÃO: (para dados populacionais) ous (para dados amostrais)

A variância é uma importante medida de dispersão, entretanto, seu resultado é dado em unidade de medida que é o quadrado da original. Algumas dessas medidas não têm nenhum sentido prático, como na atividade referente à mortalidade infantil. Como avaliar, por exemplo, kg2, (Salário mínimo)2, anos2, pontos2 etc.? Então, como alternativa para contornar esse problema, existe uma medida denominada desvio-padrão, definida como a raiz quadrada positiva da variância. Assim,

Considerando todos os cálculos anteriores obtidos para a variância, vamos calcular o desvio-padrão.

No exemplo, das notas dos candidatos (cujos resultados da variância estão na página 9) temos:

Como podemos observar, o desvio-padrão associado ao candidato B é muito maior do que os demais. Isso significa que as notas desse candidato apresentaram-se bastante dispersas ao redor da média 6,0.

Para os dados referentes à Mortalidade Infantil, a variância e o respectivo desvio-padrão são:

Considerando as notas da amostra das turmas da 8a série/manhã, no teste objetivo, e as médias trimestrais em Matemática, teremos os seguintes desvios-padrão:

Obs.: tanto a variância quanto o desvio-padrão são medidas largamente usadas na Estatística Inferencial. Na Estatística Descritiva, que é o nosso caso, essas medidas têm sentido, principalmente, quando comparamos conjunto de dados de mesma natureza e que apresentam médias com valores aproximados.

Desvio-padrão populacional: ;

Desvio-padrão amostral: .

Var(A) ;

Var(B) pontos;

Var(C) pontos.

(óbitos ).

teste objetivo: pontos;

médias trimestrais: pontos.

Page 15: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

132ª Edição Aula 10 Matemática e Realidade

Atividade 6

Calcule o desvio-padrão para os percentuais (%) de indigentes apresentados na Tabela 4 (atividade 5).

Para entendermos melhor o desvio-padrão, imagine, por exemplo, o tempo de espera numa fila de um banco durante uma semana típica. O tempo médio de espera dos clientes durante esse período independe da fila ser única ou não. Entretanto, os clientes ficam muito mais satisfeitos quando estão em fila única, uma vez que o tempo de espera, por não depender de um caixa em particular, se distribui de forma mais homogênea ao redor do tempo médio. Quando não há fila única, alguns clientes esperam mais do que outros, dependendo do caixa, fato que causa insatisfação. Essa situação reflete que a tomada de decisão dos bancos ao se optar por fila única, provavelmente se baseou em um estudo da variabilidade apresentada pelo tempo de espera dos clientes, que, no caso da fila única, diminui bastante.

O desvio-padrão é a medida de dispersão mais utilizada, universalmente, na análise de dados, tendo se tornado um apoio indispensável na tomada de decisão.

A seguir, apresentamos a Figura 1 que mostra uma distribuição de dados simétrica, ou seja, que apresenta média, moda e mediana iguais. Nessas distribuições, verifica-se que cerca de 68,26% dos dados estão a menos de 1 desvio-padrão da média; 95,45% dos dados estão a menos de dois desvios padrão e 99,7% dos dados estão a menos de três desvios padrão. Os valores que estão a mais de 3 desvios-padrão são considerados discrepantes dos demais.

Como entender o desvio-padrão?

95,45%

2 2

Figura 1 – Distribuição simétrica

Page 16: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

14 Aula 10 Matemática e Realidade 2ª Edição

ResumoOs fenômenos que pesquisamos e exploramos com ferramentas estatísticas estão associados a dados que se apresentam de forma variada. Estudar como as observações coletadas estão se comportando em relação à variabilidade é de grande importância para o conhecimento da variável pesquisada. Neste texto, abordamos quatro medidas – amplitude total, desvio quartil, desvio-padrão e variância – utilizadas no estudo da dispersão ou variabilidade de dados estatísticos. Apresentamos o conceito e os cálculos referentes a cada uma delas. Mostramos – com ênfase através de exemplos – o importante papel que elas desempenham na descrição e análise de dados quantitativos. Encaminhamos várias situações para auxiliar no estudo e compreensão deste tema.

Auto-avaliaçãoAbaixo, reproduzimos a tabela que mostra as médias de Matemática da amostra das turmas da noite, apresentada na aula 6 (Gráficos representativos de uma distribuição de freqüências):

1

Fonte: Dados Fictícios

Tabela 5 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/noite, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.

Assim, o conhecimento de uma medida de tendência central (a média) e de uma medida de dispersão nos permite descrever com mais detalhes (e muito menor risco de equívocos) um conjunto de dados.

Notas (médias) Nº de alunos (fi)

Total

Page 17: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

152ª Edição Aula 10 Matemática e Realidade

Com base nessa Tabela, calcule a variância e o desvio-padrão e compare-os com essas mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manhã. Faça comentários pertinentes ao contexto.

Os dados a seguir referem-se ao Índice de Desenvolvimento Humano (IDH) de algumas capitais nordestinas, obtidos com dados dos Censos de 1991 e 2000.

Tabela 6 – Índice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais nordestinas.

Capitais IDH-1991 IDH-2000

Fortaleza 0,688 0,767

Maceió 0,660 0,724

Natal 0,689 0,762

Recife 0,715 0,780

Salvador 0,735 0,794

São Luís 0,707 0,766

Fonte: Atlas do Desenvolvimento Humano no Brasil

Obtenha, para cada ano, as seguintes medidas de variabilidade:

a) amplitude total;

b) variância;

c) desvio-padrão.

Faça comparações entre os anos de 1991 e 2000, usando as medidas calculadas.

2

ReferênciasAZEVEDO, P. R. Introdução à estatística. Natal: EDUFRN, 2005.

BARBETTA, P. A. Estatística aplicada às ciências sociais. Florianópolis: Ed. da UFSC, 2002.

MOORE, D. A estatística básica e sua prática. Tradução de Alfredo Alves de Farias. Rio de Janeiro: LTC, 2000.

PEREIRA, W.; TANAKA, O. K. Estatística: conceitos básicos. 2.ed. São Paulo:McGraw-Hill, 1990.

Page 18: Aula 10 - Medidas de dispersão - ferramentas úteis na análise estatística (1)

16 Aula 10 Matemática e Realidade 2ª Edição

PROGRAMA DAS NAÇÕES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Atlas do Desenvolvimento Humano no Brasil. Indicadores de Vulnerabilidade Familiar, 1991 e 2000, municípios da microrregião Cariri Ocidental (Paraíba). Disponível em: <http://www.pnud.org.br/> Acesso em 31/05/2005.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1985.

TRIOLA, M. F. Introdução à estatística. Tradução de Alfredo Alves de Farias. 7.ed. Rio de Janeiro: LTC, 1999.

Anotações