estatÍstica - norg.uminho.pt³ria.pdf · inferencial. a primeira toma indistintamente a...

115
ESTATÍSTICA Edite Manuela da G.P. Fernandes Universidade do Minho, Braga, 1999

Upload: phungdung

Post on 25-Apr-2018

218 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

ESTATÍSTICA

Edite Manuela da G.P. Fernandes

Universidade do Minho, Braga, 1999

Page 2: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

ESTATÍSTICA

Edite Manuela da G.P. Fernandes

com a colaboração deA. Ismael F. Vaz

na realização dos gráficos

Universidade do Minho, Braga, 1999

Page 3: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Título: Estatística

Autor: Edite Manuela da G.P. Fernandes

Composição: Texto preparado em LATEX por A. Ismael F. Vaz

Impressão da capa, fotocópias e montagem: Serviços de Reprografia e Publicações daUniversidade do Minho

Capa: A. Ismael F. Vaz

TEX é uma marca registada da American Mathematical Society.

100 exemplares em Janeiro de 1999

Page 4: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Conteúdo

Prefácio iv

I Estatística descritiva 1

1 Introdução 21.1 O que é a Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 População e Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Tipos de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Descrição numérica dos dados 6

3 Descrição gráfica dos dados 12

4 ”Estatísticas” descritivas 214.1 Medidas de tendência central . . . . . . . . . . . . . . . . . . . . . . . . . 214.2 Medidas de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.3 Medidas de associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

5 Distribuição normal 31

6 Análise de Regressão 346.1 Regressão Linear e Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . 346.2 Regressão não linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

II Séries cronológicas 36

7 Componentes do estudo 377.1 Representação gráfica de uma série cronológica . . . . . . . . . . . . . . . . 377.2 Estudo de uma série cronológica . . . . . . . . . . . . . . . . . . . . . . . . 37

8 Decomposição 39

i

Page 5: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CONTEÚDO ii

9 Estudo da tendência 409.1 Métodos para estudo da tendência . . . . . . . . . . . . . . . . . . . . . . . 40

9.1.1 Método das médias móveis . . . . . . . . . . . . . . . . . . . . . . . 419.1.2 Método analítico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

10 Movimento sazonal 4610.1 Método para determinar as flutuações sazonais . . . . . . . . . . . . . . . . 47

10.1.1 Método das médias mensais . . . . . . . . . . . . . . . . . . . . . . 47

III Estatística demográfica 49

11 Estruturas populacionais 5011.1 Taxas de crescimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5011.2 Cálculo das densidades populacionais . . . . . . . . . . . . . . . . . . . . . 5411.3 Estruturas demográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

11.3.1 Pirâmides de idades . . . . . . . . . . . . . . . . . . . . . . . . . . . 5511.3.2 Grupos funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

12 Qualidade dos dados 6012.1 Relação de masculinidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 6012.2 Índice de Whipple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6112.3 Índice de irregularidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6212.4 Índice combinado das Nações Unidas . . . . . . . . . . . . . . . . . . . . . 6212.5 A equação da concordância . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

13 Análise da mortalidade 6513.1 Taxa bruta de mortalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 6513.2 Tipos particulares de mortalidade . . . . . . . . . . . . . . . . . . . . . . . 6713.3 Tábua de mortalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

14 Análise da natalidade e da fecundidade 74

15 Análise da nupcialidade 7915.1 Taxas de nupcialidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7915.2 Tábua de nupcialidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

16 Análise dos movimentos migratórios 8516.1 Métodos directos de análise . . . . . . . . . . . . . . . . . . . . . . . . . . 8516.2 Métodos indirectos de análise . . . . . . . . . . . . . . . . . . . . . . . . . 86

Page 6: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CONTEÚDO iii

IV Exercícios 88

Tabela de números aleatórios 105

Page 7: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Prefácio

Este trabalho está dividido em quatro partes e tem como objectivo servir de apoio às aulasteóricas e teórico-práticas da disciplina anual de Estatística do mestrado em História dasPopulações.

A primeira parte faz uma breve introdução à Estatística descritiva. Além de serem in-troduzidos conceitos relacionados com a descrição gráfica de dados, é também apresentadoum capítulo sobre as medidas mais importantes de tendência central, de dispersão e deassociação entre dados.

Na segunda parte são introduzidos e estudados alguns aspectos importantes das sériescronológicas, designadamente a tendência e a sazonalidade.

A terceira parte trata da Estatística demográfica. Não só são referidas medidas ele-mentares para a análise da Qualidade dos dados, como também são apresentadas taxase outras medidas de análise das variáveis microdemográficas mais importantes, nomeada-mente a mortalidade, natalidade, fecundidade e nupcialidade.

Na última parte são incluídos enunciados de trabalhos práticos de apoio às aulas teórico-práticas.

Braga, Outubro de 1998Edite Manuela da G.P. Fernandes

iv

Page 8: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Parte I

Estatística descritiva

1

Page 9: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 1

Introdução

Embora a palavra estatística ainda não existisse no ano 3 000 A.C. há indícios de que nessaaltura já se faziam censos na Babilónia e no Egipto. A palavra censo deriva de "censere",que em latim significa taxar. Na era romana o imperador César Augusto ordenou que sefizesse um censo em todo o império.

A palavra estatística deriva de ”status”, que em latim significa estado. Sob esta palavraos Estados têm acumulado dados relativos ao seu povo. A estatística nas mãos dos governostem sido uma ferramenta essencial para a definição das suas políticas.

1.1 O que é a EstatísticaO termo estatística tem várias interpretações.

Para a maioria das pessoas estatística emprega-se para designar informação em termosde números. Não usaremos o termo estatística com este significado. A estas quantidadesnuméricas daremos o nome de observações ou dados.

O termo estatística tem ainda outros significados. A Estatística é um ramo da área damatemática aplicada com os seus próprios simbolismos, terminologia, conteúdo, teoremase técnicas. Quando estudamos Estatística estamos a tentar conhecer e dominar as suastécnicas. Assim, podemos definir a Estatística como uma ciência matemática que agregaum conjunto de técnicas apropriadas para a recolha, a classificação, a apresentação e ainterpretação de dados numéricos.

Um outro significado para a palavra é o da ”estatística” que está relacionada comquantidades que forem calculadas a partir de dados amostrais. Neste caso é costumecolocar a palavra entre aspas. Por exemplo, se os dados obtidos forem: 12, 12, 14, 15, 12e 13, a quantidade 12+12+14+15+12+13

6, conhecida por média aritmética, é uma ”estatística”.

1.2 AplicaçõesAs aplicações das técnicas estatísticas estão já tão difundidas e a sua influência tem sidotão marcante, que a importância da Estatística é já hoje em dia reconhecida em todos os

2

Page 10: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 1. INTRODUÇÃO 3

domínios da investigação científica e do desenvolvimento tecnológico.Uma das áreas onde a Estatística começou a ser aplicada mais cedo foi no planeamento

e na análise de experiências realizadas na agricultura. A metodologia da Estatística temsido muito usada na investigação realizada pelas indústrias farmacêutica e médica. Aspróprias instituições governamentais usam a Estatística para estudar a situação económicado País e alterar as políticas de cobrança de impostos, de assistência social, de obraspúblicas, etc. A teoria das probabilidades juntamente com a Estatística, isto é, a teoriada decisão estatística, é usada como um meio para a tomada de decisões importantes aomais alto nível. Usamos as técnicas estatísticas na indústria para o controlo da qualidadedos produtos, no ’marketing’, no estudo dos efeitos da publicidade, e também em todas asáreas onde é preciso tomar decisões tendo como base informação incompleta, tal como naBiologia, Geologia, Psicologia e Sociologia. Nas políticas educacionais a Estatística é umaferramenta muito importante para ajudar a definir pedagogias e métodos de ensino.

1.3 População e AmostrasDois dos termos mais usados em Estatística são: população e amostra.

População designa um conjunto de unidades com qualquer característica comum. Porexemplo, o conjunto das idades das crianças da Escola Preparatória XXX da cidade YYYconstitui uma população; o conjunto de todas as classificações obtidas, na disciplina deMatemática, pelas crianças do 5o

¯ano de escolaridade das Escolas Preparatórias do País

constitui uma população.A Estatística ocupa-se fundamentalmente das propriedades das populações susceptíveis

de representação numérica.A população pode ser finita ou infinita, consoante seja finito ou infinito o número

de elementos que a compõem. Para conhecer bem as propriedades da população temosde analisar todos os elementos dessa população. Contudo, nem sempre é possível analisartodos os elementos. Esta impossibilidade pode dever-se ao facto de a população ser infinita.O estudo incidirá, assim, sobre um subconjunto finito de elementos que seja representativoda população. Este subconjunto chama-se amostra.

A representatividade da amostra é uma das questões mais importante relacionada coma teoria da amostragem. A amostra deve conter qualitativa e quantitativamente em pro-porção tudo o que a população possui.

A amostra tem de ser também imparcial, isto é, todos os elementos da população devemter igual oportunidade de serem escolhidos para fazerem parte da amostra.

Mesmo quando a população é finita podem surgir outras razões que levem à utilizaçãode amostras para o estudo da população. Existem razões económicas - pode tornar-secaro a observação do comportamento de um número muito grande de elementos; razõesde tempo - a observação de todos os elementos pode demorar tanto tempo que quando osresultados estiverem prontos para divulgação já se encontrem desactualizados.

Existem, ainda, outras razões que nos levam a preferir recolher uma amostra em vez deusar a população. Nalguns casos, as unidades que constituem a amostra para inspecção,

Page 11: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 1. INTRODUÇÃO 4

são destruídas. Noutros casos, em virtude da escassez de pessoas treinadas (sem forma-ção específica) para recolher amostras, é mais seguro confiar num número reduzido deinformação. Haveria uma menor ocorrência de erros humanos.

Parece, assim, ser mais vantajoso recolher amostras e basear o nosso estudo na análisedessas amostras. Este processo parece ser bastante simples, no entanto, pode dar origema enganos.

A selecção de elementos da população que são mais facilmente acessíveis ao experimen-tador, origina uma amostra conveniente. Este tipo de amostra não é representativa dapopulação e pode levar a conclusões erradas sobre as propriedades da população.

Uma alternativa à amostra conveniente, que é muitas vezes parcial, é a amostra ale-atória simples.

A ideia principal consiste em dar a cada elemento da população a mesma oportunidadede ser escolhido para fazer parte da amostra. Para abreviar usaremos, daqui para a frente,a.a.s. para designar amostra aleatória simples.

Uma a.a.s. é obtida através de um método que dá a qualquer possível amostra detamanho n (com n elementos) a mesma oportunidade de ser a amostra escolhida.

Dos métodos existentes, o mais usado e simples para a obtenção de uma a.a.s. consisteem:

• usar uma tabela de números aleatórios como a que está representada na tabela dafigura 1.1. (ou um gerador de números aleatórios como têm algumas máquinas decalcular, normalmente designado pela função RND). Uma tabela de números alea-tórios é uma lista dos 10 dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8 e 9 que satisfaz as seguintespropriedades:

1. Um dígito em qualquer posição da lista tem a mesma oportunidade de ser o 0,1, 2, 3, 4, 5, 6, 7, 8 ou 9.

2. Os dígitos nas diferentes posições são independentes no sentido de que o valorde um deles não influencia o valor de qualquer outro.

A tabela apresenta uma divisão dos números por grupos de 5 dígitos e tem as linhasnumeradas, com o objectivo de facilitar a consulta. Para usar a tabela devemos ter ematenção o seguinte:

1. Qualquer par de dígitos da tabela tem a mesma oportunidade de ser (qualquer) umdos 100 possíveis pares 00, 01, 02, 03, ..., 97, 98, 99.

2. Qualquer trio de dígitos na tabela tem a mesma oportunidade de ser um dos 1000possíveis trios 000, 001, 002, 003, ..., 997, 998, 999.

3. E assim por adiante, para grupos de 4 ou mais dígitos da tabela. Os grupos de 4dígitos seriam os seguintes: 0000, 0001, 0002, ..., 0997, 0998, ..., 9997, 9998, 9999.

Para a selecção de uma a.a.s. usamos o seguinte processo:

Page 12: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 1. INTRODUÇÃO 5

linha101 19223 95034 05756 28713 96409 12531 42544 82853102 73676 47150 99400 01927 27754 42648 82425 36290103 45467 71709 77558 00095 32863 29485 82226 90056104 52711 38889 93074 60227 40011 85848 48767 52573105 95592 94007 69971 91481 60779 53791 17297 59335

Figura 1.1: Parte da tabela de números aleatórios (ver Anexo)

1. enumerar os elementos da população a partir do 0 (se existirem até 10 elementosna população), do 00 ( se existirem até 100 elementos na população), do 000 (seexistirem até 1000 elementos na população) ou ..., até esgotar todos os elementos;

2. seleccionar o tamanho da amostra;

3. retirar da tabela da figura 1.1, a partir de qualquer linha, grupos de 1, 2, 3 ou ...dígitos (consoante o número de elementos da população), todos seguidos. Cada gruposelecciona o elemento da população com aquele número.

Nota 1.3.1 :

• Sempre que aparecerem grupos de 1, 2, 3 ou ... (conforme o caso) dígitos repetidos,devemos ignorá-los.

• Sempre que aparecerem grupos de 1, 2, 3 ou ... dígitos que sejam quantidades maioresou iguais que o número de elementos da amostra, devemos ignorá-los.

1.4 Tipos de EstatísticaPodemos dividir a Estatística em dois grupos: a Estatística Descritiva e a EstatísticaInferencial.

A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações pode ser feita gráfica ou numericamente. Será umadescrição gráfica se for feita a representação gráfica de certas quantidades calculadas apartir das observações. A descrição diz-se numérica se forem calculadas quantidades quedão informação, embora sumária, do comportamento das observações. A análise estatísticafeita no século passado e no príncipio deste século foi na maior parte do tipo descritivo.

A Estatística tem sido definida como a ciência para a tomada de decisões baseadasem incertezas, isto é, baseadas num conjunto de informações incompletas. Para tomarmosdecisões sobre a população, seleccionamos uma amostra aleatória simples retirada da po-pulação. Baseando-nos na informação obtida da amostra inferimos sobre as característicasda população. A Estatística Inferencial baseia-se no estudo das amostras para podermostirar conclusões sobre a população donde retirámos essas amostras.

Page 13: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 2

Descrição numérica dos dados

A ideia que muitas pessoas têm da Estatística é a de que ela está associada a tabelasenormes de números, por vezes documentadas com alguns gráficos à mistura! As tabelasrepletas de informação são muitas vezes cansativas de ler, difíceis de interpretar e de se tirarconclusões e alguns gráficos mal dimensionados e legendados podem originar interpretaçõeserradas.

Mesmo assim, as tabelas são um dos meios mais usados para organizar e resumir umconjunto vasto e desordenado de dados (ou observações). É mais vantajoso contruir umatabela pequena com algumas quantidades especiais ("estatísticas"da amostra ou parâme-tros da população) que caracterizam e resumem a distribuição (o comportamento) dessasobservações, do que uma tabela com um conjunto enorme de números. Os gráficos têmcomo objectivo dar uma visão resumida e rápida do comportamento dos dados.

Consideremos o seguinte ficheiro de dados da Escola Preparatória XXX da cidade YYY.Para cada aluno, foram registados os seguintes valores das variáveis: SEXO (feminino oumasculino), IDADE (10, 11, 12, 13, 14 ou 15 anos), ALTURA (de 129 cm. a 145 cm.),PESO (de 27 kg. a 45 kg.), ANO (5o ou 6o ano de escolaridade) e TURMA (1, 2, 3, 4ou 5). A maior parte das tabelas e gráficos apresentados nesta parte I dizem respeito aosvalores deste ficheiro.

Dado um conjunto de observações, é costume, em primeiro lugar, contar quantas vezesaparece cada valor, isto é, o número de ocorrências desse valor. Dos 318 alunos presente-mente a frequentar a Escola Preparatória XXX da cidade YYY,

• quantos são do sexo feminino?

• quantos são do sexo masculino?

• quantos frequentam, neste ano lectivo, o 5o ano de escolaridade?

• quantos estão inscritos no 6o ano de escolaridade?

• quantos alunos do 5o ano têm ainda 10 anos?

• quantos alunos frequentam o 6o ano com 15 anos de idade?

6

Page 14: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 2. DESCRIÇÃO NUMÉRICA DOS DADOS 7

Depois de observados todos os registos e contadas as ocorrências dos seis acontecimentosdescritos, obtivemos os seguintes valores, conhecidos por frequências absolutas : 124alunos do sexo feminino, 194 do sexo masculino, 147 do 5o ano, 171 do 6o ano, como se

SEXO Frequências Percentagens F.Acumuladafeminino 124 38.99 38.99masculino 194 61.01 100.00

Total 318 100.00

ANO Frequências Percentagens F.Acumulada5o ano 147 46.23 46.236o ano 171 53.77 100.00Total 318 100.00

Figura 2.1: Tabelas de frequências do SEXO e do ANO de escolaridade

pode ver na coluna indicada por ’Frequências’ da tabela da figura 2.1; 73 alunos estãono 5o com 10 anos e 9 no 6o com 15 anos. Confirme estes valores com os assinaladosda coluna ’Frequências’ da tabela da figura 2.2. Verificando-se que 124 + 194 = 318 ou147 + 171 = 318 conclui-se que foram consideradas todas as observações (consistênciainterna).

A frequência absoluta de qualquer valor de uma variável é o número de vezes queesse valor ocorre nos dados. Isto é, esta frequência corresponde a uma contagem.

Observando apenas o número 124 de alunos do sexo feminino e 194 do sexo masculinopodemos dizer que há mais rapazes do que raparigas, no entanto, não se vê logo quantosmais. Se compararmos estes números com o número total de alunos, calculando o quocienteentre o número total de alunos do sexo feminino (ou do sexo masculino) e o número totalde alunos da escola, a que chamaremos frequência relativa, então já podemos dizer que124318

= 0.39 (ou 194318

= 0.61) são do sexo feminino (ou masculino) o que é nitidamente menos(ou mais) do que metade dos alunos.

A frequência relativa de qualquer valor é a proporção ou fracção de todas as observa-ções que têm aquele valor. Esta frequência pode ser expressa em termos de percentagem,multiplicando a fracção resultante por 100 e atribuindo o sinal de %. Das fracções an-teriores tiramos 39% de alunos do sexo feminino e 61% do sexo masculino. A soma dasfrequências relativas deve ser igual a 1 (ou das percentagens igual a 100%).

Veja as percentagens de alunos dos dois sexos na coluna indicada por ’Percentagens’da tabela da figura 2.1.

As frequências acumuladas absolutas (ou relativas) representam o número (ou afracção/percentagem) de observações que são menores ou iguais a um valor especificado.Assim o número (ou fracção/percentagem) de alunos com idade inferior a 12, do 5o ano deescolaridade é de 118 (ou 0.8027/80.27%) e o número (ou fracção/percentagem) de alunosdo 6o ano com idade igual ou inferior a 14 anos é de 162 (ou 0.9474/94.74%), como se podeconfirmar pela coluna ’F.Acumuladas’ da tabela da figura 2.2.

Page 15: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 2. DESCRIÇÃO NUMÉRICA DOS DADOS 8

ANO=5o

IDADE Frequências Percentagens F.Acumuladas10 73 49.66 49.6611 45 30.61 80.2712 22 14.97 95.2413 4 2.72 97.9614 3 2.04 100.00

Total 147 100.00

ANO=6o

IDADE Frequências Percentagens F.Acumuladas11 91 53.22 53.2212 46 26.90 80.1213 20 11.70 91.8114 5 2.92 94.7415 9 5.26 100.00

Total 171 100.00

Figura 2.2: Tabela de frequências da IDADE, por ANO de escolaridade

Da coluna ’F.Acumuladas’ da tabela da figura 2.3 podemos verificar que o número dealunos do 6o ano que têm um peso igual ou inferior a 40 Kg. é de 161, o que correspondea 94.15% dos alunos desse ano.

Da coluna ’F.Acumuladas’ da tabela da figura 2.4 podemos concluir que a percentagemde alunos do sexo feminino com altura igual ou inferior a 140 cm. é aproximadamente de91%.

As frequências absolutas e as relativas são um meio muito usado para classificar osdados quando a escala usada para medir as variáveis é nominal, isto é, a medição davariável apenas define a classe a que o elemento pertence. Por exemplo, a variável SEXOé nominal, uma vez que ela é definida pelas duas classes: feminino e masculino; a variávelANO de escolaridade é nominal e as classes definidas são o 5o e o 6o ano de escolaridade;a variável TURMA é também nominal, definida pelas classes 1, 2, 3, 4 e 5 para o 5o anode escolaridade e 1, 2, 3, 4 e 5 para o 6o ano.

Certas variáveis são medidas de acordo com uma escala ordinal. Neste caso a mediçãodefine classes e ordena-as de acordo com os valores atribuídos. Como exemplo, temos aspontuações (1, 2, 3, ... e 10) que hoje se usam para definirmos a nossa preferência relativaa qualquer acontecimento. A diferença entre o 2 e o 1 é a de que o 2 significa ter preferênciaem relação ao 1 mas não se sabe quanto.

Mesmo quando a escala de medição da variável é intervalar/proporcional e a variávelpode tomar uma quantidade enorme de valores, podemos classificar (resumir) os dadoscalculando as frequências de grupos de valores, chamados classes ou intervalos. Quando amedida de uma variável nos diz quanto ela é diferente da medida de outra, então a variável

Page 16: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 2. DESCRIÇÃO NUMÉRICA DOS DADOS 9

ANO=5o

Classesde pesos Frequências Percentagens F.Acumuladas

peso <=30 34 23.13 23.1330 a 35 74 50.34 73.4735 a 40 33 22.45 95.9240 a 45 6 4.08 100.00Total 147 100.00

ANO=6o

Classesde pesos Frequências Percentagens F.Acumuladas

peso <=30 46 26.90 26.9030 a 35 77 45.03 71.9335 a 40 38 22.22 94.1540 a 45 10 5.85 100.00Total 171 100.00

Figura 2.3: Tabela de frequências dos PESOS, por ANO de escolaridade

foi medida numa escala intervalar. Por exemplo, uma avaliação baseada na escala de 0 a20 é intervalar; uma classificação de 14.4 valores é nitidamente superior a uma de 7.2, noentanto, 14.4 não significa um desempenho duas vezes melhor do que o 7.2. A mediçãoduma variável numa escala proporcional diz-nos quanto ela tem a mais em relação a outra.Por exemplo, a ALTURA e o PESO dos alunos são exemplos de variáveis proporcionais.Um peso de 46 Kg. é duas vezes superior ao peso de 23 Kg.

Quando temos este tipo de variáveis devemos decidir quantas classes/intervalos quere-mos formar. Quando temos poucas observações devemos definir um número pequeno declasses, 4, 5 ou 6. No entanto, quando o número de observações é elevado menos do que 10classes origina uma perda significativa de informação. Tudo depende também da variaçãodos valores que a variável pode tomar. Assim como o número de intervalos e a amplitudedesses intervalos são arbitrários, também o são os pontos que definem o início, limiteinferior, e o fim, limite superior, de cada intervalo. Estes limites separam os intervalosuns dos outros. Eles devem ser escolhidos por forma a que, para cada observação, fiquebem claro a que intervalo ela pertence. Por exemplo, relativamente à variável ALTURA,podemos usar um dos dois seguintes processos:

1. o primeiro intervalo, para a variável ALTURA, compreende os valores que vão desde125 a 130 cm. inclusivé ( isto é, 125 < ALTURA ≤ 130); o segundo intervalo teráobservações desde 130 cm. até 135 cm. inclusivé (130 < ALTURA ≤ 135), ....,até ao último intervalo que engloba ALTURAS que vão desde os 145 aos 150 cm.(145 < ALTURA ≤ 150);

Page 17: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 2. DESCRIÇÃO NUMÉRICA DOS DADOS 10

SEXO=femininoClasses

de alturas Frequências Percentagens F.Acumuladasaltura<=130 5 4.03 4.03

130 a 135 42 33.87 37.90135 a 140 66 53.23 91.13140 a 145 10 8.06 99.19

altura>145 1 0.31 100.00Total 124 100.00

SEXO=masculinoClasses

de alturas Frequências Percentagens F.Acumuladasaltura<=130 2 1.03 1.03

130 a 135 32 16.49 17.53135 a 140 84 43.30 60.82140 a 145 63 32.47 93.30

altura>145 13 6.70 100.00Total 194 100.00

Figura 2.4: Tabela das frequências das ALTURAS, por SEXO do aluno

2. (e como, para esta variável, todas as observações são quantidades inteiras) os limi-tes dos intervalos são definidos usando valores com casas decimais, 0.5 unidadesinferiores ao valor, para o limite inferior, e 0.5 unidades superiores ao valor, para olimite superior, de cada intervalo. Neste caso, ficamos com os seguintes intervalosfechados nos dois extremos: [124.5, 130.5], [130.5, 135.5], [135.5, 140.5], [140.5, 145.5]e [145.5, 150.5].

É também comum considerar os intervalos dos extremos como ’totalmente’ abertos, oprimeiro à esquerda, e o último à direita, isto é, o primeiro intervalo pode ser do tipo≤ 130cm. e o último do tipo > 145cm. Verifique o processo utilizado na definição dosintervalos para a variável ALTURA, na tabela da figura 2.4 e para a variável PESO natabela da figura 2.3.

A amplitude destas classes/intervalos é a diferença entre o limite superior e o inferior.Para a variável ALTURA a amplitude dos intervalos é de 5 cm. e para o PESO é de 5 Kg.Confirme estes valores nas tabelas das figura 2.4 e 2.3 respectivamente.

Como estes intervalos são definidos por um conjunto, por vezes, vasto de valores, hánecessidade de ter um valor que represente cada intervalo. Este valor é o ponto médio ecalcula-se como a semi-soma dos limites superior e inferior do intervalo. No caso da variávelALTURA os pontos médios dos intervalos são respectivamente 127.5, 132.5, 137.5, 142.5 e147.5 e para a classificação da variável PESO temos como pontos médios os valores: 27.5,

Page 18: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 2. DESCRIÇÃO NUMÉRICA DOS DADOS 11

32.5, 37.5, 42.5. Repare que os intervalos dos extremos foram considerados como tendoamplitudes iguais aos restantes.

O número de observações que pertencem a cada classe/intervalo é a sua frequênciaabsoluta. Tudo o que já foi dito relativamente às frequências relativas e acumuladas éválido para estas classes/intervalos.

Page 19: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 3

Descrição gráfica dos dados

Um gráfico serve para dar uma visão resumida dos dados. Um gráfico bem construído poderevelar factos (características) sobre os dados que, a retirar de uma tabela necessitariamde uma análise mais cuidada.

1. O gráfico de barras serve para comparar a frequência de ocorrência de certasobservações.

Na maior parte dos exemplos, os valores comparados são frequências absolutas ourelativas, em termos de percentagem, de variáveis medidas de acordo com as escalasnominal e ordinal. A figura 3.1 apresenta um gráfico de barras respeitante aos dadosda tabela da figura 3.2.

Gráfico de barras

0

20

40

60

80

100

120

140

10 11 12 13 14 15

IDADE

Fre

qu

ên

cia

Figura 3.1: Gráfico de barras das frequências das IDADES dos alunos

12

Page 20: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 13

IDADE Frequências Percentagens F.Acumuladas10 73 22.96 22.9611 136 42.77 64.7212 68 21.38 87.1113 24 7.55 94.6514 8 2.52 97.1715 9 2.83 100.00

Total 318 100.00

Figura 3.2: Tabela de frequências das IDADES dos alunos da Escola

As barras aparecem normalmente verticais, separadas e devem ter todas a mesmalargura. A altura da barra varia com a frequência, o que significa que a área dorectângulo também varia. A nossa percepção da quantidade representada, corres-ponde precisamente à área da barra.

Um gráfico de barras pode ser representado através de figuras a que se pode dar onome de gráfico ilustrativo ou pictograma. No entanto, essas figuras devem defi-nir imagens todas com a mesma largura, variando a altura com o valor da frequência.Nas figuras 3.3 e 3.4 estam representados dois exemplos de gráficos de barras utili-zando figuras. O primeiro não está correcto, pois pode levar a falsas interpretaçõesem termos relativos; o segundo, que é tão atraente como o primeiro, está correcto. Asáreas das figuras visualizam correctamente as proporções relativas entre as variáveis.

Figura 3.3: Pictograma (errado) da variável SEXO (ver tabela da figura 2.1)

Page 21: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 14

Figura 3.4: Pictograma da variável SEXO (ver tabela da figura 2.1)

2. O gráfico de sectores ou circular serve para representar várias variáveis. O tama-nho de cada sector é proporcional ao valor da variável, que representa, em relação àsoma dos valores das variáveis lá representadas.

Assim e tendo em conta os alunos do 5o ano de escolaridade, verificamos que hánúmeros diferentes de alunos dos sexos feminino e masculino nas diferentes turmas,como se pode ver na tabela da figura 3.5 e os gráficos de sectores correspondentesseriam os representados nas figuras 3.6 e 3.7.

3. Existe ainda outro gráfico de barras, para representar várias variáveis, só que destavez elas apresentam-se sobrepostas. Dos mesmos valores da tabela da figura 3.5, ográfico de barras sobrepostas é o que está representado na figura 3.8.

4. O gráfico de linha serve para representar os valores de uma variável e mostra atendência (comportamento) dessa variável normalmente em relação ao tempo. Porexemplo, se fosse conhecido o número de alunos inscritos na Escola XXX duranteos útimos dez anos, poderíamos representar esses valores ao longo do eixo vertical eao longo do eixo horizontal, representaríamos o tempo de acordo com o que está nafigura 3.9.

As escalas podem ser iniciadas em qualquer valor, em vez de 0. Para chamar aatenção da omissão do 0, é frequente utilizar uma linha em ziguezague sobre o eixo.

5. Um gráfico de pontos serve para representar dados relativos a duas variáveis,quando elas são medidas em escalas intervalar/proporcional ou ordinal. Cada variável

Page 22: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 15

ANO=5o

TurmaSEXO 1 2 3 4 5 Total

feminino 10 7 12 7 14 50masculino 24 22 14 21 16 97

Total 34 29 26 28 30 147

ANO=6o

TurmaSEXO 1 2 3 4 5 Total

feminino 17 16 15 11 15 74masculino 20 18 18 24 17 97

Total 37 34 33 35 32 171

Figura 3.5: Frequências dos alunos do 5o ano por TURMA

é representada num eixo. Cada ponto do gráfico corresponde a um par de valores(x, y); x diz respeito ao valor da 1a variável ( sobre o eixo das abcissas) e y diz respeitoao correspondente valor da 2a variável (sobre o eixo das ordenadas). Por exemplo,se quiséssemos representar os PESOS e as ALTURAS dos alunos do SEXO femininoda TURMA 2 do 5o ANO da Escola XXX teríamos o gráfico que está representadona figura 3.10.

6. O histograma das frequências é o gráfico mais importante na Estatística Inferen-cial.

Quando os dados são valores de uma variável medida numa escala intervalar/proporcional,uma tabela de frequências para cada uma das classes mostra a distribuição de valo-res dessa variável. Considere o exemplo apresentado na tabela da figura 2.4 relativoàs ALTURAS dos alunos da Escola XXX, distribuídos por SEXO. Esta distribuiçãopode ser representada graficamente num histograma. Este gráfico é desenhado tendocomo base um par de eixos coordenados, com a medida da variável que foi observadacolocada ao longo do eixo horizontal e o número ou a proporção de observações me-didos ao longo do eixo vertical. O eixo vertical começa normalmente em 0 e o eixohorizontal pode começar num valor qualquer, desde que seja conveniente.

A figura 3.11 mostra o exemplo em que as ALTURAS estão divididas por classes,também chamadas intervalos de amplitudes iguais a 5 cm. Cada barra representauma dessas classes e a altura corresponde à frequência absoluta (número de valoresque pertencem à classe). Também se usam as frequências relativas ou proporções nadefinição de histogramas.

Os histogramas têm as barras verticais, umas a seguir às outras e devem ser todasda mesma largura. Assim, ao agrupar um conjunto de dados por classes para repre-

Page 23: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 16

fe m in in o

20

14

24

14

29

1

2

3

4

5

Figura 3.6: Gráfico de sectores dos alunos do 5o ano do sexo feminino, por TURMA

]../pictures/sectoresm.eps

Figura 3.7: Gráfico de sectores dos alunos do 5o ano do sexo masculino, por TURMA

sentar um histograma, devemos escolher intervalos (classes) com amplitudes iguais.Não existe nenhum valor ideal para a amplitude da classe (intervalo). O objectivoé conseguir obter uma distribuição de frequências equilibrada. Assim, tenta-se evi-tar colocar todos os valores num número muito reduzido de classes de amplitudesenormes ou distribuir poucos valores por muitas classes de amplitudes pequenas. Asclasses devem ser definidas de tal forma que não haja ambiguidades sobre a classe(ou intervalo) a que pertence cada observação.

7. A forma da distribuição de frequências de um conjunto de dados pode ser analisadaatravés do histograma das frequências. A figura 3.12 mostra uma distribuição nãosimétrica e descaída para a direita. Por vezes, a análise é facilitada pelo polígono quese obtém unindo, por linhas, os pontos médios dos topos das barras no histograma,como se vê na figura 3.12. O polígono é terminado para a esquerda e para a direita,unindo os pontos que se colocam no eixo horizontal distanciados de metade da am-plitude para a esquerda do primeiro intervalo e para a direita do último intervalo.Este polígono é conhecido por polígono de frequências.

8. Ao gráfico das frequências acumuladas chama-se ogiva. Este gráfico obtém-se co-locando pontos na vertical dos limites inferiores das classes (ou intervalos) a umadistância do eixo horizontal que corresponde à percentagem das observações que são

Page 24: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 17

2014

24

14

28

25

23

14

22

16

0

5

10

15

20

25

30

35

40

45

50

1 2 3 4 5

Turm a

Pe

rce

nta

ge

mfem inino

masculino

Figura 3.8: Gráfico de barras dos alunos do 5o ano, por turma e por SEXO

menores ou iguais àquele valor (do limite inferior da classe) e unindo estes pontos porrectas. As ogivas têm um semelhança com um S aberto. Um exemplo de ogiva é o quese encontra na figura 3.14 e que corresponde às frequências da coluna ’F.Acumuladas’da tabela da figura 3.13.

Page 25: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 18

220

240250

265270

280

295

309315 318

200

220

240

260

280

300

320

83/84 84/85 85/86 86/87 87/88 88/89 89/90 90/91 91/92 92/93

te m po (a no le ctivo)

me

ro d

e a

lun

os

insc

rito

s

Figura 3.9: Gráfico relativo ao número de alunos da Escola, nos últimos dez anos

132

134

136

138

140

142

144

25 30 35 40 45

P e so (kg)

Alt

ura

(c

m)

Figura 3.10: Gráfico relativo aos PESOS e ALTURAS dos 7 alunos da TURMA 2 (5o

ANO)

Page 26: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 19

5

42

66

10

0

10

20

30

40

50

60

70

125-130 130-135 135-140 140-145

Altura (cm )

Fre

qu

ên

cia

Figura 3.11: Histograma relativo às ALTURAS dos alunos do SEXO feminino

Fre

qu

ên

cia

Figura 3.12: Polígono de frequências de uma distribuição definida por 8 intervalos

Page 27: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 3. DESCRIÇÃO GRÁFICA DOS DADOS 20

Classes dealturas Frequências Percentagens F.Acumuladas

altura<=130 2 1.03 1.03130 a 135 32 16.49 17.53135 a 140 84 43.30 60.82140 a 145 63 32.47 93.30

altura>145 13 6.70 100.00Total 194 100.00

Figura 3.13: Frequências das ALTURAS dos alunos do SEXO masculino

Figura 3.14: Ogiva das ALTURAS dos alunos do SEXO masculino da escola

Page 28: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 4

”Estatísticas” descritivas

Além das tabelas e dos gráficos, que têm com objectivo organizar e dar uma imagem visualdos dados, existem certas características de uma distribuição de valores, como o valorcentral e a sua dispersão, que podem ser resumidas por meio de certas quantidades.

Exemplos destas quantidades, conhecidas por "estatísticas"descritivas, são: o pontomédio, a mediana, a moda, a média, a amplitude, o desvio padrão e a variância.

4.1 Medidas de tendência central1. o ponto médio é o valor que se encontra a meio caminho entre a menor e a maior

das observações de uma lista. Por definição

Xm =menor obs. + maior obs.

2.

Considerando a tabela 4.1 relativa às ”estatísticas” das IDADES dos alunos da EscolaXXX, o Xm é igual a 10+15

2= 12.5.

2. A média (aritmética) de um conjunto de n observações obtém-se somando todasas observações e dividindo depois pelo seu número.

Se X1, X2, X3, ..., Xn forem as n observações, então a média deste conjunto é

X =

∑ni=1 Xi

n.

Quando os dados estão agrupados por classes numa tabela de frequências, a soma deobservações idênticas é equivalente a multiplicar o valor dessa observação, Xi, pelasua frequência fi. Assim, a média pode ser calculada através de

X =

∑ki=1 fiXi

n,

21

Page 29: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 22

IDADEPercentis Menores

1% 10 105% 10 1010% 10 10 Observações 31325% 11 10 Soma dos pesos 313

50% 11 Média 11.3239Maiores Desvio padrão 1.150557

75% 12 1590% 13 15 Variância 1.3237895% 14 15 Assimetria 1.16258399% 15 15 Kurtose 4.48434

Figura 4.1: ”Estatísticas” das IDADES dos alunos da Escola

em que n =∑k

i=1 fi e k é o número de classes distintas. Quando cada classe érepresentada por um intervalo de valores, o Xi é o valor que representa esse intervaloe que anteriormente chamámos o ponto médio do intervalo. Se os intervalos dosextremos são caracterizados por ≤ e >, os pontos médios são calculados do mesmomodo, supondo que esses intervalos têm amplitudes iguais aos restantes. Da tabelada figura 4.1, vemos que a média das IDADES dos 318 alunos da Escola XXX é de11.3239.

3. A mediana é o valor típico, isto é, é o ponto central das observações quando elasnão estão agrupadas e já se encontram colocadas por ordem crescente.

Quando o número de observações é impar, o valor do meio é a mediana; quando onúmero de observações é par, existe um par de valores no centro e a mediana passaa ser a média aritmética desse par. Para o cálculo da mediana de um conjunto deobservações não agrupadas por classes ou intervalos, podemos usar a seguinte regra:

Se n for o número de observações, calcule a quantidade (n + 1)/2. Coloque asobservações por ordem crescente e conte a partir do início (n + 1)/2 observações. Sen for impar a última contabilizada será a mediana da lista; se n for par, a quantidade(n + 1)/2 não é inteira, e tomamos a semi-soma das duas observações contíguas aesta quantidade (a anterior e a posterior) da lista.

Quando os n dados estão agrupados por k classes/intervalos, podemos usar o seguinteprocesso para o cálculo da mediana:

• calcular n2,

• calcular as frequências absolutas acumuladas das classes,

Page 30: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 23

• determinar o intervalo que contém a mediana. Seja M o número desse intervalo(M é um inteiro de 1 a k). A frequência acumulada dos intervalos anteriores aodo da mediana é FM−1. A frequência absoluta do intervalo da mediana é fM ea acumulada é FM , e FM−1 < n

2< FM ,

• calcular o número de observações que devemos tomar do intervalo da medianae que é igual a n

2− FM−1,

• como existem fM observações no intervalo da mediana e considerando-as unifor-memente distribuídas, o valor da mediana está a n/2−FM−1

fMde distância do início

do intervalo da mediana que tem amplitude igual a A e cujo limite inferior éliM . Assim,

mediana = liM +n2− FM−1

fMA.

Como num histograma as áreas dos rectângulos são proporcionais às frequênciasdos respectivos intervalos, a linha vertical traçada no valor da mediana divide ohistograma em duas áreas iguais.

4. A moda é o valor mais frequente, isto é, o valor com maior frequência entre asobservações de uma lista. Para o cálculo da moda convém colocar as observaçõespor ordem crescente para se ver qual delas ocorre mais vezes. Essa observação é amoda. A lista, neste caso, diz-se unimodal. Pode até haver mais do que uma moda.Se duas ou mais observações ocorrem o mesmo número de vezes, então a lista diz-serespectivamente bimodal ou multimodal.

Quando os dados se apresentam agrupados, a classe com maior frequência define aclasse da moda. Se cada classe for definida por um só valor, esse é a moda; se a classeé definida por um intervalo de valores, o ponto que representa a classe, o ponto médiodessa classe, é a moda. Tal como foi dito no parágrafo anterior podemos tambémaqui ter mais do que uma moda ou mesmo não ter nenhuma.

Destas medidas centrais, a média e a mediana são as mais usadas. A mediana utilizainformação relativa à ordem, não usando os valores numéricos das observações. A média,por sua vez, usa esses valores numéricos, sendo por isso a mais usada.

As diferentes localizações da média, da mediana e da moda são mais facilmente visíveisusando a curva das frequências desse conjunto de dados, o polígono de frequências. A modaé o valor onde a curva é mais alta. A mediana é o valor que divide a área, compreendidaentre o eixo e a curva, em duas partes iguais; metade fica à esquerda da mediana e a outrametade à direita. A média é o ponto central de uma distribuição simétrica.

Numa distribuição simétrica a moda coincide com a mediana e também com a média.Veja a figura 4.2.

A figura 4.3 apresenta dois exemplos de distribuições não simétricas. A primeira éassimétrica positiva e a segunda é assimétrica negativa. Repare na sequência de localizaçãodas três medidas: moda, mediana e média.

Page 31: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 24

Figura 4.2: Curva das frequências de uma distribuição simétrica

Figura 4.3: Curvas de frequências de duas distribuições não simétricas

Page 32: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 25

Dos valores da tabela 4.1 podemos retirar a mediana, que é o percentil de ordem 50, eé igual a 11 e de acordo com a tabela que foi apresentada na figura 3.1, a moda é também11, uma vez que é o valor que tem maior frequência (136). Assim, esta distribuição dasIDADES dos alunos da Escola XXX da cidade YYY é assimétrica positiva. Confirme estefacto com o gráfico de barras já anteriormente apresentado na figura 3.1. Da tabela dafigura 4.1 o valor do parâmetro ’Assimetria’=1.162583, porque é positivo, significa que adistribuição é assimétrica positiva. Se este valor fosse negativo, teríamos uma distribuiçãoassimétrica negativa.

4.2 Medidas de dispersãoAs medidas centrais são importantes mas não fornecem a informação completa sobre oconjunto das observações. Falta, pois, indicação sobre a dispersão desses valores.

Quando se usa a mediana para medir o centro de uma distribuição, é convenientefornecer elementos sobre a variação ou dispersão da distribuição, através dos percentis.

As medidas de dispersão mais usadas são: a variância e o desvio padrão. Devemser usadas quando a medida de tendência central usada for a média, pois elas medem adispersão em relação à média, como centro da distribuição.

1. O percentil de ordem p de um conjunto de valores (observações de uma variável)é o valor abaixo do qual estão p por cento dos valores, estando os restantes acimadele.

A mediana é o percentil de ordem 50, também conhecido por segundo quartil.

O percentil de ordem 25 chama-se primeiro quartil.

O percentil de ordem 75 chama-se terceiro quartil.

Um quarto das observações são menores do que o 1o quartil, metade são menores doque o 2o e um quarto são maiores do que o 3o quartil.

2. A amplitude de um conjunto de valores é definida como a diferença entre a maiore a menor das observações e mede a dispersão total dos valores do conjunto.

3. A variância é a média aritmética dos quadrados dos desvios das observações emrelação à média.

Assim, se X1, X2, X3, ..., Xn forem n observações e se X for a sua média, a variânciaé calculada a partir de

s2 =

∑ni=1(Xi − X)2

n.

Quando os dados estão agrupados por k intervalos, a variância é definida por

s2 =

∑ki=1(fiX

2i )

n− X2

Page 33: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 26

em que n =∑k

i=1 fi, k é o número de classes (ou intervalos), fi é a frequência daclasse i e Xi o valor que representa a classe i.

Quando as observações formam uma amostra aleatória simples de tamanho n, reti-rada de uma população, a variância da amostra deve ser calculada usando n− 1 nodenominador do primeiro termo da expressão, em vez de n, e deve-se multiplicar osegundo termo por n

(n−1).

Existem razões para esta escolha e têm a ver com o facto de esta ’estatística’ poderser usada para estimar a variância da população.

4. O desvio padrão é a raiz quadrada da variância. Utiliza-se s para designar o desviopadrão.

A variância e o desvio padrão das IDADES são, retirados directamente da tabela dafigura 4.1, respectivamente ’Variância’= 1.32378 e ’Desvio padrão’= 1.150557.

Alguns comentários em relação a estas medidas:

(i) A variância é uma quantidade positiva ou nula. Será nula se todos os desvios foremnulos e isto acontece quando todos os Xi forem iguais a X (sendo todos iguais). Nestecaso, não existe dispersão.

(ii) Se as observações estão dispersas e existem de um e de outro lado da média, os desviosdas observações à esquerda da média são negativos e os desvios das observações àdireita são positivos. Estes desvios serão tanto maiores, em valor absoluto, quantomais afastadas as observações estiverem da média. Os quadrados dos desvios sãoquantidades positivas e tanto maiores quanto maiores forem os desvios. Assim, seos valores estão juntos, a variância é pequena; se eles estão dispersos, a variância égrande.

(iii) Quando as observações são medidas numa unidade (por exemplo, centímetros, segun-dos, gramas, ...), a variância vem nessa medida ao quadrado. No entanto, o desviopadrão vem medido na mesma unidade das observações.

4.3 Medidas de associaçãoAs medidas centrais e de dispersão fornecem informação básica relativa a dados univariados,embora não completa. No entanto, se tivermos duas variáveis, as medidas referidas atrás.não são suficientes para as descrever. Normalmente estamos interessados numa possívelligação entre as variáveis: - os valores das variáveis aumentam simultaneamente, como aaltura e o peso das pessoas, ou variam em sentidos opostos, como o número de cigarrosfumados por dia e a esperança de vida do fumador!

Diz-se que duas variáveis estão associadas se existe uma ligação directa entre as suasvariações,

Page 34: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 27

• quando o aumento de uma variável tende a acompanhar o aumento de outra variável,diz-se que a associação é positiva;

• quando o aumento de uma variável tende a acompanhar a diminuição de outra va-riável, então as variáveis dizem-se associadas negativamente.

A associação é medida em termos médios. A associação faz sentido para variáveismedidas em qualquer tipo de escala. Associação positiva ou negativa já só faz sentidoquando as variáveis forem medidas numa escala ordinal ou intervalar/proporcional.

1. Uma das medidas de associação é o coeficiente de correlação. Dadas n observa-ções bivariadas nas variáveis X e Y , X1, X2, ..., Xn e Y1, Y2, ..., Yn, o coeficiente decorrelação r é definido por

r =1n

∑ni=1(Xi − X)(Yi − Y )

sXsY

em que X e Y são as médias dos valores de X e de Y respectivamente e sX e sY osdesvios padrões das mesmas variáveis.

O numerador da expressão é a média dos produtos dos desvios de X e de Y , emrelação às correspondentes médias. O denominador é o produto dos desvios padrõesde X e de Y .

Interpretação de r:

• o coeficiente de correlação r mede a associação entre duas variáveis; é positivoquando a associação é positiva e negativo quando a associação for negativa (ovalor de r é tanto maior quanto mais forte for a associação);

• o coeficiente de correlação toma sempre valores entre -1 e +1 (os desvios padrãono denominador estandardizam o r, as unidades no numerador e denominadorsão as mesmas, o que significa que r é adimensional);

• os valores extremos r = −1 e r = 1 indicam uma associação perfeita (r = −1significa que os pontos pertencem a uma linha recta de declive negativo, isto é,quando x aumenta, y diminui; r = 1 significa que os pontos pertencem a umalinha recta com declive positivo, isto é, quando x aumenta, y também aumenta;

• o coeficiente de correlação mede a proximidade da mancha de pontos em relaçãoa uma linha recta (r mede uma associação linear).

A figura 4.4 mostra cinco casos com diferentes valores de r. O último caso refere-se auma situação onde não existe uma relação linear, embora exista outro tipo de relação.

2. Existe uma maneira de medir a associação linear através de uma quantidade r2,chamada coeficiente de determinação. Este coeficiente é a proporção da variânciade uma variável, que pode ser explicada pela dependência linear na outra variável.

Page 35: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 28

Figura 4.4: Cinco casos de associação

Page 36: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 29

Para compreender melhor o seu significado, considere os dois gráficos da figura 4.5.No primeiro, existe uma associação perfeita linear com r = −1. A variável Y estátotalmente ligada à variável X; quando X varia, Y também varia e o ponto (X, Y )move-se ao longo da linha. O conjunto dos 8 valores de Y tem uma grande variância;mas esta variância é devida (explicada) à ocorrência dos diferentes valores de X,levando consigo os valores de Y . A dependência linear em X explica toda a variaçãoem Y e r2 = 1.

Figura 4.5: Duas associações diferentes entre duas variáveis

No segundo gráfico, o conjunto dos 21 valores de Y também tem uma grande variância.Alguma desta variância pode ser explicada pelo facto de a variação em X levar consigouma variação (em média) em Y .

O gráfico apresenta esta situação, mostrando os diferentes valores de Y que acompa-nham os dois valores de X. Neste caso, r2 �= +1 pois a associação entre X e Y explicaapenas parte da variação em Y . Esta parte é a fracção r2 da variância dos valores de YNeste exemplo, r2 = 0.49 e diz-se que 49 por cento da variância de Y é explicada peladependência linear de Y em relação a X.

O coeficiente r2 mede apenas a intensidade da associação e não nos diz nada sobre seela é positiva ou negativa.

A associação entre duas variáveis pode ser devida a três factores:

• ao factor causa, isto é, uma das variáveis origina (causa) variações na outra;

• à existência de outra(s) variável(eis) que origina(m) o aparecimento das duas (ou,cuja variação causa variações nas duas) variáveis em estudo;

• a uma terceira variável, que não se encontra em estudo, mas que, juntamente comuma das variáveis causa variações na outra.

Page 37: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 4. ”ESTATÍSTICAS” DESCRITIVAS 30

Para concluir que a associação entre duas variáveis é devido à causa, é necessário que:

• a associação se repita em diferentes circunstâncias, reduzindo a probabilidade de serconsequência da mistura entre variáveis;

• se conheca uma explicação plausível, mostrando como uma variável pode causarvariações noutra variável;

• não pareçam existir terceiros factores que possam causar variações nas duas variáveis.

A associação que se deve a razões comuns, pode ser utilizada para predizer uma dasvariáveis, como função da outra.

Figura 4.6: Recta de regressão

Correlação e predição estão muito relacionadas. Por exemplo, se uma variável indepen-dente X e uma variável dependente Y têm um r2 = 1, isto significa que as observaçõesem X e Y estão sobre uma linha recta. Este modelo pode ser usado para predizer Y apartir de um valor de X - ler na recta o correspondente valor de Y , Yx. Se o valor de r2 épequeno, a predição é menos precisa porque os pontos não estão sobre uma linha recta eY varia muito, para um valor fixo de X.

A linha que deve ser usada para predizer Y a partir de X, baseada numa mancha depontos é a recta de regressão. Veja o exemplo da figura 4.6.

Page 38: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 5

Distribuição normal

Quando um conjunto de dados tem uma distribuição descrita por uma das curvas normais,a média é facilmente detectada. Esta distribuição é simétrica, a média coincide com amediana e também com a moda. É o valor que corresponde ao pico. Veja o gráfico dafigura 4.2.

O desvio padrão também é facilmente detectável da curva normal. Os pontos onde acurvatura muda, de ambos os lados em relação ao centro, estão localizados a um desviopadrão de cada lado da média. O gráfico da figura 5.1. apresenta três exemplos dedistribuições normais com a mesma média mas com diferentes desvios padrão.

Figura 5.1: Distribuições normais com diferentes desvios

A média fixa o centro da curva, enquanto que o desvio padrão determina a forma.Alterando a média de uma distribuição normal não altera a forma, apenas altera a sua

localização nos eixos. No entanto, alterando o desvio padrão, a forma da curva é alterada.

31

Page 39: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 5. DISTRIBUIÇÃO NORMAL 32

Em todos os casos, temos a curva normal das frequências com uma amplitude igual aseis desvios padrão.

Considere a figura 5.2. Em qualquer distribuição normal,

Figura 5.2: Distribuição normal

1. metade das observações são menores do que a média e a outra metade maiores;

2. 68 por cento das observações pertencem ao intervalo limitado por um desvio padrãopara cada lado da média; destas, metade (34 por cento) estão entre a média e umdesvio padrão para além da média;

3. 95 por cento das observações pertencem ao intervalo limitado por dois desvios paracada lado da média;

4. 99.7 por cento das observações pertencem ao intervalo limitado por três desvios emrelação à média.

Em qualquer distribuição normal, o percentil de ordem 84 de uma distribuição normalestá localizado a um desvio padrão acima da média. Do mesmo modo o percentil de ordem16 é o ponto localizado a menos um desvio padrão em relação à média.

As observações retiradas de diferentes distribuições normais podem ser comparadas,colocando-as em unidades de desvio padrão acima ou abaixo da média. Observações ex-pressas em unidades de desvio padrão em relação à média, chamam-se pontuações es-tandardizadas (’standard’). Esta pontuação é calculada da seguinte maneira:

pontuação estandardizada =observação−média

desvio padrão.

Page 40: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 5. DISTRIBUIÇÃO NORMAL 33

Por exemplo, uma pontuação de 24 unidades num teste, cuja média foi de 18 e o desviopadrão de 6, é equivalente a (24−18

6=)1 unidade de pontuação estandardizada. Uma

pontuação estandardizada de 1 corresponde sempre ao percentil de ordem 84, qualquerque seja a distribuição normal original.

Page 41: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 6

Análise de Regressão

Seja Y uma variável aleatória dependente cuja variação é afectada pela variação da variávelindependente X.

Sejam X1, X2, ..., Xn os valores escolhidos arbitrariamente para X e Yi(i = 1, ..., n) oscorrespondentes valores de Y .

6.1 Regressão Linear e SimplesA partir dos valores observados, podemos estimar a recta de regressão linear e simples(com uma só variável independente). A forma da recta é:

Yx = α + β(X −X)

em que X é a média aritmética dos n valores de X, X1, X2,... ,Xn e α e β são calculadosatravés de

α =

∑ni=1 Yi

n

β =

∑ni=1(Xi −X)(Yi − Y )∑n

i=1(Xi −X)2=

∑ni=1(Xi −X)Yi∑ni=1(Xi −X)2

.

Embora seja possível fazer interpolação, isto é, calcular o valor de Y que corres-ponde a um dado valor de X = X0, se este pertencer ao intervalo definido pelos valoresX1, X2, ..., Xn usados nos cálculos, a extrapolação deve ser implementada com cuidadopois,

1. embora existindo uma relação linear entre X e Y (esta pode ser adequada na regiãodefinida pelo conjunto de valores usados), o modelo pode deixar de ser válido fora daregião definida por esse conjunto,

2. quanto mais afastado X0 estiver de X, maior será o erro de extrapolação.

34

Page 42: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 6. ANÁLISE DE REGRESSÃO 35

6.2 Regressão não linearAlém do modelo de regressão linear, existem outros modelos que podem descrever a de-pendência de Y em relação a X. Mesmo assim, a análise de regressão já definida pode seraplicada, desde que seja possível para isso redefinir as variáveis ou transformar a equação,de modo a conseguir-se um modelo linear nos parâmetros.

Como primeiro exemplo, considere o caso em que

Y = α + βX2 .

A equação é já linear nos parâmetros α e β e a única não linearidade está na variávelindependente X.

No segundo exemplo,Yx = Xβ ,

mais complicado, a não linearidade envolve directamente o parâmetro β a ser calculado.Esta equação exige uma transformação de variáveis que a torne linear em β.

Para o primeiro caso, o modelo matemático, no caso geral, é

Yx = α + βw + γw2

com w = W −W . Se fizermos x = w e z = w2, este modelo reduz-se a um modelo lineare múltiplo.

Para o segundo caso, se aplicarmos logaritmos, obtemos o modelo

lnYx = β ln X ou yx = βx

que já é linear no parâmetro β, sendo, neste caso, x = lnX e y = ln Y . Este modelo éagora linear e simples, sem constante α.

Page 43: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Parte II

Séries cronológicas

36

Page 44: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 7

Componentes do estudo

Comecemos pela definição:

Definição 7.0.1 Uma série cronológica é um conjunto de observações feitas em períodossucessivos de tempo, durante um certo intervalo.

Exemplo 7.0.1 Valores da taxa bruta de natalidade, em anos sucessivos.

Exemplo 7.0.2 Percentagem da população com idade inferior a 7 anos, em anos suces-sivos.

Vamos designar o conjunto dessas observações por X1, X2, ..., Xn e vamos supor queforam feitas nos períodos de tempo t1, t2, ..., tn contados a partir de uma origem fixada.

As observações são normalmente feitas em períodos de tempo igualmente espaçados.

7.1 Representação gráfica de uma série cronológicaPara iniciar a análise de uma série cronológica deve representar-se graficamente as ob-servações. Esta representação gráfica chama-se cronograma. Nos eixos das ordenadasmarca-se o valor da série. No eixo das abcissas marca-se o tempo (ver figura 7.1)

7.2 Estudo de uma série cronológicaDuas das questões mais importantes a ter em conta no estudo de uma série cronológicasão:

• A comparação entre valores da série se o intervalo entre tempos não é constante.Pode ser ultrapassada fazendo uma correcção aos valores da série.

• A variação da população a que se refere o fenómeno. As variações sofridas ao longodo tempo que sejam devidas à variação no número de elementos da população nãointeressam. A análise das variações deve ser feita em termos relativos.

37

Page 45: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 7. COMPONENTES DO ESTUDO 38

0

1

2

3

4

5

6

t1 t2 t3 t4 t5 t6 t7 t8

te m po

va

lor

da

rie

cronogram a

Figura 7.1: Gráfico de uma série cronológica

Constata-se que na maior parte das séries cronológicas as sucessivas observações nãosão independentes. Por exemplo, o valor da observação no instante t3 depende dos valoresnos instantes t1 e t2.

Quando se verifica dependência é possível prever valores futuros tendo como base valoresda série já observados.

O estudo de uma série cronológica consiste na descrição, na explicação, na previsão eno controlo dessa série. Assim,

• a descrição consiste na caracterização do comportamento através da identificaçãode pontos altos e baixos, distância entre eles, valores aberrantes e pontos de viragem;

• a explicação compreende a formulação de hipóteses e a tentativa de construir ummodelo matemático que permita descrever o comportamento da série até ao presente;

• a previsão estabelece uma relação entre o comportamento observado da série e ocomportamento futuro;

• o controlo é um fenómeno que tenta modificar o comportamento futuro da série.

Page 46: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 8

Decomposição

Algumas séries cronológicas são influenciadas por uma ou duas causas dominantes. Outrassão influenciadas por uma infinidade de causas.

É conveniente decompor as séries cronológicas em componentes que se agrupam em:

movimentos sistemáticos

tendência (’trend’)movimento sazonalmovimento oscilatório

movimentos não sistemáticos{

movimento aleatório

• A tendência é a variação em média, ao longo do tempo (compreende os movimen-tos que se manifestam suave e consistentemente ao longo de um período grande detempo).

• Os movimentos sazonais são variações em relação à tendência que ocorrem, emgeral, dentro de um ano.

Os movimentos sazonais podem ter causas naturais e causas sociais.

– As causa naturais estão associadas (quase sempre) com as estações do ano.

– As causa sociais estão associadas com usos, costumes e tradições sociais.

• Os movimentos oscilatórios ocorrem mais em séries económicas e associam-se aciclos económicos de expansão e depressão. Não apresentam periodicidade definida.Estes são difíceis de separar da tendência.

• Os movimentos aleatórios são de carácter fortuito, irregulares e de origem desco-nhecida.

Exemplos: guerras, epidemias, greves, secas, ...

Para o estudo da série é aconcelhável identificar e limitar primeiro a tendência, depoisos movimentos sazonais e finalmente as oscilações.

39

Page 47: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 9

Estudo da tendência

A tendência é um movimento suave e consistente ao longo de um período grande de tempo(o termo grande é relativo pois o que é grande para uma série pode ser pequeno paraoutra). O número de anos em que se deve considerar a tendência varia de série para série.

Algumas causas da presença da tendência numa série cronológica são:

• causas relacionadas com variações na população;

• causas relacionadas com idade, saúde, educação, constituição, conhecimentos teóricosda população;

• causas relacionadas com a qualidade e quantidade de recursos.

Estas causas estão relacionadas entre si.

Os objectivos a atingir com a determinação da tendência são:

1. Estudá-la para extrapolar como forma de prever o comportamento da série no futuro;

2. Eliminá-la para estudar as outras componentes (sazonalidade, oscilação e aleatorie-dade).

Quando se elimina a tendência, a série diz-se estacionária.

9.1 Métodos para estudo da tendênciaOs dois métodos mais importantes para estudar a tendência são:

1. Método das médias móveis

2. Método analítico

40

Page 48: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 9. ESTUDO DA TENDÊNCIA 41

9.1.1 Método das médias móveis

O método das médias móveis consiste em calcular a média aritmética de observaçõescontidas em escalões, tomando-a como estimativa do valor local da tendência. Assim, asetapas a seguir são:

1. começa-se por dividir a série em escalões, com igual número de termos sobrepostos;

• o número de observações em cada escalão chama-se período da média móvel,(ver figura 9.1)

x x x x x x x x x x

Figura 9.1: Escalões de período igual a 3

• Se tem k observações em cada escalão, existem k − 1 observações em comumcom os escalões seguintes (e anteriores).

2. Calculam-se as estimativas locais da tendência;

• Se k é impar (k = 2m + 1):as estimativas da tendência são (exemplo com k = 3, m = 1)

t2 =X1 + X2 + X3

3

t3 =X2 + X3 + X4

3

t4 =X3 + X4 + X5

3...

tn−1 =Xn−2 + Xn−1 + Xn

3

e a tendência não é estimada para os primeiros e últimos m pontos do tempo.

• Se k é par (k = 2m)

Page 49: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 9. ESTUDO DA TENDÊNCIA 42

i) as estimativas da tendência calculam-se em pontos médios de um intervalo(exemplo com k = 4, m = 2)

ponto médio de [2, 3] =X1 + X2 + X3 + X4

4

ponto médio de [3, 4] =X2 + X3 + X4 + X5

4

ponto médio de [4, 5] =X3 + X4 + X5 + X6

4...

ii) para centrar estas médias, calcula-se uma 2amédia móvel de período 2

[2, 3] = X1+X2+X3+X4

4

[3, 4] = X2+X3+X4+X5

4

}⇒

t3 =X1+X2+X3+X4

4+ X2+X3+X4+X5

4

2.

Do mesmo modo

t4 =X2+X3+X4+X5

4+ X3+X4+X5+X6

4

2, ...

O método das médias móveis é um caso particular dos filtros lineares, filtros esses quetransformam uma série X noutra Y , por meio de uma operação linear.

9.1.2 Método analítico

Com o método analítico a determinação da tendência é feita ajustando uma função davariável tempo (t) ao cronograma da série cronológica.

Este ajuste é feito, em geral, pelo método dos mínimos quadrados.De acordo com o tipo de função assim podemos ter tendências lineares, parabólicas,

exponenciais, ...A função vai traduzir uma lei matemática que se admite ser seguida pela tendência.A escolha do tipo de função a ajustar não é fácil e este processo deve ser iniciado com

a representação gráfica da série e inspecção cuidada do cronograma.

Tendência linearO modelo mais simples que é possível representar é o modelo linear com a seguinte

forma:

Xt = α + βt. (9.1)

ComoXt = α + β(t− t) = α + βt− βt = α− βt + βt,

Page 50: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 9. ESTUDO DA TENDÊNCIA 43

tem-seα = α− βt (9.2)

em que t é a média aritmética dos tempos, t1, t2, ..., tn, e os valores de α e β são calculadosda seguinte maneira:

α =X1 + X2 + ... + Xn

n(9.3)

e

β =(t1 − t)X1 + (t2 − t)X2 + ... + (tn − t)Xn

(t1 − t)2 + (t2 − t)2 + ... + (tn − t)2. (9.4)

O valor de α da equação Xt = α + βt chama-se ordenada na origem, isto é, quandot = 0, Xt = α, e β representa o declive da recta. Este declive dá a variação verificadaem Xt quando t varia de um período de tempo (constante).

O quadrado do coeficiente de correlação das duas variáveis X e t, r2 (coeficiente dedeterminação) dá a percentagem da variação da série original explicada pela tendêncialinear. A diferença 100%− r2% é a variação explicada pelos outros movimentos.

Além da tendência linear, descrita por um polinómio linear, existem outros tipos, taiscomo: tendências quadráticas (polinómio quadrático), tendências cúbicas (polinómio cú-bico), exponenciais, etc.

Exemplo 9.1.1 Considere a seguinte tabela de valores [2]:

Ano t X desvios:X −Xt

1973 1 233 41.2581974 2 250.3 39.8841975 3 158 -71.091976 4 178.3 -69.4641977 5 293.5 27.0621978 6 309.5 24.3881979 7 279 -24.7861980 8 355.2 32.74

O cronograma está representado na figura 9.2.No ajuste de uma tendência linear, usando as equações (9.3), (9.4), (9.2) e finalmente

(9.1), obtêm-se

Xt = 173.068 + 18.674 t.

A representação desta recta está na figura 9.2. A interpretação é a seguinte - A partirde uma valor de 173.068 verificado para t = 0 (1972), a tendência (Xt) aumenta (β > 0),em média, por ano (ver 1acoluna da tabela) 18.67.

Se calcularmos o coeficiente de determinação, r2, teremos r2 = 0.475, ou seja, 47.5%da variação da série original é explicada pela tendência, ficando 52.5% à conta dos outros

Page 51: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 9. ESTUDO DA TENDÊNCIA 44

150

200

250

300

350

400

450

1 2 3 4 5 6 7 8

t

X

X Linear Quadrática Exponenc ial

Figura 9.2: Cronograma da série e modelos ajustados

Page 52: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 9. ESTUDO DA TENDÊNCIA 45

movimentos. Na figura 9.2 estão também representadas duas funções. Uma quadrática eoutra exponencial , que corresponderiam a ajustes de modelos quadráticos e exponenciais,respectivamente.

Os desvios, X − Xt, calculados pela diferença entre os valores observados, X, e osvalores da tendência linear, Xt, representam a série corrigida da tendência. Para asérie do exemplo 9.1.1, os desvios estão representados na figura 9.3.

-100

-80

-60

-40

-20

0

20

40

60

80

100

1 2 3 4 5 6 7 8

t

Figura 9.3: Desvios. Série corrigida da tendência

A diferença entre o método das médias móveis e o método analítico é considerável. Noprimeiro, não se considera a tendência como definida por qualquer lei e obtém-se apenasuma curva ”suave”, sem outros movimentos. Com o segundo método, determina-se umafunção que traduz uma certa lei matemática que se admite ser seguida pela tendência.

Page 53: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 10

Movimento sazonal

Os movimentos sazonais são variações que ocorrem dentro de um ano e de acordo comum certo modelo (mais ou menos rígido) que se repete de ano para ano.

São todos os movimentos periódicos de período igual ou inferior a um ano.

Exemplo 10.0.2 Sazonalidade de casamentos[1] (índices)

ParóquiasMês Sul do Pico Transmontanas GuimarãesJan 122 126 117Fev 164 172 160Mar 29 91 64Abr 52 111 118Mai 140 131 127Jun 105 98 111Jul 73 64 64Ago 69 68 76Set 93 83 78Out 154 75 96Nov 161 78 110Dez 39 104 94

Deste exemplo é visível que a marcação de casamentos, nalgumas regiões, é afectadapor:

• razões sociais: respeito pelas interdições da Quaresma, Advento

• razões económicas: fainas agrícolas, preparação das vinhas (fim de inverno), vindi-mas, pastagens no verão.

46

Page 54: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 10. MOVIMENTO SAZONAL 47

10.1 Método para determinar as flutuações sazonais

10.1.1 Método das médias mensais

O termo mensal está relacionado com o facto do período sazonal ser de um ano e estardividido em meses. Neste caso deve-se trabalhar com médias mensais.

Se o ciclo for outro, por exemplo, o ano dividido em trimestre deve-se trabalhar commédias trimestrais.

O método das médias mensais só deve aplicar-se a uma série quando os dados nãoapresentarem tendência ou quando esta não for muito pronunciada. Existindo tendência,esta viciará os índices. Assim, o método das médias mensais só deve ser aplicado depoisde se ter eliminado a tendência.

Se a tendência foi estimada através do ajuste de uma recta, Xt = α + βt (ver (9.1)), osdesvios em relação à tendência traduzem a série corrigida da tendência e é a partir destesvalores corrigidos que se calculam os índices sazonais.

As etapas do método são as seguintes:

1. Dispôr as observações num quadro da seguinte maneira:

mês\ano 1900 1901 1902 ... Total Média ÍndiceJan ...Fev ...Mar ...Abr ...Mai ...Jun ...Jul ...Ago ...Set ...Out ...Nov ...Dez ...Total ...

(este exemplo refere-se a um período dividido em meses)

2. Calcular os totais (somas) referentes aos meses e colocá-los na coluna referenciadacom Total;

3. Calcular as médias para cada mês e colocá-las na coluna referenciada por Média;

4. Calcular a média das médias (média geral) e colocá-la na última célula da coluna”Média”;

Page 55: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 10. MOVIMENTO SAZONAL 48

5. Os índices sazonais são calculados como a percentagem da média de cada mês emrelação à média geral.

Nota 10.1.1 A soma dos índices é 1200.

Nota 10.1.2 O nível que traduz ausência de sazonalidade é igual a 100.

Assim, os índices são interpretados da seguinte maneira:

• Um valor menor que 100 indica que nesse mês a flutuação sazonal se traduz numaquebra em relação ao nível ’normal’ (100);

• Um valor maior que 100 indica um aumento em relação ao nível normal.

Nota 10.1.3 Também existe o método das médias móveis para estudar a sazonalidade [2].

Page 56: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Parte III

Estatística demográfica

49

Page 57: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 11

Estruturas populacionais

Iremos estudar alguns dos aspectos globais da população através do seu volume, ritmo decrescimento e densidade.

11.1 Taxas de crescimentoQuando temos, ao longo do tempo, informação variada sobre o volume de uma populaçãoqueremos numa primeira análise calcular o ritmo de crescimento. O valor do ritmo decrescimento deve corresponder a um resultado anual médio para ser possível fazer compa-rações em períodos de amplitudes diferentes. O ritmo de crescimento de uma populaçãopode ser

i) Contínuo:

comPn = P0e

an (11.1)

onde:

e = 2.718282 (exponencial)

Pn =população num momento n

P0 =população num momento 0

a =taxa de crescimento.

Aplicando logaritmos neperianos (ln) a (11.1) temos

ln Pn = ln P0 + ln ean

ln Pn − ln P0 = an

lnPn

P0= an

50

Page 58: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 51

e

a =ln Pn

P0

n(11.2)

onde a corresponde à taxa de crescimento contínuo.

ii) Aritmético:

comPn = P0(1 + an)

ou sejaPn = P0 + P0an

Pn − P0 = P0an

ea =

Pn − P0

P0n(11.3)

onde a corresponde à taxa de crescimento aritmético.

iii) Geométrico:

com

Pn = P0(1 + a)n (11.4)

ou sejaPn

P0= (1 + a)n (11.5)

e aplicando logaritmo na base 10 a (11.5) temos

logPn

P0= n log(1 + a)

log(1 + a) =log Pn

P0

n,

ou seja

1 + a = 10log

PnP0

n

e

a = 10log Pn

P0n − 1 (11.6)

onde a corresponde à taxa de crescimento geométrico.

Exemplo 11.1.1 Se em 1821 a população de uma região era de 3276203 habitantes, e sea taxa de crescimento, a, é de 0.25%, qual a população ao fim de 5, 25 e 100 anos?

Page 59: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 52

i) Se for crescimento contínuo

P5 = 3276203e0.0025×5 = 3317412

P25 = 3276203e0.0025×25 = 3487500

P100 = 3276203e0.0025×100 = 4206728

ii) Se for crescimento aritmético

P5 = 3276203(1 + 0.0025× 5) = 3317156

P25 = 3276203(1 + 0.0025× 25) = 3480966

P100 = 3276203(1 + 0.0025× 100) = 4095254

iii) Se for crescimento geométrico

P5 = 3276203(1 + 0.0025)5 = 3317361

P25 = 3276203(1 + 0.0025)25 = 3487228

P100 = 3276203(1 + 0.0025)100 = 4205416

(ver figura 11.1)

Exemplo 11.1.2 Análise prospectiva:Se a taxa de crescimento geométrico for a = 0.0021 (0.21%), ao fim de quantos anos

(n?) duplicará a população?Crescimento geométrico:

Pn = P0(1 + a)n

2P0 = P0(1 + a)n

2P0

P0= (1 + a)n

2 = (1 + a)n.

Aplicando logaritmos,log 2 = n log(1 + a)

0.30103 = n log(1.0021)

0.30103 = n× 0.0009111

n =0.30103

0.0009111e

n = 330, 4...

R: ao fim de 330 anos

Page 60: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 53

3276000

3376000

3476000

3576000

3676000

3776000

3876000

3976000

4076000

4176000

5 25 100

a no

po

pu

laç

ão

contínuo aritmético geométrico

Figura 11.1: Variações da população

Page 61: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 54

Exemplo 11.1.3 Análise regressiva:A população em 1821 era de 3276203 habitantes. Se admitirmos que o ritmo de cres-

cimento na primeira metade do sec XIX era de 0.0021 (a = 0.21%) qual teria sido apopulação em 1801?

Sabe-se que em 1821, n = 20, Pn = P20 = 3276203. Considerando 1801 como o ano 0,queremos saber P0 (com crescimento geométrico).

Pn = P0(1 + a)n

3276203 = P0(1 + 0.0021)20

3276203

P0= (1 + 0.0021)20.

Aplicando logaritmos,

log3276203

P0

= 20 log(1.0021)

log3276203

P0= 0.01822.

Aplicando agora a função inversa, potência de 10,

3276203

P0= 100.01822

3276203

P0= 1.04285

eP0 =

3276203

1.04285= 3141586.

11.2 Cálculo das densidades populacionaisPara calcular a densidade populacional de uma certa região usa-se:

dens. pop.=Total de habitantes existentes nessa região

superficie (em km2) dessa região

Exemplo 11.2.1 Se a superfície de um lugar é de 9 milhares de km2 e a população desselugar é de 414 milhares de habitantes, a densidade populacional é:

dens. pop. =414 milhares de habitantes

9 milhares por km2= 46 habitantes por km2

Page 62: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 55

11.3 Estruturas demográficasA análise de alguns aspectos globais da população também compreende o conhecimentodas estruturas demográficas.

Uma estrutura demográfica consiste na subdivisão da população em grupos homo-géneos a partir de determinadas características.

Existem diversos tipos de estruturas: por sexos e idades, por estado civil, por actividadeeconómica, por níveis de instrução, ...

Exemplo 11.3.1 Analisemos a repartição por sexos e idades:

a) a repartição por sexos justifica-se pelo facto das populações masculina e femininadesempenharem funções diferentes na sociedade, com incidências demográficas devidoa um complexo de factores biológicos, sociais e culturais.

b) a repartição por idades justifica-se pela necessidade:

• de se analisar os efeitos específicos de cada idade (com o aumento da idade oscomportamentos e as capacidades vão-se modificando)1;

• de se comparar determinados aspectos das fases da vida (início da socialização,instrução primária, primeiro casamento,...) em pessoas com diferentes idades2.

11.3.1 Pirâmides de idades

A pirâmide de idades é uma representação gráfica da distribuição de uma população porsexos e idades, que permite ter uma visão de conjunto das estruturas de idades de umapopulação.

• As idades são representadas num eixo vertical. Os efectivos (população existente) sãorepresentados em dois semi-eixos horizontais; o da esquerda é reservado aos efectivosmasculinos; o da direita aos femininos.

As figuras 11.2 e 11.3 apresentam dois exemplos de pirâmides de idades.

• Podemos construir pirâmides por idades e por grupos de idades.

• Representando os efectivos em números absolutos, a população em cada idade (ougrupo de idades) é representada por rectângulos, cuja área é proporcional ao efectivo(a ’largura’ é constante e o ’comprimento’ é proporcional ao efectivo ou volume dapopulação (número de habitantes)).

1Efeito idade2Efeito geração

Page 63: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 56

Figura 11.2: Exemplo de pirâmide de idade [1]

Page 64: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 57

Figura 11.3: Exemplo de pirâmide de idade [1]

Page 65: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 58

• A escala utilizada deve ser tal que a pirâmide terá uma altura igual (≈) a 23

da larguratotal.

• Podem aparecer vários tipos de pirâmides, embora a mais vulgar seja a ’triangular’.Assim, existem as pirâmides com forma de

1. acento circunflexo que é típica dos países não desenvolvidos com mortalidade enatalidade muito elevadas e caracteriza-se por ter uma base larga e topo muitoreduzido;

2. urna que é típica dos países desenvolvidos com baixos níveis de mortalidade enatalidade e tem uma base muito reduzida e um topo bastante empolado;

3. ás de espadas, típica dos países desenvolvidos com aumento de fecundidade numcerto período de tempo.

• Quando trabalhamos com grupos de idades, a largura do rectângulo é proporcionalao número de anos existentes em cada grupo. Se os grupos forem quinquerais (muitovulgar) basta fixar uma largura, que será constante.

O comprimento é proporcional ao total dos efectivos das diversas idades (que com-põem o grupo) dividido pelo número de anos do grupo (quinquenal→5).

• Se interessar fazer comparações no tempo ou no espaço, é mais conveniente represen-tar os efectivos relativos. A comparação passa a ser feita em termos de percentagensentre os diferentes grupos de idades.

11.3.2 Grupos funcionais

Quando temos que comparar muitas estruturas populacionais, ao longo do tempo, paraverificar a sua evolução, ou comparar estruturas de um número vasto de localidades, surgemvulgarmente muitos gráficos a partir dos quais é difícil tirar conclusões. Para uma visãomais rápida da evolução ou da diversidade de estruturas é mais conveniente compactara informação disponível, de acordo com determinados critérios. O mais importante é aidade. É possível concentrar a análise num número reduzido de subgrupos, chamadosgrupos funcionais.

Por exemplo, dividir a população em três grandes grupos: 0-14 anos que define apopulação jovem, 15-64 anos que define a população activa e 65 e +anos que define apopulação velha. Uma outra divisão consiste nos seguintes grupos: 0-19, 20-59 e 60 e +anos.

É possível ainda pegar num destes grupos e dividi-lo. Por exemplo, o grupo 20-59 podedividir-se em 20-39, população activa jovem, e 40-59, população activa velha.

Se o critério para a definição de grupos funcionais for o da escolaridade, teríamos osseguintes grupos: 0-5 (população em idade pré-escolar), 5-18 (população em idade escolar)e 18-24 (população em idade universitária).

Page 66: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 11. ESTRUTURAS POPULACIONAIS 59

Definidos os grupos funcionais deve proceder-se à manipulação dos dados, transformando-os em índices-resumos que se constroem a partir dos grupos funcionais.

Os índices-resumos mais importantes são:

• percentagem de jovens

população com 0-14 (ou 0-19) anospopulação total

× 100%

• percentagem de activos

população com 15-64 (ou 20-59) anospopulação total

× 100%

• percentagem de velhos

população com 65 e + (ou 60 e +) anospopulação total

× 100%

• índice de vitalidade (’racio’ entre velhos e jovens)

população com 65 e + anospopulação com 0-14

× 100%

• ’racio’ de dependência dos jovens

população com 0-14população com 15-64

× 100%

• ’racio’ de dependência dos velhos

população com 65 e + anospopulação com 15-64

× 100%

• ’racio’ de dependência total

população com 0-14 e 65 e + anospopulação com 15-64

× 100%

Page 67: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 12

Qualidade dos dados

12.1 Relação de masculinidadeAs pirâmides de idades nunca são simétricas pois nascem mais rapazes do que raparigas.Por cada 100 raparigas nascem 105 rapazes. No entanto a mortalidade (factor fundamentalna análise da redução dos diversos efectivos) é mais intensa nos homens do que nas mu-lheres. Factores como as migrações, guerras, ... podem modificar ainda mais a assimetria’natural’.

A relação de masculinidade é dada pelo quociente, para cada idade (ou grupo deidades),

efectivos masculinosefectivos femininos

× 100.

Como a relação de masculinidade dos nascimentos ronda os 105, a relação de masculi-nidade do primeiro grupo de idades é muito próxima de 105.

À medida que se avança na idade, devido ao facto de que a mortalidade masculina ésuperior à mortalidade feminina, as relações de masculinidade diminuem. É o efeito idade.

O índice, relação de masculinidade dos nascimentos, é frequentemente utilizado paraapreciar a qualidade do registo de nascimentos, por sexos. Normalmente existemomissões mais acentuadas num sexo do que noutro.

Quando o número de nascimentos não é suficientemente grande, alguns desvios podemser consequência directa de flutuações aleatórias mesmo estando em presença de observa-ções perfeitas. No entanto, é possível calcular um intervalo de variação deste erro, emfunção do número de nascimentos observados:

1. Para uma relação de masculinidade de 105, em 1000 nascimentos teríamos 512 mas-culinos e 488 femininos. A proporção de rapazes é de 0.512 = 512

1000. A proporção de

raparigas é então de 0.488.

2. Os limites do intervalo de confiança a 95% (0.95 de probabilidade de conter o valor)para a proporção são

60

Page 68: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 12. QUALIDADE DOS DADOS 61

0.512− 1.96

√0.512× 0.488

n︸ ︷︷ ︸i

,0.512 + 1.96

√0.512× 0.488

n︸ ︷︷ ︸s

em que n representa o número total de nascimentos.

3. Os limites de confiança da relação de masculinidade são

[i

1− i× 100,

s

1− s× 100

]

em que i e s são respectivamente os limites inferior e superior do intervalo do passoanterior.

4. Se o valor da relação de masculinidade observado está fora do intervalo (do passoanterior) é de admitir uma má qualidade no registo dos nascimentos. Se for superiorexiste provavelmente um sobre-registo dos nascimentos masculinos (menos provável)ou um sub-registo dos femininos (mais provável).

12.2 Índice de WhippleO método baseado no cálculo da relação de masculinidade dos nascimentos e, quando onúmero de nascimentos é pequeno, do intervalo de variação (limites de confiança da relaçãode masculinidade) serve para analisar a qualidade dos dados das estatísticas demográficas.

O método baseado no índice de Whipple serve para analisar determinado tipo dedistorção existente nos recenseamentos.

O tipo de distorção referida é a atracção pelos números (idades) terminados em 0 e 5.Sabe-se que em demografia e em países não desenvolvidos e há muitos anos atrás as

pessoas tinham dificuldade em declarar com exactidão a sua idade. Por exemplo, pessoascom 48, 49, 51 e 52 anos de idade tinham a tendência em declarar que tinham 50 anos.Esta idade aparecia com muitos registos e os valores adjacentes tinham poucos efectivos.

O índice de Whipple constrói-se da seguinte maneira:

1. calcula-se o número de pessoas entre 23 e 62 anos (inclusivé);

2. calcula-se o número de pessoas que, no intervalo de idades de 23 a 62 anos, têmidades registadas que terminam em 0 e 5;

3. calcula-se o índice

IW =node pessoas na alínea 2 × 5

node pessoas na alínea 1× 100.

Page 69: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 12. QUALIDADE DOS DADOS 62

O IW pode variar entre 100 (ausência de concentração) e 500 (caso limite em que todasas pessoas declaram idades terminadas em 0 e 5)

Para facilitar a análise usa-se a escala de valores do anuário demográfico das NaçõesUnidas de 1963. Assim

se pode concluir-se queIW < 105 dados muito exactos

105 ≤ IW < 110 dados relativamente exactos110 ≤ IW < 125 dados aproximados125 ≤ IW ≤ 175 dados grosseiros

IW > 175 dados muito grosseiros

12.3 Índice de irregularidadeEste índice serve para medir qualquer tipo de atracção, por exemplo, pelos números parese impares, pelo número 0, pelo número 5, pelos números terminados em 1,2,3, ...

O índice de irregularidade constrói-se da seguinte forma:

1. calcula-se o número de pessoas com a idade cuja atracção se pretende medir;

2. calcula-se a média aritmética do número de pessoas com as 5 idades que enquadrama idade que se pretende analisar;

3. calcula-se o índice

II =node pessoas da alínea 1node pessoas da alínea 2

× 100

Quanto mais o II se afasta de 100 mais demonstra a força da atracção.

12.4 Índice combinado das Nações UnidasEste índice serve para medir a qualidade global de um recenseamento.

Este índice combina três indicadores:

indicador de regularidade das idades das pessoas do sexo masculinoindicador de regularidade das idades das pessoas do sexo femininoindicador de masculinidade

O índice combinado das Nações Unidas calcula-se da seguinte maneira:

1. calcula-se o índice de regularidade dos sexos (i.r.s.) da seguinte forma:

Page 70: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 12. QUALIDADE DOS DADOS 63

i.r.s. = média aritmética das diferenças, em valor absoluto, entre asrelações de masculinidade dos grupos sucessivos

2. calcula-se o índice de regularidade das idades do sexo masculino(i.r.i.(M)) e do sexo feminino (i.r.i.(F)) da seguinte maneira:

i.r.i.(M) = média aritmética das diferenças, em valor absoluto,entre as relações de regularidade (r.r.) e o 100

com

r.r.=efectivos do grupo

média aritmética dos efectivos dos 2 grupos adjacentes× 100

(com fórmulas idênticas para o i.r.i.(F))

3. calcula-se o índice

ICNU=3× (i.r.s.)+i.r.i.(M)+i.r.i(F)

Para faciliar a interpretação existe uma grelha (das Nações Unidas) classificativa:

se pode concluir-se queICNU < 20 a validade do recenseamento é boa

20 ≤ ICNU < 40 a qualidade é máICNU ≥ 40 a qualidade é muito má

12.5 A equação da concordânciaA equação da concordância tem como objectivo verificar se existe ou não uma con-cordância entre os diversos dados disponíveis. Estes dados estão relacionados com os doistipos de movimentos: {

naturalmigratório

que se verificam num determinado período de tempo.Considerem-se dois instantes x e x + n (n anos após o instante x), i.e., dois períodos

com n anos de diferença.Se conhecermos a população nos dois instantes:

Page 71: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 12. QUALIDADE DOS DADOS 64

Px ← população no momento x

Px+n ← população no momento x + n

e seN é o número de nascimentos verificados naquele período,

O, o número de óbitos ocorridos naquele período,

E, o número de emigrantes naquele período,

e I, o número de imigrantes no mesmo período,

então a equação da concordância (se todos os elementos nela intervenientes tiverem sidocorrectamente apurados) é:

Px+n = Px + N − O + I − E

em que N − O representa o crescimento natural e I − E representa o crescimentomigratório.

A Px + N −O + I −E chama-se população esperada.Quando a população esperada não coincide com a população recenseada, Px+n, deve-se

tentar explicar essa diferença. Três hipóteses podem ser formuladas:

1. as parcelas N e I (+) estão subavaliadas;

2. as parcelas O e E (-) estão sobreavaliadas;

3. os recenseamentos não são de boa qualidade.

Face à realidade do país em estudo (na época em estudo) assim se podem tirar asconclusões mais acertadas.

Algumas recomendações:

1. Face à diferença observada entre população esperada e população recenseada ter ematenção o sinal dessa diferença;

2. Verificar a qualidade dos dados pelos índices de irregularidade e Whipple e ICNU epela relação de masculinidade dos nascimentos. Se a qualidade for boa, afasta-se ahipótese de recenseamento de má qualidade.

3. Resta uma análise dos movimentos migratórios;

4. Resta ainda uma análise dos registos de nascimento e dos óbitos.

Nos registos de nascimento, a relação de masculinidade dos nascimentos ajuda aconcluir sobre o subregisto (ou sobreregisto).

5. Notar que é mais frequente um subregisto do que um sobreregisto.

Page 72: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 13

Análise da mortalidade

O estudo da mortalidade, enquanto fenómeno social, gira em torno das três vertentes:

1. caracterização do declínio observado na época em estudo;

2. estudo dos factores responsáveis por esse declínio;

3. estudo das diferenças observadas entre determinados grupos (mortalidade diferencial)

13.1 Taxa bruta de mortalidadeA taxa bruta enquanto medida elementar de análise da mortalidade geral é dada por

t.b.m.=total de óbitos num período

população média existente nesse período× 1000

t.b.m. significa taxa bruta de mortalidade.A taxa bruta de mortalidade pode ser calculada como resultante da interacção entre o

modelo do fenómeno e a estrutura por idades.A t.b.m. é a soma dos produtos das estruturas relativas em cada idade (ou grupo de

idades) pelas taxas nessas idades (ou grupo de idades):∑x=0

Pxtx

em que Px representa a estrutura relativa em cada grupo de idades (proporção) e é igual a

população do grupo de idadespopulação total

e tx é a taxa de mortalidade do grupo que é igual a

total de óbitos no grupopopulação no grupo

× 1000.

Ao conjunto de taxas por idades (ou grupo de idades) chama-se modelo do fenómeno.

65

Page 73: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 66

Exemplo 13.1.1 [3] Completar e

Grupos de idades total de óbitos população tx × 1000 Px Pxtx

1 1848 46514 39,73 0,0326 1,301-4 1087 184916 5,88 0,1295 0,765-9 318 215461 1,48 0,1509 0,22

10-14 171 173563 0,99 0,1215 0,1215-19 198 145227 1,36 0,1017 0,1420-24 197 125339 1,57 0,0878 0,1425-29 185 10169930-34 182 8251835-39 200 7339540-44 247 6094545-49 251 5333050-54 346 4656155-59 398 3781660-64 483 2788965-69 502 2039770+ 2463 32502Total 9076 1428082 1,0000 6,37

• calcular a taxa bruta de mortalidade (geral);

• calcular a taxa bruta de mortalidade como resultante da interacção entre modelo eestrutura.

Por este processo ficam visíveis os factores intervenientes - o modelo e as estruturas.Quando surgem diferenças nos valores da t.b.m., elas podem vir dos tx (modelos) ou

dos Px (estruturas) e têm significados diferentes:

• Variações entre modelos (tx) significam a existência de diferentes riscos de mortali-dade (diferenças nas condições gerais de saúde e higiene);

• Variações entre estruturas (Px; maior ou menor envelhecimento) são alheias ao fenó-meno em análise.

As taxas brutas são muito sensíveis aos efeitos da estrutura. Basta as proporções dapopulação serem diferentes nos grupos em que a mortalidade é mais intensa para termosimportantes efeitos de estrutura que nos impossibilitam a comparação entre países, regiõesou épocas.

A validade de uma análise feita através das taxas brutas é tanto menor quanto mais di-versificadas forem as estruturas das regiões ou épocas que se querem comparar. A validadeaumenta com a homogeneização das estruturas populacionais.

Page 74: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 67

13.2 Tipos particulares de mortalidade1. A taxa de mortalidade por idades e por grupos de idades é dada por

total de óbitos entre as idades exactaspopulação média existente entre essas idades

× 1000

2. A taxa de mortalidade infantil (t.m.i) calcula-se da seguinte maneira:

total de óbitos entre 0 e 1 anos exactospopulação média existente entre 0 e 1 anos exactos

× 1000

Exemplo 13.2.1 Se numa região houve 11751 nascimentos em 1961, 11730 em1962, 385 óbitos com menos de 1 ano de vida em 1962, então a t.m.i. em 1962 é:

t.m.i. =385

11740.5× 1000 = 32.8 por mil

3. A taxa de mortalidade infantil clássica (t.m.i.c.) é dada por

total de óbitos com menos de 1 anototal de nascimentos nesse ano

× 1000.

Tradicionalmente esta medida da taxa de mortalidade infantil relacionava o númerode óbitos com menos de um ano e o efectivo dos nascimentos nesse ano (noção dequociente - proporção).

Exemplo 13.2.2 Tomando os valores do exemplo 13.2.1:

t.m.i.c.=385

11730× 1000 = 32.8 por mil

Esta definição não é totalmente satisfatória pois os óbitos ocorridos num ano nãoresultam apenas de nascimentos desse ano. Sem informação relativa ao ano de nas-cimento do óbito ocorrido num certo ano, podemos imputar os óbitos a uma médiaponderada dos dois efectivos de nascimentos em causa (do ano em questão e do ante-rior). Este novo processo para calcular a mortalidade infantil chama-se método damédia ponderada (m.m.p.).

Os coeficientes de ponderação que se devem usar são os da tabela:

Page 75: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 68

Ponderação da mortalidade infantil(método de Shryock e Siegel)

t.m.i.c. k′

k′′

200 0.6 0.4150 0.67 0.33100 0.75 0.2550 0.8 0.225 0.85 0.1515 0.95 0.05

Os coeficientes de ponderação a usar têm em conta os seis tipos de população, deacordo com o nível de mortalidade infantil esperado e que é determinado pela taxade mortalidade infantil clássica. Assim

t.m.i.(m.m.p.)=total de óbitos com menos de 1 ano

k′′N0 + k′N1

× 1000

sendo N0 o total de nascimentos do ano anterior, N1 o total de nascimentos daqueleano e k

′ e k′′ os coeficientes da tabela que correspondem à t.m.i.c. calculada.

Exemplo 13.2.3 Do exemplo 13.2.1:

t.m.i.(m.m.p.) =385

0.15(11751) + 0.85(11730)× 1000 = 32.8 por mil

uma vez que a t.m.i.c.=32.8 e da tabela, o valor mais próximo, corresponde à 2alinhaa contar do fim.

4. Taxas de mortalidade endógena e exógena

As causas que originam a mortalidade infantil são endógenas e exógenas.

As endógenas são consequência de deformações congénitas, doenças hereditárias outraumatismos causados pelo parto. Estes óbitos ocorrem normalmente durante oprimeiro mês (menos de 28 dias).

Os óbitos exógenos estão relacionados com doenças infecciosas, alimentação e cuida-dos hospitalares insuficientes ou acidentes. Estes óbitos ocorrem nos restantes meses(de 28 dias até 11 meses).

Não havendo registo de óbitos por causas de morte pode usar-se um método (J.Bourgeois-Pichat) que não exige senão o conhecimento dos óbitos por dias e idades.Assim, para se calcular o total de óbitos exógenos, soma-se ao total de óbitosobservados no intervalo 28-365 dias, 22.8% destes (ou 25% para uma divisão de 31 a

Page 76: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 69

365 dias). O total de óbitos endógenos é então a diferença entre o total dos óbitosregistados e os óbitos exógenos calculados.

A taxa de mortalidade infantil clássica é igual à taxa de mortalidade endógena(t.m.end.) mais a taxa de mortalidade exógena (t.m.exo.) sendo

t.m.end.=total de óbitos endógenos

total de nascimentos do ano× 1000

t.m.exo.=total de óbitos exógenos

total de nascimentos do ano× 1000.

13.3 Tábua de mortalidadeÉ possível fazer uma análise da mortalidade de uma população calculando outros índices.O princípio da estandardização [3], que separa o impacte das estruturas do das frequências(modelos), tem como objectivo manter o efeito das estruturas constante, calculando osíndices comparativos. Não é contudo o método mais usado.

É comum usar o princípio da translação. Com este princípio procura-se estimar a inten-sidade e o calendário a partir das frequências calculadas em transversal. Aplica-se, assim,o método da coorte fictícia que consiste em transpôr os fenómenos que se observam numdeterminado momento do tempo, para uma coorte imaginária. No caso da mortalidade, aintensidade mede o número médio de acontecimentos por pessoa e o calendário mede asua repartição no tempo. O calendário, ao ser resumido pelo índice da tendência central,a média, dá-nos a possibilidade de conhecer a duração de vida média das pessoas.

No cômputo dos efectivos de uma população podem surgir efectivos de idade ignorada.Havendo um número significativo de pessoas de idade ignorada, pode usar-se um critériode repartição dessas pessoas. Calcula-se o factor (Coale e Demeny) de correcção:

população totalpopulação total - população de idade desconhecida

e os efectivos de cada idade (ou grupo de idades) são multiplicados por este factor.

Existem tábuas de mortalidade por idades que se chamam completas, e tábuas demortalidade por grupos de idades, chamadas tábuas abreviadas.

Nota 13.3.1 No caso da tábua de mortalidade abreviada, as diversas funções são calcu-ladas por grupos de idades quinquenais (n=5), excepto no primeiro grupo, que devido àimportância da mortalidade infantil, se divide em dois grupos:

• menos de 1 ano (n=1)

• 1-4 anos completos (n=4).

As diversas funções que integram uma tábua de mortalidade são:

Page 77: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 70

1. Taxa de mortalidade entre a idade exacta x e a idade exacta x + n:

nmx =total de óbitos com idade entre x e x + n

habitantes com idade entre x e x + n

2. Quociente de mortalidade que é equivalente à probabilidade de morrer entre aidade (exacta) x e a idade (exacta) x + n:

nqx =2n nmx

2 + n nmx.

Os casos mais usados são:

• n = 1

1qx =2 1mx

2 + 1mx

• n = 4

4qx =8 4mx

2 + 4 4mx

• n = 5

5qx =10 5mx

2 + 5 5mx

Nota 13.3.2 1q0 é a taxa de mortalidade infantil e nqx do último grupo de idades=1 (todas as pessoas terão de desaparecer)

3. Probabilidade de sobrevivência entre as idades (exactas) x e x + n:

npx = 1−n qx

Nota 13.3.3 No último grupo de idades npx = 0 (ninguém irá sobreviver)

4. Sobreviventes em cada idade exacta x:

Para tornar possível as comparações temporais e espaciais, aplica-se a um mesmoefectivo à nascença - a raiz da tábua, s0 = 100000 - a lei da mortalidade de-finida pelos nqx (quociente de mortalidade) ou da sobrevivência definida pelos npx

(probabilidade de sobrevivência).

Os sobreviventes em cada idade x + n:

Page 78: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 71

sx+n = sx npx

ousx+n = sx(1−n qx) = sx − sx nqx

5. Distribuição dos óbitos (tendo em conta o efectivo inicial de 100000) por idadesou grupos de idade

ndx = sx − sx+n

oundx = sx nqx

6. Número de anos vividos pelos sobreviventes sx entre as idades x e x + n:

[O número de anos vividos obtém-se multiplicando a média dos efectivos entre idadesexactas pelo número de anos]

(a) numa tábua de mortalidade completa

Nx =1

2(sx + sx+1)

(b) numa tábua de mortalidade abreviada

nNx =n

2(sx + sx+n)

Nota 13.3.4 Devido à não linearidade da função de sobrevivência nos primeirosanos de vida, é mais conveniente (aproximação mais exacta) usar:

1N0 = k′′s0 + k

′s1

4N1 = 4(k

′′s1 + k

′s5

)em que k′ e k′′ são os coeficientes de ponderação usados no cálculo da mortalidadeinfantil (pelo método das médias ponderadas), em 13.2.

Nota 13.3.5 Para o último grupo (70 e + anos) tem-se:

Nk+ = Tk ↔ N70+ = T70+ (ver nota 13.3.8)

7. Probabilidade de sobrevivência entre dois anos completos ou entre dois gruposde anos completos:

Page 79: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 72

(a) numa tábua de mortalidade completa

Px =Nx+1

Nx

(b) numa tábua de mortalidade abreviada

nPx =nNx+n

nNx

Nota 13.3.6 No primeiro grupo de idades, tem-se

P0 =5N0

5s0=

1N0 +4 N1

500000

5P1 =5N5

1N0 +4 N1.

Nota 13.3.7 O último nPx calcula-se dividindo o último Tx pelo penúltimo (ver nota13.3.8).

8. Total de anos vividos pela coorte depois da idade x:

Como nNx é o número de anos vividos entre as idades x e x + n, o total de anosvividos pela coorte obtém-se somando os nNx. Assim,

(a) numa tábua de mortalidade completa:

Tx =

w∑x

Nx

(b) numa tábua de mortalidade abreviada

Tx =w∑x

nNx.

Nota 13.3.8 O último Tx (ou Tk), que é igual a Nk+,é:

Tk =sk

mk+

com mk+ a mortalidade do último grupo de idades.

Page 80: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 13. ANÁLISE DA MORTALIDADE 73

9. Esperança de vida na idade x, i.e., o número médio de anos que resta para viveràs pessoas que atingiram a idade x.

Quando x = 0, é a esperança de vida à nascença (é o número total de anos vividosdesde o nascimento dividido pelo efectivo inicial)

e0 =T0

s0,

ou seja, o número médio de anos vividos desde o nascimento (ou o calendário). Domesmo modo,

ex =Tx

sx

.

.

Page 81: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 14

Análise da natalidade e da fecundidade

A característica principal da natalidade no século XX é o declínio (embora posterior ao damortalidade).

Em muitos países não desenvolvidos esse declínio ainda não começou ou está no início.Existe uma grande diversidade de situações no tempo e no espaço.

Os estudos sobre a natalidade giram à volta de três eixos fundamentais:

1. caracterização do declínio observado na época contemporânea;

2. estudo dos factores responsáveis por esse declínio;

3. estudo das diferenças observadas entre determinados grupos.

Relativamente à caracterização do declínio, passou-se de valores entre os 30 por mil e os40 por mil, no início do século, para os 10 por mil ou 15 por mil, nos países desenvolvidos.A diversidade de situações é maior na natalidade do que na mortalidade. Esta diversidadelevou à procura das causas do declínio da natalidade. Algumas dessas causas são: factoresbiológicos, relações sexuais, leis e costumes, divórcios, viuvez e abstinência, contracepção eaborto, que por sua vez estão dependentes de diversos factores económios, sociais e culturais(demografia histórica e social).

As taxas brutas como medidas elementares da análise da natalidade e fecundidade sãoas seguintes:

1. a taxa bruta de natalidade:

t.b.n.=total de nascimentos num período

população média existente no mesmo período× 1000.

O período usado é normalmente de um ano.Embora seja um instrumento de análise muito grosseiro (que isola os efeitos deestrutura) é possível introduzir uma correcção. Esta correcção relaciona os nasci-mentos directamente com a parte da população onde eles ocorrem, ou seja, com apopulação feminina no período fértil (por convenção, dos 15 aos 50 anos). Assim,

74

Page 82: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 14. ANÁLISE DA NATALIDADE E DA FECUNDIDADE 75

2. taxa de fecundidade geral:

t.f.g.=total de nascimentos num período

população feminina no período fértil no mesmo período× 1000

3. taxa de fecundidade geral como resultante da interacção entre o modelo do fenómenoe a estrutura por idades.É possivel decompor a t.b.n. nos seus elementos constitutivos, mas como não ocorremnascimentos em todos os grupos populacionais, é mais interessante analisar a t.f.g.

A t.f.g. é a soma dos produtos das estruturas relativas em cada idade (ou grupo deidades), do período fértil das mulheres, pelas taxas nessas mesmas idades (ou grupode idades),

t.f.g.=50∑

x=15

pxtx

com

px =população feminina do grupo de idadespopulação feminina do período fértil

e

tx =total de nascimentos no grupo de idades

população feminina no grupo× 1000

Apesar das diferenças existentes entre as curvas de fecundidade dos diversos países,estas têm um modelo único: partem do 0 no grupo 0-15 anos; a partir dos 15 anos afecundidade é crescente até atingir um máximo entre os 20 e os 30 anos; a partir destemáximo a fecundidade diminui até atingir de novo 0 por volta dos 50 anos.

Tipos particulares de natalidade e de fecundidade:

1. A fecundidade por idades ou por grupos de idades:Como os nascimentos ocorrem numa determinada parte da população, não é vulgarcalcular taxas de natalidades por idades ou grupos, mas sim taxas de fecundidadepor idades ou grupos.

2. A fecundidade legítima

Relaciona os nascimentos legítimos com as mulheres casadas no período fértil.

t.f.l.=total de nascimentos legítimosmulheres casadas 15-49 anos

× 1000

A fecundidade legítima também pode ser medida por idades ou por grupos de idades.Neste caso aplicam-se as regras já referidas nos casos anteriores.

Page 83: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 14. ANÁLISE DA NATALIDADE E DA FECUNDIDADE 76

3. A fecundidade ilegítima

Relaciona os nascimentos ilegítimos com as mulheres não casadas no período fértil

t.f.i.=total de nascimentos ilegítimos

mulheres não casadas 15-49 anos× 1000

4. Descendência média

O fenómeno em análise é a intensidade da fecundidade e é dada por

d.m.=amplitude do intervalo×49∑

x=15

taxas de fecundidade geral

em que as taxas de fecundidade geral são calculadas por idades ou grupos de idades.

5. Taxa bruta de reprodução

Esta correponde à descendência média feminina por mulher na ausência de mortali-dade e calcula-se a partir de:

t.b.r.=descendência média× 0.488

em que o valor 0.488 resulta da aplicação da relação de masculinidade no nascimento:100

100+105.

6. Taxa líquida de reprodução

Esta taxa tem em conta a mortalidade. Assim, multiplicando a amplitude do inter-valo por 0.488 e pelo somatório dos produtos das taxas de fecundidade geral pelasprobabilidades de sobrevivência (npx = sx+n

sx)(por idades ou grupos de idades), obtém-

se

t.l.r.=amplitude do intervalo× 0.488×49∑

x=15

t.f.g. npx

7. Idade média da fecundidade

É a idade média da população feminina no período fértil considerando a taxa defecundidade geral como ’frequência relativa’ de cada grupo de idades:

M I =

∑49x=15 t.f.g.Ix∑49x=15 t.f.g.

.

Os somatórios são relativos aos 7 grupos de idades de amplitudes iguais a 5, doperíodo fértil, se as taxas de fecundidade geral forem calculadas por grupos de idade.A taxa de fecundidade geral de cada grupo de idades, t.f.g., é dada por

Page 84: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 14. ANÁLISE DA NATALIDADE E DA FECUNDIDADE 77

t.f.g. =total de nascimentos no grupo x

população feminina (no período fértil) no grupo x.

O Ix é o ponto médio, do grupo x, das idades. Por exemplo, no grupo 15-19, I15 =17.5; no grupo 20-24, I20 = 22.5; no grupo 25-29, I25 = 27.5; no grupo 30-34,I30 = 32.5; no grupo 35-39, I35 = 37.5; no grupo 40-44, I40 = 42.5; e no grupo 45-49,I45 = 47.5.

Nota 14.0.9 O valor de M I de referência no mundo varia entre os 26 e 33 anos.

8. Variância da fecundidade

σ2 =

∑49x=15 t.f.g.(Ix −M I)

2∑49x=15 t.f.g.

e o desvio padrão σ é√

σ2.

Nota 14.0.10 Um valor baixo de M I pode ser consequência de um casamento pre-coce. Observando a curva das proporções de mulheres casadas, poder-se-á concluir sese trata de casamento precoce ou se o valor baixo é devido à contracepção (curva defecundidade geral desce rapidamente depois de uma certa idade).

Exemplo 14.0.1 No exemplo da figura 14.1, o casamento é relativamente tardio.Um casamento tardio associado à contracepção origina uma variância baixa. As duascurvas foram ajustadas a 100. As colunas 3 e 5 da tabela da figura 14.2 apresentamos valores já ajustados.

Page 85: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 14. ANÁLISE DA NATALIDADE E DA FECUNDIDADE 78

C urvas de p roporções de m ulh eres casad as e

fecundidade

0

50

100

15-19 20-24 25-29 30-34 35-39 40-44 45-49

Casadas Fecundidade

Figura 14.1: Gráfico das curvas

Grupo de taxa de ajuste a proporção ajuste aidades fecundidade 100 de mulheres 100

geral casadas15-19 0.02197 12 0.0406 520-24 0.16807 93 0.4739 5525-29 0.18008 100 0.7891 9230-34 0.10730 60 0.8511 10035-39 0.05341 30 0.8550 10040-44 0.01880 10 0.8359 9845-49 0.00119 1 0.7973 90

Figura 14.2: Tabela das taxas de fecundidade geral [3]

Page 86: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 15

Análise da nupcialidade

A nupcialidade não é considerada uma variável microdemográfica autêntica, uma vez que asua variação - aumento ou diminuição - não afecta directamente a dinâmica populacional.Intervém na dinâmica populacional através da natalidade.

Muitos autores consideram a nupcialidade como um aspecto particular do estudo danatalidade.

A evolução verificada, a partir do fim da segunda guerra mundial, na nupcialidadedos países desenvolvidos é caracterizada por uma diminuição das taxas brutas e por umaumento do divórcio.

15.1 Taxas de nupcialidadeAs taxas brutas enquanto medidas elementares de análise são as seguintes:

1. Taxa bruta de nupcialidade

Esta taxa mede o nível de nupcialidade e é dada por

t.b.nup.=total de casamentos observados num período

população média desse período× 1000

O período normalmente usado é de um ano.A taxa bruta de nupcialidade também pode ser considerada (tal como a mortalidadee a natalidade) como o resultado da interacção entre o modelo do fenómeno e a estru-tura por idades. No entanto, aqui haveria que distinguir entre primeiro casamento,segundo casamento, casamento de solteiros, de viúvos e divorciados... A análise seriamuito complexa!Tomemos em consideração apenas o seguinte:

(a) o modelo da nupcialidade é muito semlhante ao da fecundidade - parte de 0 porvolta dos 15 anos, atinge um máximo por volta dos 30 anos e diminui a partirdaí.

79

Page 87: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 15. ANÁLISE DA NUPCIALIDADE 80

A grande diferença em relação à fecundidade é que não se reduz a 0 por voltados 50 anos.

(b) utilizando a lógica das taxas é possível calcular outros indicadores mais sofisti-cados.

2. Taxa de nupcialidade geral

Esta taxa de nupcialidade geral relaciona os casamentos com as pessoas ”casáveis” eé dada por

t.n.g.=número de casamentos

população com + de 15 anos× 1000.

3. Taxa de nupcialidade geral dos solteiros

Esta taxa relaciona os casamentos com as pessoas ”casáveis”, excluindo os viúvos edivorciados.

Nota 15.1.1 Pode ser calculada por sexos.

4. Taxas de nupcialidade por idades ou grupo de idades, e por sexos.

Nota 15.1.2 Relaciona o casamento numa determinada idade (ou grupo de idades)com a população dessa idade (ou desse grupo de idades).

Exemplo 15.1.1 A taxa de nupcialidade do sexo masculino no grupo 25-29 é:

t.n.grupo(masc.)=número de casamentos (25-29) masc.

população (25-29) masc.× 1000.

5. Taxa de nupcialidade por ordem

Tem em conta a ordem do casamento. Assim,

(a) Taxa do primeiro casamento

t.p.c.=número de casamentos de ordem 1

solteiros com + de 15 anos× 1000

Nota 15.1.3 É vulgar calcular esta taxa por grupos de idades e sexos separados.

Exemplo 15.1.2 A taxa do primeiro casamento no grupo 20-24 é

número de casamentos de ordem 1 no grupo 20-24solteiros no grupo 20-24

× 1000;

Page 88: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 15. ANÁLISE DA NUPCIALIDADE 81

(b) Taxa do segundo casamento

t.s.c.=número de casamentos de ordem 2

viúvos + divorciados× 1000.

6. Taxa bruta de divórcio

Esta taxa relaciona o número de divórcios com o total da população,

t.b.div.=número de divórciostotal da população

× 1000

(a) Taxa de divórcio geral

t.d.geral=número de divórcios

população com + 15 anos× 1000

Nota 15.1.4 É vulgar calcular esta taxa por sexos.

(b) Taxa de divórcio dos casados

t.d.casados=número de divórciospopulação casada

× 1000

Nota 15.1.5 É vulgar calcular esta taxa por sexos.

(c) Taxa de divórcio por idades ou grupo de idades

Exemplo 15.1.3 A taxa de divórcio do grupo de 20-24 é

t.d.(20-24)=número de divórcios no grupo 20-24

população no grupo 20-24× 1000

Nota 15.1.6 É vulgar calcular esta taxa por sexos.

(d) Taxa de divórcio por duração de casamento

Exemplo 15.1.4 A taxa de divórcio com 10 anos de duração é dada por

t.d.(10 anos)=número de divórcios com 10 anos

população casada há 10 anos× 1000

Nota 15.1.7 É vulgar calcular esta taxa por sexos.

7. Taxa bruta de viuvez

Esta taxa relaciona o número de viúvos com o total da população e é dada por

t.b.viuvez=número de viúvos

população× 1000.

Page 89: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 15. ANÁLISE DA NUPCIALIDADE 82

15.2 Tábua de nupcialidadeA partir de uma tábua de nupcialidade, é possível estimar a intensidade e o calendário dofenómeno em análise.

Para a construir teremos de ter informação relativa aos casamentos por grupos de idadese às estruturas populacionais por estado civil.

Raciocinando em termos do primeiro casamento e aplicando o princípio da coorte fictí-cia, tudo se passa como na mortalidade, em que imaginamos uma geração que ao percorreras idades da vida, é submetida em cada idade às condições reais de mortalidade observadasnum determinado momento.

No caso do fenómeno da nupcialidade, temos uma geração de solteiros que a partir dos15 anos (idade minimamente significativa) e até aos 50 anos (idade a partir da qual oprimeiro casamento é estatisticamente pouco relevante) irá ser ’submetida’ ao casamento.Assim,

• os óbitos de uma tábua de mortalidade passam a ser os primeiros casamentos de umatábua de nupcialidade;

• os sobreviventes de uma tábua de mortalidade passam a ser os celibatários de umatábua de nupcialidade.

Nota 15.2.1 A diferença principal reside no facto de que na mortalidade, no fim da ge-ração ninguém sobrevive (intensidade =1), enquanto que no caso da nupcialidade existemsempre ’sobreviventes’ ao casamento e que são os celibatários definitivos.

Temos, assim:

5nx = taxa de nupcialidade dos solteiros por grupos deidades quinquenais;

5qx = probabilidade do ’primeiro casamento’ quinquenal

com5qx =

10 5nx

2 + 5 5nx;

5px = probabilidade de sobreviver ao primeiro casamento

com5px = 1− 5qx

ou

5px =Cx+5

Cx

,

em que Cx são os celibatários na idade x e Cx+5 os celibatários na idade x + 5;

5dx = (distribuição de) casamentos entre idades exactas

Page 90: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 15. ANÁLISE DA NUPCIALIDADE 83

com5dx = Cx 5qx

ou5dx = Cx − Cx+5;

Cx = (sobreviventes) celibatários na idade exacta x

comCx+n = Cx − ndx

= Cx − Cx nqx

= Cx(1−n qx)

Cx+n = Cx npx

eC15 = 100000.

A intensidade I é dada por

I =C15 − C50

C15

= 1− C50

C15

e I × 100% é a percentagem da população que casa entre os 15 e os 50 anos.O celibato definitivo é dado por:

CD =C50

C15

ouCD = 1− I

e CD × 100% é a percentagem da população que fica celibatária.

A idade média, X, no primeiro casamento:

X =I15 5d15 + I20 5d20 + I25 5d25 + ... + I45 5d45

5d15 + 5d20 + 5d25 + ... + 5d45

com I15 = 17.5, I20 = 22.5, ..., I45 = 47.5Quando não existe informação relativa ao estado civil, é possível estimar a idade média

no primeiro casamento, X, a intensidade, I, e o celibato definitivo, CD, utilizando apenasas estruturas da população - só será preciso o estado civil das pessoas, por sexos e gruposde idades. Assim,

Page 91: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 15. ANÁLISE DA NUPCIALIDADE 84

1. o celibato definitivo é estimado por:

CD = T50 =5T45 +5 T50

2

em que 5Tx é a proporção de celibatários no grupo x - x + 5;

2. a intensidade é estimada por:I = 1− T50;

3. A idade média no casamento é estimada por:

X = 15 +5∑45

x=15 5Tx − 35 T50

1− T50

em que o somatório é calculado de grupo em grupo.

Page 92: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Capítulo 16

Análise dos movimentos migratórios

Além dos movimentos naturais existem outros movimentos de natureza diferente, conheci-dos por movimentos migratórios e que abrangem as três situações seguintes:

a emigraçãoa imigraçãoas migrações internas

A variação destes movimentos no tempo e no espaço depende de factores socio-económicoscomplexos internos e externos.

Existem métodos directos e indirectos para analisar os movimentos migratórios.

16.1 Métodos directos de análiseOs métodos directos são aqueles que utilizam directamente os dados disponíveis e sãobaseados no cálculo das seguintes taxas:

1. Taxa bruta de emigração:

t.b.emig.=número de emigrantes oficiais

população× 1000;

2. Taxa bruta de imigração:

t.b.imig.=número de imigrantes oficiais

população× 1000;

3. Taxa bruta de migração total:

t.b.mig.total=emigrantes oficiais + imigrantes oficiais

população× 1000.

O cálculo destas taxas é baseado normalmente no período de um ano. A populaçãorefere-se à população média num determinado período (ano).

85

Page 93: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 16. ANÁLISE DOS MOVIMENTOS MIGRATÓRIOS 86

16.2 Métodos indirectos de análiseOs métodos indirectos são baseados na equação da concordância (ver no Capítulo 12 sobrea Qualidade dos dados).

Só através da equação de concordância é possível conhecer valores (aproximados) dasmigrações internas e da emigração clandestina. Como

Px+n = Px + N −O + I −E,

tem-sePx+n − Px = N − O + I − E

onde o Px+n − Px representa o crescimento entre recenseamentos, N − O o cresci-mentos natural e I − E o crescimentos (saldo) migratório total.

Assim,

crescimento migratório total = crescimento entre recenseamentos –- crescimento natural.

Nota 16.2.1 Quando o movimento (crescimento) migratório total é muito superior (emtermos absolutos) ao valor obtido pela diferença (imigrantes oficiais - emigrantes oficiais)estamos perante valores elevados de migração interna e clandestinidade.

Para estimar o peso da clandestinidade é usual usar uma ponderação (que se aplica àsdiversas regiões num determinado período) que se calcula a nível do país, num determinadoperíodo. O período normalmente considerado é de 10 anos. O peso da clandestinidade variamais no tempo do que no espaço. Assim,

ponderação (a nível do país)=emigrantes clandestinos num períodoemigrantes oficiais no mesmo período

Calcula-se então o número de emigrantes clandestinos multiplicando o número de emi-grantes oficiais pela ponderação.

O número real de emigrantes é:

n.r.emig. = número de emigrantes oficiais + número de emigrantesclandestinos.

Finalmente, o saldo migratório interno é:

s.m.inter.=saldo migratório total - saldo migratório externo

em que o saldo migratório total é obtido pela equação da concordância, e o saldo migra-tório externo pode ser visto como o número de imigrantes oficiais menos o número realde emigrantes.

A partir do número real de emigrantes calcula-se

Page 94: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

CAPÍTULO 16. ANÁLISE DOS MOVIMENTOS MIGRATÓRIOS 87

i) a taxa bruta de emigração real

t.b.emig.(real)=número real de emigrantes

população× 1000

ii) a taxa bruta de migração externa líquida

t.b.mig.ext.liq.=t.b.imig. - t.b.emi.(real)

comt.b.imig. =

número de imigrantes oficiaispopulação

× 1000

iii) a taxa bruta de migração interna líquida

t.b.mig.int.liq.=saldo migratório interno

população× 1000

iv) a taxa bruta de migração total líquida

t.b.mig.total liq.=t.b.mig.ext.liq. - t.b.mig.int.liq

Page 95: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Parte IV

Exercícios

88

Page 96: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

89

AbreviaçõesAo longo dos próximos exercícios foram usadas as seguintes abreviações:

GI Grupo de IdadesEM Efectivos MasculinosEF Efectivos FemininosCF Casados FemininosFM Falecidos MasculinosFF Falecidos FemininosNM Nascimentos MasculinosNF Nascimentos FemininosIME Idade Média dos EfectivosN NascimentosO ÓbitosI ImigrantesEf EfectivosId IdadeP PopulaçãoV VivosM MortalidadePMIG Ponto Médio da Idade dos GruposC CasamentosR RecenseamentosNU NupcialidadeProb ProbabilidadeDI DistribuiçãoF FemininosMa MasculinosProp Proporçõesr.m. Relação de Masculinidader.r. Relação de Regularidade

Page 97: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

90

1. A figura que se segue representa um mapa da freguesia do Forno da cidade de Âncora.

Use a tabela de números aleatórios para seleccionar uma amostra aleatória de 10 blo-cos habitacionais desta freguesia. (Nota: cada bloco tem um número de identificaçãono mapa).

Page 98: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

91

2. A seguinte tabela apresenta o número de casamentos ocorridos numa dada freguesia,ao longo de cinco anos

1900 1901 1902 1903 1904Jan 64 64 62 66 54Fev 62 70 65 72 68Mar 50 51 45 50 41Abr 54 50 48 45 40Mai 84 82 80 89 75Jun 90 85 95 84 80Jul 42 40 38 35 40Ago 35 30 31 32 40Set 30 25 35 30 25Out 71 75 80 70 71Nov 75 80 71 75 70Dez 40 42 45 40 35

Calcule os índices sazonais pelo método das médias mensais. Interprete o resultado.

3. Os nascimentos registados numa freguesia de Trás-os-Montes, ao longo de quatroanos consecutivos foram os seguintes:

1990 1991 1992 1993Janeiro 7 8 6 7

Fevereiro 17 15 17 14Março 11 10 12 10Abril 10 9 8 7Maio 19 20 17 15Junho 15 12 11 10Julho 8 6 6 5Agosto 5 5 4 5

Setembro 6 7 7 5Outubro 6 6 7 7

Novembro 7 8 7 8Dezembro 8 7 9 9

Calcule os índices sazonais e interprete o movimento sazonal nos anos de 1990 a 1993.

4. Foram registados os valores das taxas brutas de mortalidade infantil de uma freguesia

Page 99: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

92

ao longo de vinte décadas (1800 a 1990):

1800-09 72 1850-59 41 1900-09 52 1950-59 451810-19 77 1860-69 54 1910-19 46 1960-69 151820-29 71 1870-79 47 1920-29 55 1970-79 111830-39 59 1880-89 50 1930-39 47 1980-89 91840-49 62 1890-99 67 1940-49 40 1990-97 5

Estudar a tendência, usando o método das médias móveis baseado num período decinco décadas.

5. As taxas brutas de mortalidade infantil masculina ao longo de seis décadas (1770 a1820) de uma região do Alentejo são as seguintes:

1770-79 1780-89 1790-99 1800-09 1810-19 1820-2973 81 75 61 70 35

Estudar a tendência usando o método analítico.

Qual terá sido a taxa de mortalidade infantil masculina na década de 1760-1769?

6. Em meados do século XX, foram registados os seguintes valores da região da cidadede Marinhas:

Freguesias Maró S. Pedro Luz Nora Cruz VelhaEM 31 40 35 51 36EF 45 51 41 42 52NM 7 8 7 10 9NF 7 6 8 8 9IME 30 31 33 31 35

(a) Calcule a idade média dos habitantes da cidade

(b) Calcule a relação de masculinidade dos habitantes da cidade

(c) Calcule a relação de masculinidade dos nascimentos. Aprecie a qualidade doregisto dos nascimentos, calculando o intervalo (de variação) de confiança a95% de probabilidade.

Page 100: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

93

7. Numa freguesia da Beira Alta foram registados, em 1910, os seguintes efectivos

GI EM EF CF FM FF0 91 95 5 3

1-4 64 67 1 15-9 57 59 1 1

10-14 54 56 0 115-19 40 44 8 0 020-24 39 42 35 2 025-29 38 44 36 1 130-34 46 40 38 1 035-39 34 37 33 0 040-44 23 34 29 1 145-49 22 39 30 1 050-54 19 29 23 0 055-59 9 17 12 0 060-64 8 15 10 1 065-69 7 12 9 1 070-74 5 9 5 0 175-79 3 6 3 0 180-84 2 3 1 1 085-89 1 1 0 1 0

(a) Calcular a percentagem de mulheres não casadas com 40 ou mais anos.

(b) Comparar a percentagem da alínea anterior com a percentagem de mulheres nãocasadas da freguesia.

(c) Calcular a mediana das idades dos efectivos da freguesia. Interpretar.

(d) Calcular a média das idades de todos os efectivos.

(e) Qual é o tipo da distribuição das idades, relativamente à sua simetria?

(f) Calcule a taxa de crescimento da população da freguesia, pressupondo um cres-cimento contínuo e sabendo que em 1990 havia 1553 efectivos.

(g) Considerando a mesma taxa da alínea anterior qual terá sido a população dafreguesia em 1810.

(h) Considerando, agora, os seguintes grupos funcionais 0-14, 15-64 e 65 e + anos,calcule a percentagem de activos do sexo masculino da freguesia em 1910 e oíndice de vitalidade masculina.

(i) Considerando os mesmos grupos da alínea anterior calcule o racio de depen-dência total dos efectivos do sexo masculino e o ratio de dependência total dosefectivos do sexo feminino. Interprete.

Page 101: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

94

(j) Calcule a taxa bruta de mortalidade geral.

(k) Calcule a taxa bruta de mortalidade como resultante da interacção entre o mo-delo e a estrutura.

(l) Aprecie a qualidade dos dados, calculando o índice combinado das Nações Uni-das.

(m) Calcule a taxa de mortalidade infantil clássica.

(n) Do total de óbitos com menos de um ano, 4 ocorreram antes dos 28 dias. Calculeas taxas de mortalidade infantil endógena e exógena.

(o) Calcule a taxa de fecundidade geral.

8. A população de um distrito era em 1900 de 723012 habitantes. Em 1990 foramrecenseados 731050 habitantes. Qual é a taxa de crescimento verificada neste períodode 90 anos, supondo um crescimento geométrico?

Supondo que o ritmo de crescimento verificado no século XIX foi igual ao do séculoXX, qual teria sido a populaçao em 1850?

9. Observe os seguintes dados respeitantes aos nascimentos:

Distrito 1930 1949 1960H M H M H M

Porto 13510 12881 16623 15453 18145 17082Lisboa 10931 10392 10720 9500 12890 12095Horta 581 546 643 606 475 432

Considerando os três distritos separadamente, e por anos, aprecie a qualidade dosdados através da relação de masculinidade, calculando também quando necessáriointervalos de confiança.

Page 102: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

95

10. No período de 1910 a 1990 numa certa região, verificaram-se movimentos naturais emigratórios, dos quais só existem os seguintes registos:

1910 1920 1930 1940 1950 1960 1970 1980 1990N 46 35 40 51 60 53 42 35 25O 20 40 35 50 40 33 25 20 15I 2 4 3 4 1 3 2 4 10Ef 941 930 935 920 942 944 946 948 950

(a) Verifique se existe alguma correlação entre os nascimentos e os óbitos naquelaregião e ao longo do período registado. Se existe, de que tipo é?

(b) Usando a equação da concordância estime o número de emigrantes desse períodode 80 anos.

11. Aprecie a qualidade dos dados relativamente à atracção por valores terminados em 0e 5 no registo das idades dos efectivos da freguesias de Botafogo, calculando o índicede Whipple.

Id Id Id Id Id Id0 e 1 30 14 16 27 15 40 15 53 5 66 4

2 26 15 12 28 19 41 7 54 8 67 33 25 16 12 29 13 42 8 55 9 68 44 23 17 14 30 20 43 7 56 4 69 35 15 18 16 31 9 44 6 57 3 70 56 20 19 18 32 8 45 16 58 7 71 27 13 20 23 33 13 46 8 59 8 72 28 15 21 19 34 11 47 6 60 12 73 49 16 22 15 35 17 48 5 61 5 74 110 22 23 13 36 11 49 6 62 4 75 e + 1011 23 24 12 37 10 50 10 63 912 17 25 25 38 14 51 5 64 413 18 26 13 39 14 52 4 65 7

Page 103: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

96

12. A repartição da população de um distrito por idade e por sexo é a seguinte:

Id H M Id H M Id H M Id H M0 e 1 60 41 21 7 14 41 4 6 61 1 1

2 33 19 22 23 16 42 13 11 62 3 43 20 19 23 10 11 43 6 6 63 2 -4 14 14 24 23 27 44 8 10 64 1 15 28 14 25 14 15 45 12 10 65 6 16 24 23 26 25 15 46 26 9 66 2 67 23 27 27 11 5 47 - 6 67 2 28 28 26 28 19 16 48 20 13 68 2 29 23 18 29 2 5 49 5 4 69 1 -10 25 24 30 45 53 50 46 43 70 e + 17 2211 18 18 31 6 7 51 - -12 32 33 32 12 15 52 4 313 20 16 33 12 12 53 1 314 27 21 34 10 17 54 2 815 22 18 35 13 13 55 4 916 23 33 36 26 16 56 6 417 16 14 37 4 4 57 2 418 26 27 38 12 12 58 5 419 13 18 39 7 3 59 2 120 30 50 40 66 59 60 42 41 Total: 1097 1042

(a) Construa a pirâmide de idades usando grupos quinquenais.

(b) Aprecie a qualidade dos dados relativamente à atracção por valores terminadosem 0 e 5 nestes registos, calculando os índices de Whipple por sexo.

(c) Estude a atracção por valores terminados em 0 usando o índice de irregularidade.

13. Num determinado recenseamento a população masculina de 23 a 62 anos é de 1774524e a feminina é de 2024972.

A população registada com 25, 30, 35, 40, 45, 50, 55 e 60 anos é de 364498 para apopulação masculina e de 412637 para a população feminina.

Calcule os índices de Whipple para os dois sexos e conclua sobre a qualidade dosdados.

Page 104: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

97

14. Considere os seguintes dados por grupos de idades:

GI EM EF r.m. |Dif.Suc.| r.r. |r.r.-100| r.r. |r.r.-100|

×100Ma Ma F F

0-4 388898 380729 – – – – –5-9 387764 374444

10-14 329901 31636615-19 338290 34448920-24 303461 32217425-29 247252 28787930-34 202688 23909235-39 189979 22007840-44 172401 20496445-49 150846 18102650-54 143997 17383355-59 117213 14165260-64 101940 12817965-69 71878 94306 – – – – –70 e + 109368 160796 – – – – – –Total 3255876 3570007/12

Calcule o índice combinado das Nações Unidas. Que conclusões tira sobre a qualidadedos dados?

15. No período 1951-1960, no nosso país, houve 2075500 nascimentos, 948705 óbitos,353534 emigrantes oficiais e 15448 imigrantes. De França veio a seguinte informação:9870 emigrantes clandestinos.

A população em 1950 era de 8441312 e em 1960 de 8889392.

Também se registou um saldo migratório com as colónias de I − E = −112482.

Conclua sobre a qualidade dos dados através da equação da concordância.

16. Construa a tábua de mortalidade a partir da repartição da população indicada nafigura 16.1, por grupos de idades.

Page 105: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

98

Pop

ulaç

ãoÓ

bito

sTax

ade

Quo

cien

tede

Pro

babi

lida

deSo

brev

iven

tes

Dis

trib

uiçã

oN

úmer

ode

Pro

babi

lida

deTot

alde

anos

Esp

eran

çade

mor

talida

dem

orta

lida

dede

naid

adex

dos

óbit

osan

osvi

vido

sde

depoi

sda

idad

ex

vida

nm

xnq x

sobr

eviv

ênci

as x

+n

nd x

nN

xso

brev

ivên

cia

Tx

e xnp x

nP

x

017

4855

1927

71-

471

4859

9426

5-9

7986

7815

2810

-14

7996

9392

815

-19

8109

6415

5120

-24

7617

0322

7925

-29

6812

8622

5630

-34

5410

9919

0535

-39

5673

3323

0140

-44

5247

3727

2145

-49

4600

4131

4850

-54

3905

6636

2855

-59

3317

7744

1260

-64

2944

3959

8565

-69

2299

7674

0870

e+

3565

3934

162

Figura 16.1: Tábua de mortalidade

Page 106: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

99

17. São conhecidos os seguintes dados, relativos a 1960, numa região da Europa:

Id N V P F O Taxamãe média F M

5mx

Total Legítimos Total Casada15-19 736 564 29440 1178 49020-24 4788 4750 23940 11970 41425-29 5467 5356 27335 22779 49830-34 3218 3101 22526 19252 43535-39 1307 1290 23526 20007 48540-44 546 540 27300 21050 60745-49 123 119 24600 18223 601Total 16185 15720 178667 114459

A população média é de 720025.

(a) Calcule a taxa bruta de natalidade;(b) Calcule a taxa de fecundidade geral;(c) Calcule a taxa de fecundidade legítima;(d) Calcule a taxa de fecundidade ilegítima;(e) Verifique se foram correctamente calculadas as taxas das duas primeiras alíneas;(f) Calcule as taxas de fecundidade geral e as taxas de fecundidade legítima por

grupos de idades;(g) Calcule a descendência média e as taxas bruta e líquida de reprodução. Inter-

prete os resultados obtidos;

Id t.f.g. t.f.l. Quociente Prob. t.f.g.×mãe M (5qx) sobrevivência 5px

5px

15-1920-2425-2930-3435-3940-4445-49Total

(h) Calcule a idade média da fecundidade, Mx, a variância, σ2, e as proporçõesde mulheres casadas. Ajuste estas proporções a 100 bem como as taxas defecundidade geral. Represente graficamente e comente os resultados.

Page 107: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

100

Id t.f.g. PMIG t.f.g.×Ix Ix −M I

(Ix −M I

)2 t.f.g.mãe ×

x− ... Ix

(Ix −M I

)2

15-19 17.520-24 22.525-29 27.530-34 32.535-39 37.540-44 42.545-49 47.5Total - - -

Id P F Prop F Ajuste a Ajustemãe média casadas 100 das a 100 das

Total Casada Prop. t.f.g.15-19 29440 117820-24 23940 1197025-29 27335 2277930-34 22526 1925235-39 23526 2000740-44 27300 2105045-49 24600 18223

100

50

15-19 20-24 25-29 30-34 35-39 40-44 45-49 GI

18. Dispomos dos seguintes dados, relativos ao período de 1929-1932, numa região de

Page 108: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

101

Portugal:

GI C solteiros R solteiros Taxas NU Taxas NU1929-1932 de 1930 Ma FMa F Ma F 5nx 5nx

15-19 149 797 32880 3253020-24 1967 2050 25308 2266725-29 1391 878 10872 1130530-34 384 249 4848 645135-39 128 97 3136 457640-44 69 47 2135 359945-49 31 21 1667 309150 e + 37 17 5343 10871Total

A população masculina total é de 326579.

A população feminina total é de 357001.

(a) Calcule a taxa bruta de nupcialidade;

(b) Calcule a taxa de nupcialidade geral (dos solteiros);

(c) Calcule as taxas de nupcialidade por grupos de idades e por sexos;

(d) Calcule as tábuas de nupcialidade para ambos os sexos;

GI Prob Prob Sobreviventes DI de CMa do 1oC sobreviver na idade x entre idades

ao 1oC5qx 5px Cx 5dx

15-19 10000020-2425-2930-3435-3940-4445-5950 e +

Page 109: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

102

GI Prob Prob Sobreviventes DI de CF do 1oC sobrevivier na idade x entre idades

ao 1oC5qx 5px Cx 5dx

15-19 10000020-2425-2930-3435-3940-4445-5950 e +

Page 110: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

103

(e) Calcule o celibato definitivo (CD), a intensidade do casamento (I) e a idademédia no primeiro casamento (X) para ambos os sexos.

Grupo DI de C PMIG 5dx × Ix DI de C PMIG 5dx × Ix

de entre idades entre idades

idades 5dx 5dx

x− ... Ma Ix Ma F Ix F15-19 17.5 17.520-24 22.5 22.525-29 27.5 27.530-34 32.5 32.535-39 27.5 37.540-44 42.5 32.545-49 47.5 47.5Total - -

19. São conhecidos os seguintes dados numa determinada região de Portugal:

População em 1960 276895População em 1970 205197Nascimentos entre 1961-1970 (10 anos) 41053Óbitos entre 1961-1970 (10 anos) 25760Emigrantes entre 1961-1970 (10 anos) 9009Imigrnates entre 1961-1970 (10 anos) 18Emigrantes oficiais a nível do país entre 1961-1970 681004Emigrantes clandestinos a nível do país entre 1961-1970 517385

Os emigrantes clandestinos a nível do país foram calculados pela equação da concor-dância, uma vez que no país não existem migrações internas.

(a) Calcule a taxa bruta de emigração;(b) Calcule a taxa bruta de imigração;(c) Calcule a taxa bruta de migração total;(d) Através da equação da concordância calcule o saldo (movimento) migratório

total. Compare com os dados oficiais. Interprete os reultados;(e) Estime o número real de emigrantes (=oficiais+clandestinos);(f) Calcule o saldo migratório externo;(g) Calcule o saldo migratório interno;(h) Calcule a taxa bruta de emigração real;(i) Calcule a taxa bruta de migração externa líquida;(j) Calcule a taxa bruta de migração interna líquida.

Page 111: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

104

Anexo

Page 112: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Tabela de números aleatórios

Linha101 19223 95034 05756 28713 96409 12531 42544 82853102 73676 47150 99400 01927 27754 42648 82425 36290103 45467 71709 77558 00095 32863 29485 82226 90056104 52711 38889 93074 60227 40011 85848 48767 52573105 95592 94007 69971 91481 60779 53791 17297 59335106 68417 35013 15529 72765 85089 57067 50211 47487107 82739 57890 20807 47511 81676 55300 94383 14893108 60940 72024 17868 24943 61790 90656 87964 18883109 36009 19365 15412 39638 85453 46816 83485 41979110 38448 48789 18338 24697 39364 42006 76688 08708111 81486 69487 60513 09297 00412 71238 27649 39950112 59636 88804 04634 71197 19352 73089 84898 45785113 62568 70206 40325 03699 71080 22553 11486 11776114 45149 32992 75730 66280 03819 56202 02938 70915115 61041 77684 94322 24709 73698 14526 31893 32592116 14459 26056 31424 80371 65103 62253 50490 61181117 38167 98532 62183 70632 23417 26185 41448 75532118 73190 32533 04470 29669 84407 90785 65956 86382119 95857 07118 87664 92099 58806 66979 98624 84826120 35476 55972 39421 65850 04266 35435 43742 11937

105

Page 113: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

TABELA DE NÚMEROS ALEATÓRIOS 106

Linha121 71487 09984 29077 14863 61683 47052 62224 51025122 13873 81598 95052 90908 73592 75186 87136 95761123 54580 81507 27102 56027 55892 33063 41842 81868124 71035 09001 43367 49497 72719 96758 27611 91596125 96746 12149 37823 71868 18442 35119 62103 39244126 96927 19931 36089 74192 77567 88741 48409 41903127 43909 99477 25330 64359 40085 16925 85117 36071128 15689 14227 06565 14374 13352 49367 81982 87209129 36759 58984 68288 22913 18638 54303 00795 08727130 69051 64817 87174 09517 84534 06489 87201 97245131 05007 16632 81194 14873 04197 85576 45195 96565132 68732 55259 84292 08796 43165 93739 31685 97150133 45740 41807 65561 33302 07051 93623 18132 09547134 27816 78416 18329 21337 35213 37741 04312 68508135 66925 55658 39100 78458 11206 19876 87151 31260136 08421 44753 77377 28744 75592 08563 79140 92454137 53645 66812 61421 47836 12609 15373 98481 14592138 66831 68908 40772 21558 47781 33586 79177 06928139 55588 99404 70708 41098 43563 56934 48394 51719140 12975 13258 13048 45144 72321 81940 00360 02428141 96767 35964 23822 96012 94591 65194 50842 53372142 72829 50232 97892 63408 77919 44575 14870 04178143 88565 42628 17797 49376 61762 16953 88604 12724144 62964 88145 83083 69453 46109 59505 69680 00900145 19687 12633 57857 95806 09931 02150 43163 58636146 37609 59057 66967 83401 60705 02384 90597 93600147 54873 86278 88737 74351 47500 84552 19909 67181148 00694 05977 19664 65441 20903 62371 22725 53340149 71546 05233 53946 68743 72460 27601 45403 88692150 07511 88915 41267 16853 84569 79367 32337 03316151 0380. 29341 29264 80198 12371 13121 54969 43912152 77320 35030 77519 41109 98296 18984 60869 12349153 07886 56866 39648 69290 03600 05376 58958 22720154 87065 74133 21117 70595 22791 67306 28420 52067155 42090 09628 54035 93879 98441 04606 27381 82637156 55494 67690 88131 81800 11188 28552 25752 21953157 16698 30406 96587 65985 07165 50148 16201 86792158 16297 07626 68683 45335 34377 72941 41764 77038159 22897 17467 17638 70043 36243 13008 83993 22869160 98163 45944 34210 64158 76971 27689 82926 75957

Page 114: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

TABELA DE NÚMEROS ALEATÓRIOS 107

Linha161 43400 25831 06283 22138 16043 15706 73345 26238162 97341 46254 88153 62336 21112 35574 99271 45297163 64578 67197 28310 90341 37531 63890 52630 76315164 11022 79124 49525 63078 17229 32165 01343 21394165 81232 43939 23840 05995 84589 06788 76358 26622166 36843 84798 51167 44728 20554 55538 27647 32708167 84329 80081 69516 78934 14293 92478 16479 26974168 27788 85789 41592 74472 96773 27090 24954 41474169 99224 00850 43737 75202 44753 63236 14260 73686170 38075 73239 52555 46342 13365 02182 30443 53229171 87368 49451 53771 48343 51236 18522 73670 23212172 40512 00681 44282 47178 08139 78693 34715 75606173 81636 57578 54286 27216 58758 80358 84115 84568174 26411 94292 06340 97762 37033 85968 94165 46514175 80011 09937 57195 33906 94831 10056 42211 65491176 92813 87503 63494 71379 76550 45984 05481 50830177 70348 72871 63419 57363 29685 43090 18763 31714178 24005 52114 26224 39078 80798 15220 43186 00976179 85063 55810 10470 08029 30025 29734 61181 72090180 11532 73186 92541 06915 72954 10167 12142 26492181 59618 03914 05208 84088 20426 39004 84582 87317182 92965 50837 39921 84661 82514 81899 24565 60874183 85116 27684 14597 85747 01596 25889 41998 15635184 15106 10411 90221 49377 44569 28185 80959 76355185 03638 31589 07871 25792 85823 55400 56026 12193186 97971 48932 45792 63993 95635 28753 46069 84635187 49345 18305 76213 82390 77412 97401 50650 71755188 87370 88099 89695 87633 76987 85503 26257 51736189 88296 95670 74932 65317 93848 43988 47597 83044190 79485 92200 99401 54473 34336 82796 05457 60343191 40830 24979 23333 37619 56227 95941 59494 86539192 32006 76302 81221 00693 95197 75044 46596 11628193 37569 85187 44692 50706 53161 69027 88389 60313194 56680 79003 23361 67094 15019 63261 24543 52884195 05172 08100 22316 54495 60005 29532 18433 18057196 74782 27005 03894 98038 20627 40307 47317 92759197 85228 93264 61409 03404 09649 55937 60843 66167198 68309 12060 14762 58002 03716 81968 57934 32624199 26461 88346 52430 60906 74216 96263 69296 90107200 42672 67680 42376 95023 82744 03971 96560 55148

Page 115: ESTATÍSTICA - norg.uminho.pt³ria.pdf · Inferencial. A primeira toma indistintamente a população e a amostra com o objectivo de as des-crever. Esta descrição das observações

Bibliografia

[1] M. N. Amorim. Evolução Demográfica de 3 Paróquias no Sul do Pico 1680-1980, vo-lume 35. ICS, U.M., 1992.

[2] B. J. F. Murteira e G. H. J. Black. Estatística Descritiva. Editora McGraw-Hill, 1983.

[3] J. M. Nazareth. Princípios e Métodos de Análise da Demografia Portuguesa. EditorialPresença, 1988.

108