prof. ari antonio, me ciências econômicas unemat sinop...

65
ESTATÍSTICA Prof. Ari Antonio, Me Ciências Econômicas Unemat Sinop 2012

Upload: dangquynh

Post on 03-Dec-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

ESTATÍSTICA

Prof. Ari Antonio, Me

Ciências Econômicas

Unemat Sinop 2012

1. Introdução

Concepções de Estatística:

1. Estatísticas – qualquer coleção consistente de dados

numéricos reunidos a fim de fornecer informações;

2.Estatística – atividade humana especializada/metodologia

desenvolvida para a coleta, a classificação, a representação,

a análise e a interpretação de dados quantitativos para

utilização na tomada de decisões.

1.1. Ramos da Estatística

Estatística Descritiva – é a parte da Estatística que procura descrever e analisar um certo fenômeno, através da característica de um conjunto de dados.

Amostragem - ponto de partida (na prática) para todo um Estudo Estatístico

Probabilidade – ramo da Estatística que envolve uma margem de risco ou incerteza num processo de generalização de fenômenos.

Estatística Inferencial (Indutiva) – é a parte da Estatística que se preocupa em tirar conclusões e fazer interpretações dos resultados obtidos.

1.2 - Análises Estatísticas

1.2 - Análises Estatísticas

2. Noções Básicas

2.1 – Justificativa

Na área econômica coletam-se dados para simulação e

previsão.

no planejamento de novas estratégias de produção, vendas,

etc.

A estatística é aplicada na produção para acompanhar a

estabilidade dos processos,através de cartas de

acompanhamento (cartas de controle estatístico de processo).

Os dados referem-se a variáveis, que são classificadas,

em Estatística, como qualitativas, ordinais e quantitativas

2.2 Método Estatístico

Definir o Problema: formulação;

Planejar a coleta dos dados:

- procedimentos: censo ou amostragem;

Coletar os dados: obtenção, reunião e registro;

Apurar os dados: resumo e tabulação;

Apresentar os dados: tabelas e gráficos;

Analisar e interpretar os resultados: conclusões,

cálculo das medidas, números-resumos

( as estatísticas).

2.3 Definições

2.4. Variáveis

2.4.1 -Tipos de Variáveis

Variável Tipo

• Estado: Perfeita ou defeituosa Qualitativa Nominal

• Qualidade: 1a, 2a ou 3a categoria Qualitativa Ordinal

• No de peças defeituosas Quantitativa Discreta

• Diâmetro das peças Quantitativ Contínua

• Altímetro do Avião Quantitativ Contínua

• Índice Pluviométrico de Jan/12 Quantitativa Discreta

2.4.2 - Exercícios Variáveis:

Discreta ou Contínua

2.5 - Apuração de Dados

Os dados são registrados em ficha, com várias

outras informações. Para obter apenas os dados é

preciso fazer uma apuração. A apuração resume-se

a simples contagem. Por exemplo, obter o número

de aparelhos defeituosos e não defeituosos:

Com defeito = 23

Sem defeito = 17

Se a variável é quantitativa, a apuração consiste em

anotar cada valor.

Fontes

Tabela única com diferentes tipos

de dados

Tipos de Dados

Populações Contínuo Discreto Nominal Por Posto

Alunos do 2º grau Idades, pesos nº da classe Menina/menino 2º grau

Automóveis Km/h nº de defeitos p/

carro Cores limpeza

Venda de Imóveis Valor $ nº de ofertas Supervalorizado Alto custo

2.6 - População e Amostra

Entende-se por população (ou Universo estatístico)

o conjunto de elementos que têm, pelo menos, uma

característica em comum. Exemplos:???

Todo subconjunto não vazio e com menor número

de elementos do que a população constitui uma

amostra dessa população.

• ESPAÇO AMOSTRAL: Conjunto dos resultados possíveis de um

experimento aleatório. Ex.: um dado não viciado. {1, 2, 3, 4, 5, 6}

As população podem ser finitas ou infinitas. As

populações finitas muito grandes são consideras

infinitas. Exemplos:???

2.6.1 – Censo e Amostragem

Quando são coletadas informações de toda a população, diz-se que foi feito um recenseamento.

- Censo é o conjunto de dados obtidos através de um recenseamento.

Quando são coletadas informações de apenas parte da população, diz-se que foi feita uma amostragem.

- A amostra é tanto a parte retirada da população para estudo como, também, o conjunto de dados obtidos nessa parte da população.

2.6.2 – Quando o Censo é

mais vantajoso

Quando a população é pequena;

Se o tamanho da amostra é grande em relação

ao da população e o esforço adicional para a

realização do censo for pequeno;

Se houver exigência na precisão completa;

Quando as informações completas sobre a

população já estão disponíveis.

2.6.3 – A Amostragem é

mais vantajosa

A população pode ser infinita, com isto o censo seria impossível;

Se há necessidade de obter informação com rapidez o censo pode consumir muito tempo e perder a utilidade;

Quando os itens são destruídos durante a realização do experimento para obtenção dos dados, o censo destruiria toda a população;

Os custos de um censo podem inviabilizar a realização da pesquisa.

2.7 - Técnicas de Amostragem

Definida a população, é preciso estabelecer a

técnica de amostragem, isto é, o procedimento que

será adotado para escolher os elementos que irão

compor a amostra. Conforme a técnica utilizada,

tem-se um tipo de amostra.

2.7.1. Amostra Casual Simples

É composta por elementos retirados ao acaso da

população. Então todo elemento da população tem

igual probabilidade de ser escolhido para a

amostra.

Técnicas de Amostragem

2.7.2. Amostra Sistemática

Os elementos são escolhidos por um sistema.

Quando a população está organizada, é mais fácil

obter uma amostra sistemática, porém há a

preocupação com o sistema de seleção.

2.7.3. Amostra estratificada

É composta por elementos provenientes de todos

os estratos da população de maneira proporcional,

afim de que a amostra mantenha a característica

da população.

Técnicas de Amostragem

2.7.4. Amostra de Conveniência

É formada por elementos que o pesquisador reuniu

simplesmente porque dispunha deles.

Os estatísticos têm muitas restrições ao uso de

amostras de conveniência; o pesquisador precisará

de muito senso crítico, pois os dados podem ser

tendenciosos.

Quando se trabalha com amostras sempre

pretende-se fazer inferências, isto é, estender os

resultados da amostra a população.

2.8– Abusos da Estatística

Abusos da Estatística

Abusos da Estatística

Abusos da Estatística

3 – Exercícios

1. Cite as fases do método estatístico.

2. Quais os ramos da estatística.

3. Classificar as variáveis como: qualitativa, quantitativa

discreta e quantitativa contínua.

a) Cor dos olhos;

b) Cor do cabelo;

c) Numero de filhos;

d) Numero de computadores;

e) Precipitação pluviométrica;

f) Comprimento de pregos;

g) Produção de algodão;

h) Número de nascimentos;

i) Taxa de crescimento da economia;

j) PIB brasileiro de 2010 ;

3 – Exercícios

4. Em uma escola existem 250 alunos, sendo distribuídos nas salas de aula a seguir:

Calcule através do processo de amostragem proporcional estratificada

quantos alunos de cada sala irão compor a amostra que deve ter

exatamente 40 alunos.

Salas de aula Alunos

1 35

2 32

3 30

4 28

5 35

6 32

7 31

8 27

3 – Exercícios

5. Quando você utilizaria um processo de amostragem

em comparação com um censo?

6. Numa escola existem 280 meninos e 320 meninas.

Escolha uma amostra de 10% do total de alunos

quantos são meninos e quantas são meninas.

6. Lance um dado e uma moeda e construa seu espaço

amostral.

3.2 - Séries de Dados

Causa Freqüência

Acidente 29.601

Abuso 2.604

Suicídio 7.965

Profissional 3.735

Outros 1.959

Ignorada 1.103

Total 46.967

Séries Específicas: varia o

fenômeno, fixos o tempo e a

região.

Tabela 2.3: Casos registrados de

intoxicação humana, segundo a causa

determinante. Brasil, 1993.

Fonte: MS/FIOCRUZ/SINITOX.

Regiões %

Norte 3,9

Nordeste 30,3

Centro-oeste 5,5

Sudeste 42,7

Sul 17,6

Total 100

Séries Geográficas: varia a

região, fixos o tempo e o fenômeno.

Tabela 2.2: Distribuição percentual

da população segundo

regiões,Brasil, 1970.

Fonte: IBGE, Censo Demográfico, Rio

de Janeiro, 1973.

Séries Temporais: varia o tempo, são fixos a região e o fenômeno.

Anos N.º

1970 8.000

1971 7.600

1972 7.200

1973 7.300

1974 7.000

Total 37.100

Fonte: Dados hipotéticos.

Tabela 2.1: Número de casos da

moléstia X, na área Z, 1970/1974.

4. Apresentação de Dados

em Tabelas

Os dados devem ser apresentados em tabelas

construídas de acordo com as normas técnicas

ditadas pela Fundação Instituto Brasileiro de

Geografia e Estatística (IBGE).

4.1. Componentes das Tabelas

As tabelas têm título (explica o que a tabela

contém), o corpo (formado pelas linhas e colunas

dos dados), o cabeçalho (especifica o conteúdo

das colunas) e a coluna indicadora (especifica o

conteúdo das linhas).

Causa Freqüência

Acidente 29.601

Abuso 2.604

Suicídio 7.965

Profissional 3.753

Outras 1.959

Ignorada 1.103

Tabela 4.1: Casos registrados de

intoxicação humana, segundo a

causa determinante. Brasil, 1993.

Fonte: MS/FIOCRUZ/SINITOX.

Co

lu

na

in

dic

ad

ora

Título

Fonte

Cabeçalho

Corpo

•Toda tabela deve ser delimitada por traços

horizontais. Podem ser feitos traços verticais para

separar as colunas, mas não devem ser feitos

traços verticais para delimitar a tabela. O

cabeçalho é separado do corpo por um traço

horizontal.

•As tabelas podem apresentar, além das

freqüências, as freqüências relativas e o total. O

total da coluna é escrito entre dois traços

horizontais.

Causa Freqüência Freqüência Relativa(%)

Acidente 29.601 63,03

Abuso 2.604 5,54

Suicídio 7.965 16,96

Profissional 3.753 7,95

Outras 1.959 4,17

Ignorada 1.103 2,35

Total 46.967 100,00

Tabela 4.2: Casos registrados de intoxicação

humana, segundo a causa determinante. Brasil, 1993.

Fonte: MS/FIOCRUZ/SINITOX.

4.2. Tabelas de Contingência

Os elementos da amostra ou da população são

classificados de acordo com dois fatores, e os

dados devem então ser apresentados em tabelas

de contingência, isto é, tabelas de dupla entrada,

cada entrada relativa a um dos fatores.

As tabelas de contingência podem apresentar

freqüências relativas, além das freqüências.

Veja exemplo:

Ano de

registro

Sexo

Total Masculino Feminino

1984 1 307 758 1 251 280 2 559 038

1985 1 339 059 1 280 545 2 619 604

1986 1 418 050 1 361 203 2 779 259

Tabela 4.3: Nascidos vivos registrados segundo

o ano de registro e o sexo.

Fonte: IBGE (1988).

Nota: Nascimentos ocorridos no ano de registro.

Época do ataque

Condição

Total

Freqüência

relativa de

defeituosos Normal Defeituoso

Até o 3º mês... 36 14 50 28,0%

Depois do 3º mês 51 3 54 5,6%

Tabela 4.4: Recém-nascidos segundo a época do ataque

de rubéola na gestante e a condição de normal ou

defeituoso.

Fonte: HILL et alii (1958).

4.3 - Notação Sigma

• Muitos processos estatísticos exigem o cálculo da

soma de um conjunto de números.

• Σ (sigma) para denotar soma.

• Somar as variáveis x e y com valores 1, 5, 6, 9 e

$ 8,82, $12,01 e $2,10, respectivamente

• Σx = 21 e Σy = $22,93

• Exercícios: Se os valores de x são: 2, 4, 5 e 9,

calcule Σx, Σx² e (Σx²)².

Notação Sigma • Para somar partes dos valores, usam-se índices

• Exemplo: Utilizando os dados

apresentados, calcule

5

1 2 3 4 5

1 1

n

i i

i i

x x x x x x x

2 4 11

1 2 7

; ; ... ...i i i i

i i i

x x x e x

Dados

i xi

1 8

2 2

3 3

4 6

5 7

6 8

7 9

8 4

9 5

10 4

11 1

4.4. Tabelas de Distribuição de Freqüências

• Dados Brutos

• Rol de dados

• Amplitude

• Permite ao leitor, uma visão rápida e global do fenômeno.

•As tabelas de distribuição de freqüências mostram a distribuição da variável, mas perdem em exatidão. Isto porque todos os dados passam a ser representados pelo ponto médio da classe a que pertencem.

•O número de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar. Em geral, convém se estabelecer de 5 a 20 classes. Mas não existe um número “ideal” de classes, embora existam fórmulas para se estabelecer:

k = 1 + 3,3 log N (Sturges).

2,522 3,200 1,900 4,100 4,600 3,400 3,300 2,800

2,720 3,720 3,600 2,400 1,720 3,400 3,250 2,900

3,125 2,800 3,200 2,700 2,750 1,570 2,900 3,200

2,250 2,900 3,300 2,450 4,200 3,800 3,200 2,800

3,220 2,950 2,900 3,400 2,100 2,700 2,480 2,700

3,000 2,480 2,500 2,400 4,450 2,900 2,450 3,150

3,725 3,800 3,600 3,120 2,900 3,700 2,150 3,150

2,890 2,500 2,500 3,400 2,920 2,120 2,500 3,200

3,110 3,550 2,300 3,200 2,720 3,150 2,500 2,700

3,520 3,000 2,950 2,700 2,900 2,400 3,155

3,100 4,100 3,000 3,150 2,000 3,450 3,200

3,200 3,200 3,750 2,800 2,720 3,120 3,900

2,780 3,450 2,480 2,120 2,450 3,300 3,100

Tabela 4.5: Peso de pacotes de adubo, em

quilogramas

Observando os dados da tabela, notamos que o menor

valor é 1,570kg e o maior valor é 4,600kg. Podemos

então definir as classes de 1,5kg a 2,0kg, de 2,0kg a 2,5

kg, ... Com o intervalo de classe de 0,5kg, de acordo

com o esquema:

1,5 Ⱶ 2,0

2,0 Ⱶ 2,5

2,5 Ⱶ 3,0

3,0 Ⱶ 3,5

3,5 Ⱶ 4,0

4,0 Ⱶ 4,5

4,5 Ⱶ 5,0

Numa tabela de distribuição de

freqüências também podem

ser apresentados os pontos

médios de classe, que são

obtidos pela soma dos

extremos da classe, dividida

por 2.

1,5 Ⱶ 2,0 (conta do 1,5 até o 2,0, exceto o 2,0).

Classe Freqüência Ponto Médio

1,5 Ⱶ 2,0 3 1,75

2,0 Ⱶ 2,5 16 2,25

2,5 Ⱶ 3,0 31 2,75

3,0 Ⱶ 3,5 34 3,25

3,5 Ⱶ 4,0 11 3,75

4,0 Ⱶ 4,5 4 4,25

4,5 Ⱶ 5,0 1 4,75

Tabela 4.6: Peso de pacotes , em quilogramas.

•Note, que pelo critério de Sturges, (k = 7,6),

deveriam ter sido construídas 7 ou 8 classes.

•É importante deixar claro que o resultado obtido

por essa fórmula poder ser usado como referência,

mas cabe ao pesquisador determinar o número de

classes que pretende organizar.

•Dica: quando se constrói uma tabela de

distribuição de freqüências, é melhor usar, como

extremos de classes, números fácies de trabalhar.

*

4.5 -Tipos de Frequências

• Frequência Absoluta:

• Frequência Absoluta Acumulada

• Frequência Relativa

• Frequência Relativa Acumulada

i iF f

1

n

i i

i

F f

ii

fFr

n

1

n

i i

i

Fr fr

4.6 - Dados Absolutos e Relativos

• Porcentagem

• Os índices são razões entre duas grandezas tais que

uma não inclui a outra. Ex: demográfico

• Os coeficientes são razões entre o número de

ocorrências e o número total (ocorrências e não

ocorrências). Ex: coeficiente de natalidade

• As taxas são os coeficientes multiplicados por uma

potência de 10 (10, 100, 1000, ...) para tornar o

resultado mais legível. Ex: taxa de mortalidade.

5. Apresentação de Dados em

Gráficos

•Existem normas nacionais para a construção de

gráficos, ditadas pela Fundação IBGE. Assim,

todo gráfico deve apresentar título e escala.

•O título pode ser colocado tanto acima como

abaixo do gráfico.

•As escalas devem crescer da esquerda para a

direita, e de baixo para cima.

•As legendas explicativas devem ser colocadas,

de preferência, à direita do gráfico.

5.1. Gráfico de Barras

•O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais.

•Para fazer um gráfico de barras, primeiro se traça o sistema de eixos cartesianos.

•Depois colocam-se, no eixo das abscissas (ou das ordenadas) as categorias da variável em estudo.

• Em seguida, constroem-se barras retangulares com base no eixo das abscissas (ou das ordenadas) e altura (ou comprimento) igual à freqüência.

Veja exemplo:

Exemplos de Gráficos de Barra

Espécie de clínica Freqüência Freqüência relativa (%)

Médica 6 457 923 32,51

Ginecologia e Obstetrícia 3 918 308 19,73

Cirurgia 3 031 075 15,26

Pediatria 2 943 939 14,82

Outras 3 513 186 17,69

Tabela 5.1: Internações em estabelecimentos de

saúde, por espécie de clínica – 1992.

Fonte: IBGE, Diretoria de Pesquisas, Pesquisa de Assistência Médico-Sanitária.

0 5 10 15 20 25 30 35

Outras

Pediatria

Cirurgia

Ginecologia e Obstetrícia

Clínica Médica

Freqüência Relativa

Gráfico 5.1: Internações em estabelecimentos de

saúde, por espécie de clínica. IBGE 1992.

5.2. Gráfico de Setores

•O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais.

•Para fazer um gráfico de setores, primeiro se traça uma circunferência. Essa circunferência representa o total, ou seja, 100%.

•Dentro dessa circunferência devem ser representadas as categorias da variável em estudo.

• Para isso, toma-se a freqüência relativa de cada categoria e calcula-se o ângulo central (x):

onde f representa a freqüência relativa (%).

Clínica Médica

Ginecologia eObstetrícia

Cirurgia

Pediatria

Outras

Gráfico 5.2: Internações em estabelecimentos de

saúde, por espécie de clínica. IBGE 1992.

5.3. Histograma

•Os dados apresentados em tabelas de

distribuição de freqüências são apresentados

graficamente em histogramas.

•Para construir um histograma, primeiro se

traça o sistema de eixos cartesianos.

•Depois, se os intervalos são iguais, traçam-se

barras retangulares justapostas com bases

iguais, correspondendo aos intervalos de

classe, e com alturas determinadas pelas

respectivas freqüências.

Gráfico 5.3: Peso dos pacotes, em quilogramas.

•Quando os intervalos de classe são diferentes, para

construir um histograma é preciso calcular as

densidades de freqüência relativa.

•Entende-se por densidade de freqüência relativa o

quociente entre a freqüência relativa do intervalo de

classe, isto é:

•Para construir o histograma, desenham-se barras

retangulares. As bases são iguais aos intervalos de

classe, e as alturas são determinadas pelas

respectivas densidades.

Classes Freqüência Freqüência

Relativa

Densidade

90 Ⱶ 100 6 6 0,6

100 Ⱶ 105 11 11 2,2

105 Ⱶ 110 12 12 2,4

110 Ⱶ 115 17 17 3,4

115 Ⱶ 120 18 18 3,6

120 Ⱶ 125 11 11 2,2

125 Ⱶ 130 9 9 1,8

130 Ⱶ 135 6 6 1,2

135 Ⱶ 140 4 4 0,8

140 Ⱶ 150 4 4 0,4

150 Ⱶ 160 1 1 0,1

160 e mais 1 1 0,1

Tabela 5.2: Mulheres com 30 anos de idade

segundo a pressão sangüínea sistólica em

milímetros de mercúrio.

Gráfico 5.4: Mulheres com 30 anos de idade segundo a

pressão sangüínea sistólica, em milímetros de mercúrio.

Pressão sangüínea sistólica

Densid

ade

5.4. Polígono de Freqüências

•Os dados apresentados em tabela de distribuição de

freqüências também podem ser apresentados em

polígonos de freqüências.

•Para fazer esse tipo de gráfico, primeiro se traça o

sistema de eixos cartesianos.

•Depois, se os intervalos de classe são iguais, marcam-se

pontos com abscissas iguais aos pontos médios de

classes e ordenadas iguais às respectivas freqüências.

•Se os intervalos forem diferentes, marcam-se pontos com

abscissas iguais aos pontos médios de classes e

ordenadas iguais às respectivas densidades de freqüência

relativa.

0

5

10

15

20

25

30

35

40

1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25

Fre

ên

cia

Peso ao nascer

Gráfico 5.5: Peso dos pacotes, em quilogramas.

Elaboração de Tabela de

Frequência