estatística e probabilidade - matvirtual /...
TRANSCRIPT
Estatística e Probabilidade
Curso: Tecnólogo em Gestão Ambiental Semestre 2012/2
Profª. Me. Valéria Espíndola Lessa
E-mail: [email protected]
1
Introdução
• Quem nunca ouviu a palavra “estatística” referindo-se a um número ou conjunto de números?
– A poluição da água potável no país aumentou em 25%.
– 90,6% dos municípios brasileira informaram a ocorrência frequente e impactante de alguma alteração ambiental (IBGE, 2008);
– Aumentou em 45% as políticas públicas ambientais no país.
2
Exemplo de organização dos dados de uma pesquisa:
3
• A palavra Estatística possui um sentido mais amplo do que apenas números ou coleções de números;
• “É uma ciência e não apenas um ramo da matemática, embora ferramentas da matemática sejam essenciais”. (John Tukey)
Estatística é a ciência que apresenta processos
próprios para coletar, apresentar, analisar e interpretar conjuntos de dados, sejam eles
numéricos ou não, com o objetivo de tomar melhores decisões.
4
Etapas de uma Pesquisa:
5
• Perguntas a serem respondidas no levantamento dos dados:
O quê pesquisar?
Características a serem observadas → Variáveis
(Impactos Ambientais: queimadas, desmatamento, poluição da água, ...)
Quem pesquisar?
Os elementos a serem pesquisados → População (municípios e regiões)
Como pesquisar?
O instrumento de coleta de dados→ Questionário/ Entrevista
6
Principais Instituições de Pesquisas no Brasil
• Oficiais (Públicas):
– IBGE (http://www.ibge.gov.br/home/)
– IPEA (http://www.ipea.gov.br/portal/)
– FEE (http://www.fee.tche.br)
• Não públicas:
– Fundação Getúlio Vargas (http://portal.fgv.br/)
– IBOPE (http://www.ibope.com.br)
– Datafolha (http://datafolha.folha.uol.com.br/)
– Vox Populi (http://www.voxpopuli.com.br)
– Dieese (http://www.dieese.org.br/)
7
FEE – Fundação de Economia e
Estatística
• A FEE é responsável pela elaboração das séries estatísticas do Rio Grande do Sul, incluindo o Sistema de Contas Regionais, e pela realização de estudos e análises sobre a realidade socioeconômica gaúcha.
8
9
FEE – Indicadores do Potencial Poluidor das Indústrias
Exemplo de Tabela baixada:
POTENCIAL POLUIDOR
10
A Estatística é uma ferramenta para o Gestor responder os “porquês” de problemas que podem ser explicados por uma análise de dados;
11
Divisão da Estatística
Estatística
Descritiva
Inferencial
Descreve, organiza e apresenta os dados através
de tabelas, gráficos e medidas.
Analisa os dados para a tomada de decisão. É
alicerçada nos cálculos de probabilidade.
Estabelece conclusões sobre um conjunto de elementos quando se observa somente uma parte deste.
12
O que vamos estudar em Estatística?
1º) Estatística Descritiva:
– Variáveis;
– Tabelas;
– Gráficos;
– Medidas:
• Tendência Central: Média, Moda e Mediana;
• Dispersão: Variância e Desvio padrão.
13
2º) Probabilidade:
– Espaço Amostral;
– Eventos;
– Probabilidade Condicional e Independente;
– Distribuição Normal e Binomial;
14
3º) Estatística Inferencial:
– Métodos e Cálculos de Amostragem;
– Distribuições Amostrais;
– Estimação;
– Teste de Hipóteses;
– Análise de Correlação e Regressão.
15
Noções Iniciais sobre Populações e Amostras
• População : conjunto de elementos para os quais deseja-se investigar uma ou mais características. Pode ser formada por pessoas, domicílios, peças de produção, cobaias, etc.
• Amostra: subconjunto da população.
16
Pesquisa com toda a população
Pesquisa com parte/subconjunto
da população
Censo ou Recenseamento
Pesquisa por Amostragem
17
• Porque fazer Amostragem?
– Economia de tempo;
– Economia de recurso financeiro;
–População muito grande ou infinita;
– Testes destrutivos;
• Quando fazer censo?
–População menor;
–Quando se exige o resultado exato.
Censo
Demográfico 18
19
POPULAÇÃO: todos os
possíveis consumidores
Amostra: um subconjunto dos
consumidores
inferência
amostragemPOPULAÇÃO: todos os
possíveis consumidores
Amostra: um subconjunto dos
consumidores
inferência
amostragem
20
Situações da Estatística aplicada à Gestão Ambiental
• Pesquisas a respeito do tratamento de esgoto do município.
• Pesquisas a respeito do tratamento dos resíduos das empresas da região.
• Pesquisas sobre a qualidade da água potável.
• Pesquisas a respeito da qualidade do solo.
• E o estudo de riscos e impactos ambientais para a avaliação de novos empreendimentos ou ampliação de atividades produtivas.
• Exemplo de Pesquisa – Fonte: SEBRAE http://www.sebrae-rs.com.br/produtos-servicos/publicacoes/pesquisa-gestao-ambiental-nas-
mpes/1400.aspx
21
Estatística Descritiva
22
Tipos de Variáveis
23
Variável Qualitativa
– Nominal: categorias nomeadas (listagem)
• Bairro que reside → Centro, Progresso, Bela vista, ...
• Transporte → carro, ônibus, a pé, ...
• Sexo → feminino, masculino.
– Ordinal: Quando as categorias nomeadas são ordenadas:
• Exemplo: Qualidade do serviço da empresa
(1) Excelente ; (2) Bom; (3) Fraco; (4) Muito fraco.
24
Variável Quantitativa – Discreta: Dados numéricos que apresentam
contagens (Número Naturais: 0,1,2,3,...)
• Número de pessoas;
• Número de Empresas ;
• Número de Lixeiras;
– Contínua: Dados numéricos que apresentam medidas (Números não inteiros)
• Alturas → 1,85 metros
• Salários → R$ 1.500,00
• Horários → 2h30min
• Áreas → 15,6 hectares
25
Classificação das variáveis, exemplos:
a) Universo: Alunos de uma classe
Variável: Cor de cabelos
Variável: Idade
b) Universo: casais residentes em uma cidade
Variável: Números de filhos
Variável: Rua em que residem
c) Universo: Empresa
Variável: Número de peças produzidas por hora
Variável: Diâmetro de cada peça
Variável: Tratamento de resíduos: (1)sim ou (2)não
Qualitativa Nominal
Quantitativa Contínua
Quantitativa Discreta
Qualitativa Nominal
Quantitativa
Discreta
Quantitativa Contínua
26
Qualitativa Ordinal
Exemplo
“Essa pesquisa tem como objetivo geral realizar um levantamento socioeconômico, ambiental e cultural da comunidade que ocupa a bacia hidrográfica do rio do Braço, no município de Joinville (SC), com a finalidade de identificar as percepções ambientais por intermédio de atividades de educação ambiental direcionadas às necessidades identificadas pelos atores sociais em questão.”
Ver o artigo
Fonte: http://periodicos.univille.br/index.php/RSA/article/viewFile/63/99
27
Organização das Variáveis
Variáveis Qualitativas
Tabelas (freqüências ou percentuais)
Gráficos
Variáveis Quantitativas
Tabelas (freqüências ou percentuais)
Gráficos
Medidas de síntese: média, mediana, desvio
padrão
28
Tabelas Estatísticas
• Cabeçalho;
– O que está representado?
– Onde ocorreu?
– Quando ocorreu?
• Corpo; (dados em forma de colunas e linhas)
• Rodapé; (fonte e explicações)
29
• Após a realização da coleta de dados de uma pesquisa é necessário organizar estes dados.
• A primeira forma de organização dos dados é numa tabela de dados brutos.
30
Exemplo:
• Tabela de dados brutos de uma Variável (Idade):
• Rol: É o arranjo dos dados brutos em ordem de freqüências:
31
Exemplo:
Um questionário foi aplicado aos alunos do 2º ano do curso de Estatística da Universidade Estadual de Maringá (UEM) matriculados na disciplina Inferência Estatística. As variáveis que compõem o questionário são:
1) Sexo: com categorias (1) se masculino e (2) se feminino
2)Id: idade em anos
3)Altura: altura em metros e centímetros
4)Peso: peso em quilos
5)Est.Civil: estado civil com categorias (1) se solteiro, (2) se casado e (3) se separado
6)Nºir.: número de irmãos
32
7) Transp.: meio de transporte mais utilizado com categorias (1) de coletivo e (2) se próprio
8) Procedência: município de procedência com categorias (1) se Maringá, (2) se outro município do Paraná e (3) se de outro Estado
9) Trabalho: relação do trabalho com o curso com categorias (1) não trabalho, (2) completamente relacionado, (3) parcialmente relacionado e (4) não relacionado
10) Inform: meio de informação mais utilizado com
categorias (1) se TV, (2) jornal, (3) rádio, (4) revista e (5) internet
11) Disc.: número de disciplinas reprovadas no 1º ano da faculdade.
33
34
Tabela de Distribuição de Frequências - Uma Variável -
• É a forma de organizar certos dados para a melhor interpretação destes. A tabela simples a seguir organiza a frequência de ocorrência das 3 categorias de uma única variável: “município de procedência”:
35
A frequência de ocorrência de um dado pode ser representado de duas formas:
Frequência Absoluta (Fi): é o número de vezes que um valor da variável aparece na pesquisa.
Frequência Relativa (fi): é representado por uma fração, número decimal ou percentual que indica a frequência absoluta em relação ao total da pesquisa.
Frequência Acumulada (fac): é obtido pela soma das freqüências de todos os valores da variável, menores ou iguais ao valor considerado.
36
Município de
Procedência
Nº Alunos(Fi)
Fac Percentual (fi)
Fac(%)
Maringá 12 12 55 55
Outro no Paraná
7 19 32 87
Fora do Paraná
3 22 14 100
Total 22 100
Exemplo:
37
Cálculo da Frequência Relativa
Fórmula: onde
Cálculo da tabela anterior:
100f%f
N
Ff
ii
ii
linhadanúmeroi
amostradaelementosdetotalN
absolutafrequênciaF
relativafrequênciaf
i
i
%1414,0...13636,022
3f
%3232,0...31818,022
7f
%5555,0...5454,022
12f
3
2
1
38
• Tabulação cruzada de duas variáveis: “meio de transporte” e “sexo”.
Tabela de Distribuição de Frequências - Duas Variáveis -
39
• Para a organização de certas variáveis que apresentam uma quantidade grande de valores diferentes ou quando a variação destes valores é baixa, sugere-se agrupá-los em classes (intervalos ou faixas).
Tabela de Distribuição de Frequências - Classes/Intervalos-
40
Cálculo para a organização em classes
1) Escolher ou calcular o número de classes (K) necessárias:
n = número total da amostra
2) Calcular a amplitude total (At) da variável:
nk classes559,422k
)menorvalor()maiorvalor(At
191837At 41
3) Calcular a amplitude (h) de cada classe:
4) Estabelecer os limites das classes:
k
Ath
48,35
19
k
Ath
42
Tomar o número inteiro maior mais próximo
5) Montar a tabela:
Idade Fi fi%
18 |--- 22 11 50
22 |--- 26 6 27,27
26 |--- 30 2 9,09
30 |--- 34 1 4,55
34 |--- 38 2 9,09
Total 22 100
43
• Além de utilizar as tabelas para organizar e resumir um conjunto de dados, os gráficos fornecem um impacto visual alternativo. Os gráficos devem possuir a mesma estrutura das tabelas, porém não necessariamente na mesma ordem: título (cabeçalho ou rodapé); corpo (desenho do gráfico); fonte e explicações.
Gráficos
44
Gráfico de Barras
45
Gráfico de Colunas
46
Gráfico de Colunas Comparativo - com mais variáveis -
47
Gráfico de Setores
48
Cálculo para gráfico de setores
• Para a construção deste tipo de gráfico, sem recurso de software, é necessário calcular o ângulo correspondente a cada categoria e construir os setores com um transferidor. Para isso utiliza-se da proporcionalidade (regra de três):
360º ---- 100%
X ---- 54%
X = 54 . 360 / 100 = 194,4º
49
Gráfico de Linhas
50
Histograma - Para dados agrupados em classes -
51
Polígono de Frequência
• Gráfico de linha para dados agrupados em classes. Na horizontal tem-se os pontos médios das classes e na vertical a frequência absoluta ou relativa. O gráfico é fechado horizontalmente, e para isso é necessário acrescentar uma classe antes e depois das já existentes. Permite comparação entre várias linhas no mesmo gráfico.
52
53
Ogiva – frequência acumulada
54
- Lista de Exercícios 1 -
55
Referências
• http://www.ibge.gov.br/home/presidencia/noticias/noticia_visualiza.php?id_noticia=1286&id_pagina=1 Acesso em 10 de agosto de 2012.
• http://www.sebrae-rs.com.br/produtos-servicos/publicacoes/pesquisa-gestao-ambiental-nas-mpes/1400.aspx
56