métodos quantitativos eduardo pontual ribeiro ppge - ufrgs treinamento exclusivo brde - 19 a 22 de...
TRANSCRIPT
Métodos Quantitativos
Eduardo Pontual RibeiroPPGE - UFRGS
Treinamento Exclusivo BRDE
- 19 a 22 de agosto de 2002 -
TIPOS DE DADOS E INDICADORES
• Fontes, disponibilidade e confiabilidade dos dados disponíveis.
• Dados em cross-section, séries de tempo e longitudinais.
• Escalas de medida.
CLASSIFICAÇÃO DAS VARIÁVEIS
Variáveis Quantitativas:• Implicam em relações de
mensuração, medida, contagem.
• Exemplos: salário, idade, preço, produção, escolaridade (número de anos na escola).
Variáveis Qualitativas:• Expressam atributos,
qualidades do indivíduo pesquisado.
• Exemplos: estado civil, profissão, escolaridade (fundamental, médio ou superior).
VARIÁVEIS QUALITATIVAS
• Ordinal: é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica.
Exemplo: Escolaridade.
• Nominal: não é possível fazer nenhuma classificação depois das realizações.
Exemplo: Profissão.
VARIÁVEIS QUANTITATIVAS
• Discreta: valores assumem um conjunto finito de valores possíveis.
Exemplo: número de filhos.
• Contínua: valores pertencem a um intervalo dos número Reais.
Exemplo: rendimentos do trabalho.
DISTRIBUIÇÃO DE FREQÜÊNCIA
Verificação do número de realizações do evento dentro da amostra e a sua importância dentro da população.
• Para variáveis discretas: proporção em relação à característica.
• Para variáveis contínuas: proporção em relação a intervalos.
Exemplo: Variáveis DiscretasNúmero de filhos de 2805 mulheres na
RMPA
FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
Número de
Filhos
Freqüência Proporção Porcentagem
0 1819 0,648485 64,8485%
1 732 0,260963 26,0963%
2 209 0,074510 7,4510%
3 41 0,014617 1,4617%
Mais de 3 4 0,001426 0,1426%
Total 2805 1 100%
Exemplo: Variáveis ContínuasRendimentos (em R$) de 2805 mulheres na
RMPASalários Freqüência Proporção Porcentagem
0 – 499 25 0,008913 0,8913%
500 – 999 1014 0,361417 36,1417%
1000 – 1999 840 0,299465 29,9465%
2000 – 3999 508 0,181105 18,1105%
4000 - 6999 296 0,105526 10,5526%
7000 - 9999 78 0,027807 2,7807%
Mais de 10000 44 0,015686 1,5686%
Total 2805 1 100%
FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
GRÁFICOS
• Gráficos para variáveis qualitativas
• Histogramas
• Evolução temporal
GRÁFICOS PARA VARIÁVEIS DISCRETAS
Freqüência Relativa de Número de Filhos
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
freq
üên
cia
0 1 2 3 Mais de 3
FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
GRÁFICOS PARA VARIÁVEIS QUALITATIVAS
Freqüência Relativa de Número de Filhos
66%
26%
7% 1% 0%
0
1
2
3
Mais de 3
HISTOGRAMAS
• Gráfico que relaciona a freqüência de realizações do evento na amostra com o tipo de evento.
• Pode agrupar como rótulos os valores do evento (no caso de variáveis discretas) ou os intervalos onde os eventos se encontram (para variáveis contínuas)
Exemplo: Histograma - Escolaridade
0
50
100
150
200
250
300
350
400
0 a 3 4 a 7 8 a 10 10 a 11 Mais de 11
Anos de Estudo
Fre
qüên
cia
FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
CONSTRUÇÃO DE HISTOGRAMAS NO EXCEL
• Selecione a função “Análise de Dados” no menu “Ferramentas”.
• Na janela que aparece, selecione a opção “Histograma”.
• Na janela que se abre, escolha como “Intervalo de Entrada” os dados de origem do histograma.
• Cuidado para selecionar a opção “Rótulos”, caso o título da coluna de dados tenha sido selecionado.
• Como “Intervalo de Saída”, escolha, de preferência, a opção “Nova Planilha”.
• Na planilha nova que se criou, uma das colunas é denominada “Bloco” e a outra “Freqüência”.
• O gráfico do histograma é gerado ao selecionar os dados da planilha nova criada e desenhar o gráfico de colunas.
• O gráfico gerado desta forma é criado com intervalos eqüidistantes e o rótulo do eixo X se constitui na média do intervalo.
ANÁLISE BIDIMENSIONAL
Considerações sobre duas variáveis em torno do mesmo objeto de análise
CONSIDERAÇÕES PRÉVIAS
• Problema fundamental: como fazer a análise a partir de diferentes combinações de tipos de variáveis. Dada a classificação vista anteriormente, sabemos que, no caso do estudo com duas variáveis, três combinações são possíveis:– duas variáveis qualitativas;– duas variáveis quantitativas;– uma variável qualitativa e a outra quantitativa.
DISTRIBUIÇÕES CONJUNTAS - VARIÁVEIS “EMPREGADA” E “CHEFE
DE FAMÍLIA”Empregada /
Chefe de Família
Empregada Não Empregada Total
Chefe 466 132 598
Não-Chefe 1291 916 2207
Total 1757 1048 2805
FONTE: PNAD, MULHERES ENTRE 25-55 ANOS, RESIDENTES DA REGIÃO METROPOLITANA DE PORTO ALEGRE/RS
FREQÜÊNCIA EM ANÁLISE BIDIMENSIONAL
• Como calcular a freqüência em análise com duas variáveis? Qual o total utilizar? Da coluna? Da linha? Ou o total geral?
• Resposta: depende da análise desejada. A divisão pelo total geral expressa a composição do grupo por ambas características. A divisão pelo total da linha ou da coluna expressa um resultado condicional à observação da linha ou coluna.
Exemplo: “Empregada” e “Chefe de Família” - Análise pelo Total Geral
Empregada /
Chefe de Família
Empregada Não Empregada Total
Chefe 16,613% 4,706% 21,319%
Não-Chefe 46,025% 32,656% 78,681%
Total 62,638% 37,362% 2805
Exemplo: “Empregada” e “Chefe de Família” - Análise pelo Total
da ColunaEmpregada /
Chefe de Família
Empregada Não Empregada Total
Chefe 26,522% 12,595% 21,319%
Não-Chefe 73,478% 87,405% 78,681%
Total 100% 100% 100%
• No exemplo da divisão pelo total geral da tabela de dados, temos que 46% da população total é formada por mulheres empregadas que não são chefes de família.
• Por outro lado, no exemplo da divisão pelos totais das colunas, temos que entre a população empregada, 73,47% dos indivíduos não são chefes de família.
• A diferença na análise está na condição imposta pela divisão do total da coluna: passa a avaliar entre o total de indivíduos empregados.
• Outra informação importante que se pode extrair da divisão por colunas é que, independentemente do fato da pessoa estar empregada ou não, 21,32% da população é formada por mulheres chefes de família.
• A distribuição entre emprego e ser chefe de família é um tanto diferente entre grupos, além das diferenças de tamanhos totais; desta forma, parece existir correlação entre as duas variáveis: o fato da mulher estar empregada parece ser um condicionante importante para que ela seja chefe de família.
Considerações sobre associação entre Variáveis Quantitativas
• O procedimento de cálculo de freqüências entre tabelas pode ser feito normalmente no caso de variáveis quantitativas, desde que se atribuam intervalos que formem as categorias de análise - os chamados intervalos de classes.
• Uma ferramenta importante na análise de variáveis quantitativas é o gráfico de dispersão.
Exemplo: Renda da família e percentual de
gastos com alimentação.
Família Renda Total Gasto em
Alimentação
A 12 7,2
B 16 7,4
C 18 7,0
D 20 6,5
E 28 6,6
F 30 6,7
G 40 6,0
H 48 5,6
I 50 6,0
L 60 5,010
20
30
40
50
60
70
4,5 5,5 6,5 7,5
Gasto com Alimentação
Ren
da T
ota
l
COEFICIENTE DE CORRELAÇÃO
• O coeficiente de correlação busca auferir a direção da relação entre as variáveis, dentro de um intervalo determinado entre -1 e 1.
• O objetivo do intervalo é discriminar a direção e a intensidade da relação: valores próximos de zero indicam ausência de relação entre as variáveis; valores próximos de 1 indicam forte relação positiva; valores próximos de -1 indicam forte relação negativa.
• Fórmula do coeficiente de correlação:
corr(X,Y) = (1/n)[(xi-x)/x][(yi-y)/y]
, onde: x média de X
y média de Y
x desvio padrão de X
y desvio padrão de Y