manipulaÇÃo de dados medidas. identificar cada elemento na amostra deverá ser identificado. isto...

35
MANIPULAÇÃO DE DADOS Medidas

Upload: internet

Post on 16-Apr-2015

108 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

MANIPULAÇÃO DE DADOS

Medidas

Page 2: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

IDENTIFICAR• Cada elemento na amostra deverá ser

identificado. Isto é particularmente importante para manter anonimato.

• Se os sujeitos foram selecionados aleatoriamente ou designados aleatoriamente, os números usados para o procedimento aleatório podem ser usados.

• Faça uma lista mestra de nomes com números de identificação correspondentes e mantê-la num arquivo seguro no caso de ser necessário mais referências.

Page 3: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Medição adequada

• Para garantir o uso da análise estatística selecionada é importante que o item representando cada variável esteja no nível de medição desejada e apropriada.

• Por exemplo, o pesquisador pode desejar usar o Teste “t”, mas tem dado ordinal. Neste caso, o nível de medição não é apropriado.

Page 4: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Procedimentos de análise

• 1. Atribuir Números às Categorias. • • 2. Inserir dados no Computador.• • 3. Usar Resultados de Estudo Piloto para o

Estabelecimento de Categorias.

Page 5: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Marca ótica

• Utilizada para leitura automática.• Exemplo: cartao resposta de vestibulares.

Page 6: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Escolher análise apropriada

• Checar que cada tipo de análise estatística e resumo de dados produzem dados na forma que você desejar.

Page 7: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

PLANEJAR EDIÇÃO DE DADOS• Vc pode encontras inconsistencias devido:• Sem Resposta (Dados que faltam / perdidos). Vc deve

decidir como manipular possíveis dados perdidos (ou que faltam).

• Respostas Incorretas. • Recomendação. A autora recomenda a omissão de

tais respostas com base em que não podem realmente saber quais as intenções que os entrevistados tinham na realidade.

• Manuscrito Ilegível. • Linguagem Firme e Inventiva. Pode utilizar linguagem

indecente.

Page 8: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Continuação

• Respostas inconsistentes.– Por exemplo, um entrevistado pode checar o

grupo de idade “15-18” e então checar o nível educacional “grau doutoral”. De fato, alguns pesquisadores usam itens semelhantes, estes como escalas “falsas” para determinar se um entrevistado pode estar mentindo e neste caso invalidar o instrumento por inteiro.

Page 9: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Planejar tempo para examinar dados

• Planejar o tempo no qual os dados podem ser completamente examinados para resultados imprevistos. É mais importante que ir direto para suas questões de pesquisa ou hipóteses.

Page 10: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Exemplos • A DEMONSTRAÇÃO O QUE FOI OMITIDO E DEVERÁ SER

INCLUIDO• • 1. Significativamente mais entrevistados 97% dos entrevistados não

usam marca X do que marca Y. usaram marca X ou Y.

• 2. A hipótese de que a fábrica Texas tem Nenhum empregado em qualquer fábrica esteve

• uma elevada taxa de absenteísmo foi ausente mais do que 2 dias por mês.

• 3. Uma proporção maior de pessoas 75% dos entrevistados foram que não trabalham fora de casa mulheres.

• preferiu assistir TV durante o horário do • dia mais do que no começo ou mais • tarde da noite.• • 4. A correlação de 0.09 foi significante O valor é muito baixo.

Page 11: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Descobertas imprevistas

• Uma das maiores razões para examinar os dados é para constatar descobertas imprevistas. Estes são dados que o pesquisador não espera encontrar. No exemplo acima, o pesquisador não antecipa que 97% dos entrevistados não usaram tampouco Marca X ou Marca Y (embora talvez eles deveriam ter).

Page 12: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Exemplos

• Pessoas que concluíram um levantamento sobre a freqüência no cinema pode começar a assistir mais filmes ou pessoas dadas a certas dietas pode começar a necessitar de açúcar.

Page 13: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Gerar novas variáveis

• Exemplo: Por exemplo, itens do questionário incluem medições de variáveis: 1) freqüência de assistência de concertos ou bales; 2) freqüência de comparecimento ao teatro legítimo, e; 3) freqüência de jantar nos restaurantes. Estas variáveis podem ser combinadas para formar uma outra variável chamada “tipo de estilo de vida” .

Page 14: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Distribuição de frequencia

• Primeiro passo para redução de dados. • Definição. Um arranjo de contagens ou

categorias com a freqüência de ocorrência (f) de cada contagem ou categoria indicada.

• Pode se adotar intervalos de classe.

Page 15: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Exemplos • 1.Número de vendas na quinta-feira 3. Exemplo de distribuição de

freqüência com intervalos de classes• Nº de cada venda f Total de vendas Contagem no teste f• 5 12 60 95-99 3• 4 21 84 90-94 5• 3 36 108 85-89 12• 2 23 46 80-84 18• 1 18 18 75-79 23• 0 14 0 70-74 20• 65-69 19• Total 124 316 60-64 15• 55-59 7• 12 pessoas fizeram 5 vendas cada quinta- feira 50-54 5• • Total de pretendentes 127

Page 16: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Medidas de tendencia central

• Definição. Uma medida da média ou contagem típica numa distribuição de contagens. As três medidas de tendência central mais freqüentemente usadas são: 1) a média, a qual requer pelos menos um intervalo no nível de medição; 2) a mediana, a qual requer pelo menos um nível ordinal de medição, e ; 3) a moda, a qual requer pelos menos um nível nominal de medição.

Page 17: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média

• As médias são muito familiares para todos nós porque elas são usadas também freqüentemente por toda nossa vida para relatar contagens médias. Por exemplo, os negociantes freqüentemente relatam suas vendas totais médias, despesas, número de pessoas empregadas e número de unidades vendidas.

Page 18: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média • EXPOSIÇÃO 14.3. O PROCESSO PARA CALCULAR UMA MÉDIA• • 1. Registrar as contagens.• 2. Juntar todas as contagens.• 3. Dividir pelo número total de contagens.• • Fórmula: X = X / N onde: X = a média de uma amostra• X = soma das contagens• N = número de contagens.• • Exemplo: O número de fornos microondas vendido durante 5

dias foi: 10, 9, 15, 6, 10.• X = 50 X = 50 / 5 = 10 ( o número médio de fornos

microondas vendidos por dia).•

Page 19: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média

• A média reflete e é afetada por toda contagem na distribuição, porque toda contagem é usada na soma. Por conseguinte, as contagens extremas afetam a média. Por exemplo: 5 vendedores venderam o seguinte número de lavadoras de pratos: 40, 6, 6, 5, 3. Se a média foi calculada, a conclusão seria que a média das vendas das 5 pessoas foi 12 lavadoras de pratos. Todavia, quatro das cinco pessoas venderam menos do que 7 e uma vendeu 40! A média não é uma medida representativa da tendência central em tais casos.

Page 20: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média • Quando há contagens extremas, também usa-se a

mediana ou, no caso de um conjunto de contagens muito diferentes, descrever as contagens. Por exemplo, no item 2 acima podemos informar que o número mediano de lavadoras de pratos vendidas foi 6, mesmo que uma pessoa vendeu 40. Se há poucas contagens submetidas ao conjunto completo de contagens para melhor entendimento.

• A média é adequada somente para dados ao nível de intervalos ou de razão de medição.

Page 21: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média

• Por conseguinte, a média não pode ser usada quando os dados à nível de intervalo ou de razão tenham sido modificados para ordinal.

Page 22: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Média

• Não obstante estes cuidados, a média é considerada a medida de tendência central mais estável. O fundamento para essa conclusão é que quando diversas amostras são retiradas de uma população, as médias destas amostras serão totalmente similares e diferirão menos do que amostras de medianas ou modas.

Page 23: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Mediana

• Definição. Uma medida de tendência central que é a contagem central num conjunto ordenado de dados que são para o ordinal ou nível de medição mais alto. Com um número impar de contagens, a mediana é o valor central. Para um número igual de contagens, a mediana é a metade entre os dois valores centrais.

Page 24: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Mediana

• O PROCESSO PARA CALCULAR UMA MEDIANA• 1. Registrar as dados em ordem do mais

superior para o mais inferior.• 2. Selecionar o valor central, se há um número

ímpar de contagens.• 3. Se há um número par de contagens, somar

as duas medidas centrais consecutivamente e dividir por 2.

Page 25: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Exemplo • Número Impar de Contagens Número Par de Contagens• 10

15• 7

12• 5

10• 3

8• 2

5•

4• Mediana = 5 Mediana =( 10 + 8) / 2 = 9

Page 26: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Moda • Definição. Uma medida de tendência central cuja contagem

freqüentemente mais aparece numa distribuição de contagens as quais são nominais ou de nível de medição mais alto.

O PROCESSO PARA ESCOLHER UMA MODA• 1. Registrar os dados em ordem do mais superior para o mais

inferior.• 2. Escolher o valor que ocorre mais freqüentemente como a moda.• Exemplo: 15, 15, 15, 9, 8, 8, 1, 1, 1, 1. A moda = 1 a contagem

que ocorre mais freqüentemente.• CUIDADO: Notar que a moda é muito instável. Se as duas

contagens mais inferiores forem omitidas, a moda seria 15 em vez de 1.

Page 27: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Medidas de variabilidade • As medidas de variabilidade são usadas para

avaliar a extensão ou a dispersão de um conjunto de dados. Elas são freqüentemente mais usadas em: 1) análises estatísticas, e; 2) em projetos de pesquisa .

• Definição. Variabilidade: O grau para o qual os dados dentro dos limites de uma distribuição diferem entre si. As medidas de variabilidade mais freqüentemente usadas são o desvio padrão e seu quadrado, a variância. Ambas requerem ao menos um nível de intervalo de medição.

Page 28: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Variância e desvio padrão

• Definição. Variância: Uma medida de variabilidade que é a média dos desvios quadrados da média numa distribuição. A variância é o quadrado do desvio padrão. Símbolos: s2 , 2

• Definição. Desvio Padrão: Uma medida de variabilidade que é a raiz quadrada da variância. Ele indica a média dos desvios dos dados da média de uma distribuição. Símbolos: s ,

Page 29: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Desvio padrão e variância• Fórmulas para Desvio Padrão: = ( X - Xm )2 / N = x2

/ N = N X2 - ( X )2 / N2 *• • Onde: X = soma dos dados X = média• X2 = soma de cada valor ao quadrado N = número de

dados ou observações.• ( X )2 = soma dos valores ao quadrado• x = X - X ou contagem do desvio• • ( * ) Notar que N(N-1) é usado no lugar de N2 quando

calcula-se s, o desvio padrão da amostra.•

Page 30: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Amplitude

• A amplitude é uma simples medida de variabilidade muitas vezes usada para uma rápida observação dos dados.

• Definição. Amplitude: Uma medida de variabilidade que é geralmente calculada pela subtração entre o menor valor e o maior valor.

Page 31: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Tabela de contingencia • Um outro método útil para resumir e examinar os

dados é usar uma tabela de contingência na qual as observações são tabuladas em cruz.

• • Definição. Tabela de Contingência: Uma tabela

que demonstra classificações agrupadas de duas ou mais variáveis, indicando o número de observações em cada uma das classificações agrupadas = células.

• • Definição. Tabulação cruzada: A tabulação do

número total de observações dentro de classificações associadas de duas ou mais variáveis.

Page 32: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Exemplo • EXPOSIÇÃO 14.9. EXEMPLO DE UMA TABELA DE CONTINGÊNCIA• • Bônus Preferenciais• • Dinheiro Férias Total• • Fêmeas 20 10 30• • Machos 20 30 50• • Total 40 40 80• • 20 das 30 fêmeas e 20 dos 50 machos

preferiram dinheiro como um bônus.

Page 33: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Percentagens • A adição de porcentagens às distribuições de freqüência ou às tabelas de

contingência freqüentemente ajuda na interpretação dos dados. Contudo, cuidado deve ser tomado quando porcentagens são usadas.

• 1. Não usar porcentagens com números pequenos. Eles seriam ilusórios.

• Por exemplo:• Número e Percentual de Pessoas• Que Adquiriram Tipos de Feijão • Tipo Número %• Feijão Verde 4 50• Feijão Pinto 2 25• Feijão Kidney 1 12.5• Feijão Wax 1 12.5• Total 8 100Um leitor vê que 25% das pessoas compraram feijão pinto, certamente ilusório

embora considerando que somente 2 pessoas compraram também.

Page 34: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

Pacotes estatísticos• Para usar os pacotes estatísticos multifunção adquira os

manuais dos programas e siga as orientações. Os manuais da maioria dos pacotes dá as orientações explícitas e requerem muito pouca experiência. Uma alternativa é ter uma pessoa com bom conhecimento no uso do pacote particular que conduz as análises.

• CUIDADO: Uma das menos desejáveis porém predominantes conseqüências do uso de pacotes estatísticos é que, por eles serem fáceis de usar, muitas pessoas inexperientes em procedimentos estatísticos seguidos de análises estatísticas não sabem como interpretar os resultados .

Page 35: MANIPULAÇÃO DE DADOS Medidas. IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se

FIM