analise de dados em ciencias sociais.pdf

128
8/11/2019 Analise de dados em ciencias sociais.pdf http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 1/128

Upload: nair-moura

Post on 02-Jun-2018

225 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 1/128

Page 2: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 2/128

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

INTRODUÇÃO ÀS TÉCNICAS UTILlZNDO O SPSS PARA WINDOWS

Título Anólise de dodos em Ciêncios Sociois

 ELT

www celtaeditora pt

Ruo Vera Cruz 28 I 2780 305 Oeiras

Apartado 151 12781 901 Oeiras

Tel: 2144174331 Fax: 214467304

[email protected]

Autor Alon Brymon e Duncon Creme r

Distribuidor   Rua Rodrigues Sampaio 77 c/v Lisboa

Tel: 213529006/08

I

Fax; 213159259

IS N

972 774 169 X

Preço

28 35

Page 3: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 3/128

Page 4: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 4/128

tulo original: QuantitativData nalysis with SPSS Release 10 for Windows

Cuide for Social Scientists

Routledge, 2001

lan Bryman e Duncan Cramer

nálise de Dados em Ciências Sociais: Introdução às Técnicas Utilizando

SPSS

O

para Windows

imeira edição portuguesa: Novembro de 1992

ragem: 1000 Exemplares

gunda edição portuguesa: Novembro de 1993

ragem: 1000 Exemplares

rceira edição portuguesa: Março de 2003

ragem: 1000 Exemplares

adução do inglês: Alexandra Figueiredo de Barros

 La

edição) e Diniz Lopes

 3.a

edição)

evisão técnica: Luísa Pedroso de Lima

 La

edição) e Diniz Lopes 3: edição)

N: 972-774-169-X

epósito legal: 192457/03

BN da edição original: 0-415-24400-5, Londres, Routledge

omposição: Celta Editora, utilizando caracteres Palatino, corpo 10

apa: Mário Vaz

 

Arranjo: Paula Neves

pressão e acabamentos: Tipografia Lousanense, Lda.

eservados todos os direitos para a língua portuguesa,

acordo com a legislação em vigor, por Celta Editora, Lda.

eIta Editora, Rua Vera Cruz, 2B, 2780-305 Oeiras, Portugal

dereço postal: Apartado 151, 2781-901 Oeiras, Portugal

.: +351) 214 417 433

x: +351) 214467304

ail: mai @celtaeditora.pt

ina: www.celtaeditora.pt

Page 5: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 5/128

PL NO D O R

Índice de figuras caixas e quadros

Xl

Prefácio xxi

1 A análise de dados e o processo de investigação 1

2 Analisar dados com o computador: os primeiros passos

com o SPSS1 para Windows 19

3 Analisar dados com o computador: dominar melhor

o SPSS1 para Windows 47

4 Os conceitos e a sua medição 63

5 Resumir os dados 81

6 Arnostragem e significância estatística 111

7 Análise bivariada: explorar diferenças entre valores

de duas variáveis 131

8 Análise bivariada: identificar associações entre variáveis 183

9 Análise multivariada: explorar diferenças entre três

ou mais variáveis 225

1 Análise multivariada: caracterizar relações entre três

ou mais variáveis 259

11 Agregar variáveis: análise fadorial exploratória 297

Respostas aos exercícios 313

Referências bibliográficas 325

Page 6: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 6/128

lano da obra v

dice de figuras caixas e quadros xi

refácio xxi

ANÁLISE   DADOS E O PROCESSO DE INVESTIGAÇÃO 1

análise de dados quantitativos e o processo de investigação 2

lano de investigação e causalidade 8

quérito/plano correlacional e causalidade 14

xercícios 16

NALISAR DADOS COM O COMPUTADOR: OS PRIMEIROS

ASSOS COM O SPSS 10 PARA WINDOWS 19

ficheiro de dados 20

omo ter acesso ao SPSS 25

introdução e edição de dados no Data Editor 29

rocedimentos estatísticos 37

uardar e imprimir o Output 40

istema de ajuda 40

erminar uma sessão de trabalho no SPSS 41

xercícios 41

pêndice 2 1 Questionário do Trabalho 43

NALISAR DADOS COM O COMPUTADOR:

OMINAR MELHOR O SPSS 10 PARA WINDOWS 47

Page 7: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 7/128

viii

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Dados omissos e cálculo de valores para formar medidas

compostas 57

Exercícios 6

OS CONCEITOS E A SUA MEDIÇÃO 63

Tipos de variáveis 66

Dimensões dos conceitos 7

Validade e fidelidade das medidas 73

Exercícios 78

RESUMIR OS DADOS 81

Distribuições de frequência 81

Medidas de tendência central 92

Medir a dispersão 95

Métodos de apresentação dos dados: diagramas

troncos e folhas e diagramas extremos e quartis 98

A forma de uma distribuição 1 4

Exercícios 1 8

AMOSTRAGEM E SIGNIFICÂNCIA ESTATÍSTICA 111

Amostragem 111

Problemas relacionados com a amostragem 116

Significância estatística 118

A inferência a partir de amostras da população 126

Exercícios 129

ANÁLISE BIVARIADA: EXPLORAR DIFERENÇAS

ENTRE VALORES DE DUAS VARIÁVEIS 131

Critérios para seleccionar testes bivariados de diferenças 132

Testes paramétricos versus não paramétricos 133

Variáveis nominais e testes não paramétricos 136

Variáveis não nominais e testes não paramétricos 147

Variáveis não nominais e testes paramétricos 159

Análise de variância a um factor para três ou mais médias não

relacionadas 165

Análise de variância multivariada para três ou mais médias

relacionadas 174

Exercícios 18

ANÁLISE BIVARIADA: IDENTIFICAR ASSOCIAÇÕES ENTRE

Page 8: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 8/128

ÍNDICE

ix

Outras abordagens de associações entre duas variáveis 2 7

Regressão 2

Abordagem geral sobre os diferentes tipos de variáveis

e métodos de análise das suas relações 22

Exercícios 222

9 ANÁLISE MULTIVARIADA: EXPLORAR DIFERENÇAS

ENTRE TRÊS OU MAIS VARIÁVEIS 225

Planos de estudo multivariados 225

Análise multi variada 235

Exercícios 256

  ANÁLISE MULTIVARIADA: CARACTERIZAR RELAÇÕES

ENTRE TRÊS OU MAIS VARIÁVEIS 259

Análise multivariada através de tabelas de contingência 26

Análise multivariada e correlação 27

Regressão e análise multivariada 275

Path analysis 287

Exercícios 293

  AGREGAR VARIÁVEIS: ANÁLISE FACTORIAL

EXPLORATÓRIA 297

Matriz de correlações  correlation matrix 299

Componentes principais ou factores? 3

Número de factores a manter 3 3

Rotação de factores 3 5

O procedimento do SPSS para a análise factorial 3 8

Exercícios 3 9

Respostas aos exercícios 3 3

Referências bibliográficas 325

Page 9: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 9/128

ÍNDICE DE FIGURAS, CAIXAS E QUADROS

Figuras

1 O processo de investigação 3

.2 Uma relação espúria 10

.3 Um estudo experimental 12

.4 Três tipos de planos experimentais 13

.5 Uma relação entre duas variáveis 15

.6 A relação será espúria? 15

.7 Duas possibilidades de interpretação causal de uma relação 16

.1 Decisão da natureza de uma variável 67

.2 Conceitos, dimensões e medidas 71

Gráfico de barras referente à distribuição dos estudantes

por faculdades 83

Histograma para os valores da variável rendim

 dados do Questionário do Trabalho) 85

.3 Diagrama de queijo para gpracial dados do Questionário

do Trabalho) 90

.4 Amplitude interquartis 97

.5 Diagrama de troncos-e-folhas para a variável necess 102

Diagrama de extremos-e-quartis

104

.7 Diagrama extremos-e-quartis da variável necess

  utput

do SPSS) 104

Duas distribuições normais

106

.9 Média e distribuição normal

106

Propriedades da distribuição normal

107

Distribuições positiva e negativamente enviesada

108

Page 10: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 10/128

xii

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

6.2

6 3

6.4

7

8.1

8.2

8.3

8.4

8.5

8.6

8.7

8.8

8.9

8 1

8 11

8 12

8.13

8 14

8 15

8 16

8 17

9.1

9.2

9.3

9 4

9.5

9.6

1 1

1 2

10.3

1 4

Distribuição de resultados teóricos similares obtidos por 64

lançamentos de moeda .

Nível de significância de 5 para hipótese unicaudal

ou bicaudal .

Intervalos de confiança .

Uma comparação da distribuição do erro padrão da diferença

de médias para amostras relacionadas .

Diagrama de dispersão mostrando uma associação negativa:

satis por rotina .

Diagrama de dispersão mostrando uma associação positiva .

Uma associação perfeita .

Ausência de associação entre duas variáveis .

Três associações curvilineares .

Duas associações positivas .

Duas associações negativas .

Força e direcção dos coeficientes de correlação .

Tipos de associações entre duas variáveis .

A recta de regressão .

Regressão: uma associação negativa .

Regressão: um ponto de intercepção negativo .

Regressão: uma associação perfeita .

A precisão da recta de regressão .

Diagramas de dispersão correspondentes a dois níveis

de correlação idênticos .

Heterocedasticidade .

Diagrama de dispersão do SPSS com recta de regressão

  ados do Questionário de Trabalho) .

Exemplo de uma interacção entre duas variáveis .

Exemplos de outros tipos de interacção entre duas variáveis .

Exemplos de ausência de interacção entre duas variáveis .

Representação esquemática de um efeito significativo

de um factor .

Níveis de depressão pós-teste em mulheres e homens Projecto

Depressão) .

Níveis de depressão pré e pós-teste nos três tratamentos

 rojecto Depressão) .

Será que a relação entre a variedade nas funções e a satisfação

no trabalho é espúria? .

Será a relação entre a variedade das funções e a satisfação

no trabalho afectada por uma variável interveniente? .

Será que a relação entre a variedade das funções e a satisfação

no trabalho é moderada pelo sexo? .

Causalidade múltipla .

119

125

128

173

196

197

197

197

198

199

199

2

2 1

213

214

214

215

215

216

217

222

226

227

228

23

239

252

262

265

267

269

Page 11: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 11/128

ÍNDICE DE FIGURAS, CAIXAS E QUADROS

xiii

0.3 Os efeitos do controlo de uma variável em teste 272

10.6 Diagrama de

path

para satis 288

:0.7 Diagrama

path

para satis, especificando os coeficientes

path

291

:0.8 Diagrama path para absent 292

_1.1 Variância comum e variância única 301

_1.2 Teste

scree

dos valores próprios Questionário do Trabalho 304

Caixas

: 1 A janela de abertura do Windows 95/98 26

_.2

O Editor de Dados Data Editor do SPSS 27

_ 3

O menú

drop down

da opção Data 27

_ A caixa de diálogo Select Cases 28

_ 3

A janela Variable View do Data Editor 30

_.6

A caixa de diálogo Missing values 32

_ 7

A caixa de diálogo Value labels 33

_ 8

O menu

drop down

File 34

_ 9

A caixa de diálogo Save Data As 35

_.10

A caixa de diálogo Open File 36

_.11 A caixa de diálogo Text Import Wizard 37

_.12

A caixa de diálogo Descriptives 38

_ 13

A subcaixa de diálogo Descriptive: Options

39

_.14 A caixa de diálogo Help Topics Content 41

_.15

A caixa de diálogo Help Topics Find 42

_.16 A caixa de informação Help 42

3.1 A caixa de diálogo Select Cases 47

3.2 A subcaixa de diálogo Select Cases: If : 48

3.3 A caixa de diálogo Recode into Different Variables 51

3.4 A subcaixa de diálogo Recode into Different Variables:

Old and New Values 52

3.5 A caixa de diálogo Summarize Cases 53

3.6 A caixa de diálogo Recode into Same Variables 55

3.7 A subcaixa de diálogo Recode into Same Variables:

Old and New Values 55

3.8 A caixa de diálogo Compute Variable 56

4.1 A caixa de diálogo Reliability Analysis 76

-t2 A subcaixa de diálogo Reliability Analysis: Statistics 77

3.1 A recodificação de rendim para rendimgp 87

Page 12: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 12/128

xiv

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

5 5

5 6

5 7

5 8

5 9

7

7

7 3

7 4

7 5

7 6

7 7

7 8

7 9

7 1

7 11

7 12

7 13

7 14

7 15

7 16

7 17

7 8

7 9

7 2

7 21

7 22

7 23

8

8 2

8 3

8 4

8 5

8 6

A subcaixa de diálogo

Define Simple Bar Summaries

for Groups of Cases

 

A caixa de diálogo Pie Charts

 

A subcaixa de diálogo Define Pie Summaries for

Groups of Cases

 

A caixa de diálogo

Explore  

A subcaixa de diálogo Frequencies Statistics  

A caixa de diálogo Binomial Test

 

A caixa de diálogo

Chi Square Test  

A caixa de diálogo Crosstabs  

A subcaixa de diálogo Crosstabs Cell Display

 

A subcaixa de diálogo

Crosstabs Statistics

 

A caixa de diálogo Two Related Samples Tests

 

A caixa de diálogo

Tests for Several Related Samples  

A caixa de diálogo One Sample Kolmogorov Smirnov Test  

A caixa de diálogo Two Independent Samples Tests

 

A subcaixa de diálogo Two Independent Samples

Define Groups  

A caixa de diálogo Tests for Several Independent Samples

 

A subcaixa de diálogo

Several Independent Samples

Define Range

 

A caixa de diálogo

One Sample T Test  

A caixa de diálogo Independent Samples T Test  

A subcaixa de diálogo Define Groups

 

A caixa de diálogo

One Way ANOVA  

A subcaixa de diálogo One Way ANOVA  

A subcaixa de diálogo

One Way ANOVA Contrasts

 

A subcaixa de diálogo One Way ANOVA Post Hoc Multiple

Comparisons

 

A caixa de diálogo

Paired Samples T Test  

A caixa de diálogo Repeated Measures Define Factor[s]  

A subcaixa de diálogo Repeated Measures

 

A subcaixa de diálogo

Repeated Measures Options  

A caixa de diálogo Crosstabs

 

A subcaixa de diálogo

Crosstabs Statistics

 

A subcaixa de diálogo Crosstabs Cell Display  

A caixa de diálogo Scatterplot

 

A subcaixa de diálogo

Simple Scatterplot  

A caixa de diálogo Bivariate Correlations  

9

9

91

98

1 8

137

139

143

143

144

146

148

149

151

151

152

153

16

163

163

167

168

169

17

173

176

176

177

189

189

19

2 3

2 4

2 4

Page 13: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 13/128

ÍNDICE DE FIGURAS, CAIXAS E QUADROS

xv

9.2 A subcaixa de diálogo Univariate: Options 237

.3 A subcaixa de diálogo Univariate: Profile Plots 237

.-l A subcaixa de diálogo Univariate: Model 242

9.3 A caixa de diálogo Multivariate 245

9.6 A subcaixa de diálogo Multivariate: Options 246

9.7 A caixa de diálogo Repeated Measures Define Factor[s] 249

9.8 A subcaixa de diálogo Repeated Measures 250

.9 A subcaixa de diálogo Repeated Measures: Options   à

9.10 A subcaixa de diálogo Repeated Measures: Profile Plots 251

9.11 A caixa de diálogo completa Repeated Measures:

Define Factor[s] 253

9.12 A subcaixa de diálogo Repeated Measures

  análise de plano combinado) 254

10.1 A caixa de diálogo Partial Correlations 274

 1.0.2

A subcaixa de diálogo Partial Correlations: Options

274

:0.3 A caixa de diálogo Linear Regression 285

:0.4 A subcaixa de diálogo Linear Regression: Statistics 285

:1.1 A caixa de diálogo Factor Analysis 310

11.2 A subcaixa de diálogo Factor Analysis: Descriptives 310

 1.1.3 A subcaixa de diálogo Factor Analysis: Extraction 310

11.4 A subcaixa de diálogo Factor Analysis: Rotation 311

11.5 A subcaixa de diálogo Factor Analysis: Options 311

Quadros

.1 Violência na televisão e agressão 10

_.1 Os dados do Questionário do Trabalho 22

2.2 Nomes e localização das variáveis do Questionário

de Trabalho no SPSS 25

_.3 O

output

do comando Descritptives 38

2.4 O output Mean Descriptive 39

3.1 Idade média dos sujeitos do sexo masculino do Questionário

de Trabalho 49

3.2 O

output

do comando Case Summaries mostrando os valores

recodificados de rsatis2 e rsatis4 54

3.3 O output do comando Case Summaries mostrando os valores

de satisl, rsatis2, satis3, rsatis4 e satis 57

3.4 Os dados transformados do Questionário de Trabalho 61

 ;.1 Tipo de variáveis 67

Page 14: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 14/128

xvi

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

5.1 Faculdades a que pertencem cinquenta e seis alunos

  Dados Fictícios) 82

5.2 Tabela de frequência referente aos dados apresenados

no quadro 5.1 83

5.3 Distribuição de frequências para os valores de rendim dados

do Questionário do Trabalho) 85

5.4 Tabela de frequências para rendimgp

  utput

do SPSS) 88

5.5 Resultados de um teste de aptidão matemática aplicado

aos alunos de dois professores Dados Fictícios) 96

5.6 O

  utput do comando Explore para a variável rendim 99

5.7 Percentagem de necessidades satisfeitas pelas autarquias

num período de seis meses em Inglaterra e Escócia,1993-1994.... 101

6.1 Definição de uma amostra estratificada: trabalhadores

não manuais de uma empresa 116

6.2 Os quatro resultados que se podem obter a partir de dois

lançamentos da moeda 118

6.3 Resultados teóricos correspondentes ao lançamento de uma

moeda 64 vezes: probabilidade de resultados similares 120

6.4 Erros do Tipo I e do Tipo II 126

7.1 Testes de diferenças para duas variáveis 134

7.2 Comparação da proporção de homens e mulheres através

do teste binomial Questionário de Trabalho) 138

7.3 Comparação da proporção de brancos e não brancos através

do teste binomial Questionário do Trabalho) 138

7.4 Comparação do número de pessoas em cada um dos grupos

étnicos através do teste de qui-quadrado para uma amostra

  Questionário de Trabalho) 140

7.5 Teste de qui-quadrado com número insuficiente de casos

  Questionário de Trabalho) 141

7.6 O teste de qui-quadrado efectuado pelo procedimento Crosstabs,

comparando o número de homens e mulheres branco

e não brancos 144

7.7 Os dados do estudo de painel 145

7.8 Teste de McNemar comparando a comparência às reuniões

em dois meses Estudo de Painel) 146

7.9 Teste Q de Cochran comparando a comparência às reuniões

em três meses Estudo de Painel) 149

7.10 Teste de Kolmogorov-Smirnov para uma amostra comparando

a distribuição da qualidade do trabalho

  Questionário de Trabalho) 150

7.11 Teste de Kolmogorov-Smirnov para dua :;amostras comparando

a distribuição da qualidade do trabalho em homens e mulheres

  Questionário do Trabalho) 152

Page 15: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 15/128

DICE DE FIGURAS, CAIXAS E QUADROS

xvii

 

~::>

-23

168

171

167

174

169

168

16

164

165

159

158

154

153

155

157

Teste de medianas comparando a qualidade de trabalho

em homens e mulheres Questionário do Trabalho .

Teste de Mann-Whitney comparando a qualidade do trabalho

em homens e mulheres Questionário do Trabalho .

Teste de Kruskal-Wallis comparando a qualidade do trabalho

entre grupos étnicos Questionário do Trabalho .

Teste dos sinais comparando a qualidade do trabalho em dois

meses Estudo de Painel .

Teste das ordens de Wilcoxon comparando a qualidade

do trabalho nos dois primeiros meses Estudo de Painel .

Teste de Friedman comparando a qualidade do trabalho em

três meses Estudo de Painel .

Teste   para uma amostra da qualidade do trabalho

 Questionário do Trabalho .

Teste

 

para amostras não relacionadas comparando a satisfação

no trabalho em homens e mulheres Questionário do Trabalho .

Teste

 

comparando a qualidade no trabalho em homens

e mulheres Questionário do Trabalho .

Tabela da análise de variância a um factor comparando

a satisfação no trabalho em diferentes grupos étnicos

 Questionário do Trabalho .

Estatísticas descritivas grupais numa análise de variância

a um factor comparando a satisfação no trabalho em diferentes

grupos étnicos Questionário do Trabalho .

Teste de homogeneidade de variâncias de Levene

 Questionário do Trabalho .

Estatísticas relativas aos contrastes a um factor comparando

a satisfação no trabalho nos grupos 1 e 2

 Questionário do Trabalho .

Estatísticas relativas aos testes de Scheffé a um factor

comparando a satisfação no trabalho em diferentes grupos

étnicos Questionário do Trabalho .

Teste   para amostras relacionadas comparando a satisfação

no trabalho nos primeiros dois meses Questionário do

Trabalho .

_/ Médias e desvios padrões de medidas repetidas da satisfação no

 

~

Page 16: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 16/128

xviii

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

1 Dados relativos à satisfação no trabalho e ao absentismo de 30

empregados 185

2 Quatro combinações possíveis 185

3 A relação entre a satisfação no trabalho e o absentismo 186

4 Dois tipos de associação entre variáveis 186

5 Tabela de contingência especial por sexo  output do SPSS 188

6 Nível de especialização dos trabalhadores por sexo 194

7 A matriz de coeficientes de correlação produto-momento

de Pearson

 output

do SPSS 205

8 A matriz de coeficientes de correlação rho de Spearman 207

9 O output  e ns para s tis por especial 211

10 O impacto dos valores extremos: a associação entre a dimensão

da empresa e o número de funções especializa das 218

11 Análise de regressão: s tis por rotina  output do SPSS 221

1 Dados do projecto depressão 234

2 Médias da depressão pós-teste doepos nos três tratamentos

para homens e mulheres Projecto Depressão 238

3 Output dos Homogeneity tests Projecto Depressão 239

4 Testes de significância para efeitos principais e de interacção

num plano factorial não relacionado Projecto Depressão 240

5 Testes de significância para os efeitos da depressão pré-teste

 Projecto Depressão 241

6 Resultados da análise de covariância mostrando o teste de

homogeneidade do declive da recta de regressão intra-células

 Projecto Depressão 243

7 Análise de covariância Projecto Depressão 244

8 Médias ajustadas de depressão pós-teste nos três tratamentos

 Projecto Depressão 244

9 Médias e desvios-padrão dos níveis de depressão pós-teste para

os doentes doepos e informadores infpos para os três

tratamentos Projecto Depressão 247

10 O teste M de Box Projecto Depressão 247

11 O teste de Levene Projecto Depressão 247

12 O teste de esfericidade de Bartlett Projecto Depressão 248

13 Testes multivariados de significância para os efeitos do tratamento

 Projecto Depressão 248

Page 17: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 17/128

l -UICE DE FIGURAS, CAIXAS E QUADROS

xix

Relação entre a covariável idade e as duas variáveis

transformadas (Projecto Depressão) 255

Teste multivariados para a interacção entre tempo, tratamento

e sexo (Projecto Depressão) 255

- 19 Testes univariados para o efeito de interacção entre tempo,

tratamento e sexo (Projecto Depressão) 256

· a

Variáveis transformadas (Projecto Depressão) 2.56

Relação entre variedade e satisfação no trabalho

(Dados Fictícios) 262

Urna relação espúria: a relação entre a variedade das funções

e a satisfação no trabalho controlando a dimensão da amostra

(Dados Fictícios) 263

__ 3 Urna relação não espúria: a relação entre a variedade das funções

e a satisfação no trabalho controlando a dimensão da empresa

(Dados Fictícios) 264

:: - Urna variável interveniente: relação entre a variedade das

funções e a satisfação no trabalho, controlando

a variável interesse pelo trabalho (Dados Fictícios) 265

~_J Urna relação moderada: a relação entre a variedade das funções

e a satisfação no trabalho controlando o sexo (Dados Fictícios) ... 267

: =

ó

Causalidade múltipla: urna relação entre variedade e satisfação

no trabalho controlando a participação no trabalho 269

h

I Rendimento, idade e posição face à economia de mercado

(Dados Fictícios) 273

~o A matriz de coeficientes de correlação parcial (Questionário

do Trabalho) 275

__9 Comparação de coeficientes de regressão não estandardizados

e estandardizados, com s t s corno variável dependente 279

: = 100  ut ut do SPSS para a regressão múltipla

(Questionário do Trabalho) 282

~:E.IRelação entre a concordância com a legislação que defende

a igualdade de salários e sexo dos inquiridos 294

:·:E.2Relação entre a concordância com a legislação que defende

a igualdade de salários e sexo dos inquiridos 294

:~ 1 Matrizes de correlações e níveis de significância para os itens

de satisfação e rotina (Questionário do Trabalho) 300

Comunalidades das componentes principais

(Questionário do Trabalho) 302

~~

Comunalidades dos eixos principais

Page 18: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 18/128

xx

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

11.5 Pesos dos itens nas duas primeiras componentes principais

 Questionário do Trabalho 305

11.6 Pesos dos itens nos dois primeiros eixos principais

 Questionário do Trabalho 305

  7 Pesos dos itens nas duas primeiras componentes principais

rodadas ortogonalmente Questionário do Trabalho 307

11.8 Pesos dos itens nas duas primeiras componentes principais

rodadas obliquamente Questionário do Trabalho 307

11.9 Correlações entre as duas primeiras componentes principais

rodadas obliquamente Questionário do Trabalho 308

Page 19: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 19/128

PR FÁ IO

 

:e livro procura iniciar os leitores nas técnicas fundamentais de análise

3:atistica utilizadas por psicólogos e sociólogos. No entanto, não conside

': =.::10Sue ele seja uma introdução à estatística semelhante ao que é habi-

..:a1; pensamos antes que a sua natureza é diferente, já que não nos preocu

-:-=.::nosm incluir as complexas fórmulas subjacentes aos métodos estatís

:..:uS abordados.

É

frequente os estudantes considerarem essas fórmulas e

:;cálculos que se lhes associam muito assustadores, especialmente quan

:.~ as suas bases matemáticas são mais fracas. Além disso, nos dias de hoje,

~':;?omos de poderosos computadores e de conjuntos de programas esta

'=':;:::(os,parecendo desnecessário confrontar os estudantes com a ansieda

~=:-elacionada com cálculos complexos quando podem ser as máquinas a

:.=sempenhar a maior parte do trabalho. De facto, a maioria dos utilizado

_::-:;dispõe de programas estatísticos que permitem que sejam os computa

- -:-es a efectuar os cálculos havendo, assim, poucas razões para se consi

,_=:-arem as fórmulas e a sua aplicação como um ritu l de p ss gem para os

-s::ldantes de ciências sociais. Acresce ainda que poucos estudantes che

=::....~am compreender plenamente o racional da fórmula que teriam que

-:-:-ender.Na realidade, preferimos a designação análise de dados quan-

-:ativos em vez de estatística , devido à imagem adversa que esta últi-

;: ?alavra suscita em muitos potenciais leitores.

Tendo em conta o facto de termos disponíveis programas de estatística e

Page 20: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 20/128

xxii

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

mais amplamente utilizado conjunto de programas para análise estatística

nas ciências sociais - o SPSS Statistical Package for the Social Sciences .

Este programa foi criado nos anos 60 e constituiu a primeira grande tenta

tiva de desenvolver software para as ciências sociais, tendo, desde aí, pas

sado por várias revisões e aperfeiçoamentos. As primeiras duas edições

deste livro Bryman   Cramer, 1990,1994 referiam-se a versões do SPSS

desenvolvidas para computadores de grande porte  maínframe e para o

sistema operativo Microsoft MS-DOS.No entanto, há uns anos atrás, apa

receu uma versão de SPSSdesenvolvida para o ambiente Microsoft Win

dows. Esta passou, também, por algumas revisões. Uma das edições ante

riores deste livro Bryman   Cramer, 1997 dizia respeito à versão 6 para

Windows, desenvolvida para o Microsoft Windows 3.11.Após a introdu

ção do Windows 95,uma nova versão do SPSS versão 7 foi desenvolvida

para correr neste sistema operativo. Aúltima versão para o Windows 95é a

versão 10.O presente livro descreve a utilização desta versão, a que nos re

feriremos abreviadamente por SPSS.Autilização das versões 8e 9é descri

ta numa edição anterior desta obra Bryman e Cramer, 1999 .

Para fazer a distinção entre osmétodos de análise de dados e os coman

dos do SPSS,apresentamos osúltimos emnegrito Apresentamos, ainda, da

dos para os estudantes utilizarem, aparecendo os nomes das variáveis tam

bém em negrito [bold]  por exemplo, rendim isto é, rendimento . As bases

de dados podem ser retiradas do endereço da editora Routledge na internet;l

http://www.routledge.com/textbooks/ titles/ quant10.html

Na parte final de cada capítulo incluímos exercícioscuja solução seen

contra no fim do livro. Esperamos que estudantes e professores lhes encon

trem utilidade; facilmente poderão ser adaptadas de modo a constituírem

exercícios adicionais.

O facto de termos combinado métodos de análise de dados usados

por psicólogos e por sociólogos prende-se com a nossa crença de que as

necessidades dos estudantes das duas áreas se sobrepõem substancial

mente. No entanto, os professores podem omitir algumas técnicas, se as

sim o entenderem.

Agradecemos a David Stonestreetpelo seu apoio nas edições anteri

ores deste livro, e à nossa presente editora, Vivien Ward, pelo seu apoio

na presente edição. Gostaríamos de agradecer, também, a Louis Cohen,

Max Hunt e Tony Westaway por terem lido omanuscrito da primeira edi

ção deste livro, e por terem feito sugestões para o seu aperfeiçoamento.

Obviamente eles não podem ser responsabilizados por quaisquer erros

que, eventualmente, apareçam neste livro: esses erros serão de nossa

1 Neste endereço, o leitor encontrará asbasesde dados em língua inglesa.Para aceder a es-

tas mesmas bases de dados em versão portuguesa, o leitor deverá dirigir-se a

http://www.celtaeditora.pt/materiais/ adados.

Page 21: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 21/128

?REFACIO

xxiii

: : t5ivaresponsabilidade apesar de inevitavelmente cada

 

de nós~CU5aro outro de os ter

cometido 2

 lan ryman e Duncan Cramer

Universidade de Loughborough

Page 22: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 22/128

Capítulo 1

 \ NÁLISE DE D DOS EO PRO ESSO DE INVESTIG ÇÃO

1no abrange amplamente o campo que se designa, em geral, por esta

as, como procurámos salientar no prefácio, afastámo-nos em vários

os da forma convencionalmente usada para ensinar este tema a estu

s pré e pós-graduados. Especificando, foi nossa intenção combinar a

se de dados com as competências no domínio da utilização de computa

sem sobrecarregar o leitor com fórmulas. Esta intenção afasta-nos de

s, ou mesmo da maior parte, das formulações deste tema. Preferimos o

 análise de dados quantitativos porque a ênfase é posta na compreen-

: na análise de dados e não tanto na natureza das próprias técnicas

Por que razão devem os estudantes de ciências sociais aprender a fa

1álisee dados quantitativos, especialmente numa época em que a in

.gação qualitativa está a assumir, cada vez mais, uma posição diantei

man, 1988a)? Afinal já todos nós ouvimos falar da forma como os

estatísticos podem ser distorcidos, como pode ser ilustrado pelas

ras de Disraeli: Há mentiras, grandes mentiras e estatísticas . Por

notivo se deverão preparar investigadores e estudantes para se envol-

numa actividade que pode ser tão ingrata? Se considerarmos a pri

:-auestão - por que é que os estudantes de ciências sociais devem

:1dera fazer análise de dados quantitativos - devemos lembrar-nos

lIDagrande parte da pesquisa empírica desenvolvida no âmbito das

ias sociais é planeada para gerar dados quantitativos ou apoia-se ne-

ara poderem apreciar o tipo de análises que se utilizou com esses da

para analisarem os seus próprios dados (especialmente porque mui

Page 23: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 23/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

autores reconhecem que haverá muito a ganhar se se fundirem as duas tra

dições de pesquisa Bryman, 1988a .

Em relação à questão da capacidade dos estatísticos de distorcer as aná

lises que executam, o panorama é substancialmente exagerado por livros com

títulos desconcertantes do género   omo mentir com estatísticas Huff, 1973 ,

devendo ser reconhecido que uma compreensão das técnicas abordadas no

nosso livro dará aos leitores uma capacidade acrescida de ver para além das

representações erradas que preocupam tantas pessoas. De facto, a aquisição

de uma capacidade de avaliação da análise de dados quantitativos é benéfica,

face à perspectiva de uma utilização universal de dados estatísticos na vida

quotidiana, já que somos constantemente sujeitos a uma série deles na forma

de resultados de estudos de opinião, estudos de mercado, inventários de ati

tudes, estatísticas de saúde e de criminalidade, etc. O domínio da análise de

dados quantitativos aumenta a nossa capacidade para reconhecermos con

clusões deficientes ou manipulações da informação. Existe, ainda, a hipótese

de uma parte substancial dos nossos leitores virem a desempenhar funções

em que sejam confrontados com a necessidade de analisar ou apresentar da

dos estatísticos. A análise de dados quantitativos não consiste numa aplica

ção mecanizada de técnicas pré-determinadas, sendo, antes, um tema que ali

menta controvérsias e debates, à semelhança do que acontece com as próprias

ciências sociais. Quando for apropriado apresentaremos ao leitor alguns dos

aspectos que fomentam essas discussões.

  nálise de d dos qu ntit tivos e o processo de investigação

Nesta secção, vamos explorar a forma como a análise de dados quantitativos

se adequa ao processo de investigação - especificamente o processo de in

vestigação quantitativa. Como veremos, a área de conhecimentos abordada

por este livro não se limita a responder à questão de como lidar com dados

quantitativos, centrando-se também noutros aspectos ligados à investigação

que afectam a análise de dados.

A figura 1.1 ilustra os passos principais da investigação quantitativa.

Embora se possa levantar a questão de se ela, de facto, se conforma sempre a

uma sequência linear bem ordenada Bryman, 1988a; 1998b , os componentes

apresentados na figura 1.1 fornecem um modelo de representação útil. Nesse

modelo, são delineadas as etapas a seguir referenciadas.

Teoria

O ponto de partida do processo é o enquadramento teórico. As teorias, nas

ciências sociais, podem situar-se entre as abordagens abstractas e gerais

Page 24: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 24/128

A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

  ~

Teoria

Hipóteses

Operacionalização

de conceitos

Selecção de sujeitos ou

de respondentes

l

3

Plano correlacionaVlnquérito

1- -Condução de entr e;;stas-I

I ou aplicação de :

~ ..9,,:~i :.n~i~s I

\

 lano experimental

--------------1

I Definição de grupos de I

: controlo e de grupos I

I

experimentais

I

I. :

I Realização de observações I

 

lou aplicação de testes I

I

ou questionários

I

______________ J

Recolha de dados

Análise de dados

 onclusões

~ 1.1 O processo de investigação

_: 0, por exemplo, o funcionalismo) e as abordagens de um nível de abs

-70 inferior que procuram explicar fenómenos específicos (como o com

:?mento de voto, a delinquência ou a agressividade). De um modo geral,

rias que tendem a receber mais atenção directa são as que têm um baixo

::. de generalidade. Merton

(1967)

referiu-se a teorias de médio alcance

designar as construções que se situam entre as teorias gerais e abstractas

. : escobertas empíricas. Hirschi (1969), por exemplo, formulou uma teoria

•_ a delinquência juvenil que propõe que os actos de delinquência são

- ?rováveis quando os laços da criança à sociedade estão quebrados. Esta

- derivou, em grande parte, de outras teorias e de dados de investigação

-onados com a delinquência juvenil.

  ipóteses

~;ir do momento em que uma teoria é formulada, é provável que os in

- 5-adores a queiram testar. Será que a teoria continua a revelar-se adequa

Page 25: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 25/128

4

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

a teoria que já referimos, verificou que as crianças que se encontram ligadas

uma sociedade convencional no sentido em que aderem aos valores con

encionais, participando ou aspirando a participar desses valores) terão me

os probabilidade de cometer actos de delinquência do que as crianças que

ão se encontram nessa situação. Muitas vezes, as hipóteses apresentam-se

mo uma relação entre duas ou mais entidades -neste caso, o envolvimen

com a sociedade convencional e a delinquência juvenil. Essas entidades

o, geralmente, designadas por conceitos - isto é, categorias onde se ar

mam as nossas ideias e observações sobre os elementos comuns do mundo.

natureza dos conceitos será discutida com maior pormenor no capítulo 4.

pesar das hipóteses terem a vantagem de forçar os investigadores a pensar

e forma sistemática sobre o que pretendem estudar e a estruturar os seus

lanos de investigação de acordo com isso, têm uma potencial desvantagem

ue consiste em poderem afastar a atenção do investigador de outras facetas

teressantes dos dados recolhidos.

  peracionalização de conceitos

ara se avaliar a validade de uma hipótese é necessário desenvolver formas

e medir os conceitos a que ela se refere. Aeste processo chama-se, geralmen

operacionalização seguindo o exemplo do processo de medida utilizado em

edicina Bridgman, 1927). De facto, o que se passa nesta fase é a tradução

os conceitos em variáveis - isto é, em atributos que estabeleçam diferenças

ntre objectos relevantes indivíduos, empresas, nações, etc.). Hirschi opera

ionalizou de diversas formas a ideia de envolvimento com a sociedade con

encional. Uma dessas formas consistiu em incluir num questionário, que vi

ia a ser aplicado às crianças, um item em que lhes perguntava se gostavam

u não da escola. A delinquência foi medida inquirindo as crianças sobre o

úmero de actos de delinquência que tinham cometido i.e., através do núme

o de actos de delinquência auto-relatados). Amedida de conceitos, em mui

s estudos experimentais no âmbito da psicologia, é consegui da através da

bservação de pessoas e não tanto a partir da aplicação de questionários. Se o

vestigador está interessado na agressão, por exemplo, pode criar uma si

ação laboratorial que permita observar variações no comportamento agres

ivo. Uma outra forma de operacionalizar os conceitos consiste na análise de

statísticas existentes; foi, por exemplo, o que fez Durkheim 1898/1952) na

ua análise das taxas de suicídio. No capítulo 4 discutir-se-ão outros aspectos

gados à medição de conceitos e algumas das propriedades que as medidas

Page 26: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 26/128

~.;AUSE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

5

.=e 2cçãode inquiridos ou de sujeitos

~er um estudo de opinião, o investigador necessita de encontrar as

-s certas para aplicar o instrumento de medida que se construiu (por

_~o,um questionário de auto-aplicação ou um protocolo de entrevista).

:; considerar, novamente, o caso de Hirschi que seleccionou aleatoria

-=

::aais de

5500

crianças em idade escolar de uma zona da Càlifórnia.

_ :acto da selecção ser feita aleatoriamente é importante porque reflecte

 ~s

do investigador em chegar a conclusões que se possam generalizar

a: crianças que não tenham participado no estudo. Raramente é possí-

:actar todos os elementos de uma população e, por isso, é imperativo

_Laruma

amostra.

Para que os resultados se possam generalizar a uma

2.çãomais ampla, essa amostra tem que ser uma amostra representativa o

iXc.e ser garantido através de uma escolha aleatória dos sujeitos. Além

::-.uitas das técnicas estatísticas a que nos referiremos ao longo deste li

~encem ao domínio da

estatística inferencíal

que permite ao investiga

- =sde que a amostra constituída seja aleatória, determinar a probabilida-

- .:::::eos resultados que obteve a partir de uma amostra coincidam com os

:-..arn

obtidos para a população de onde a amostra foi retirada. Estes

:;serão abordados no capítulo 6.

  ;reparação de um plano de investigação

e sociólogos utilizam basicamente dois tipos de planos de investi

primeiros tendem a usar estudos

experimentais

em que o investiga

-:::pula aspectos da situação, quer no laboratório quer no campo, e ob

:;efeitos dessa manipulação nos sujeitos experimentais. Este tipo de es-

~ge, ainda, que exista um grupo de controlo , servindo como base de

~;;ão com o grupo de sujeitos submetidos à manipulação experimental.

 /ano correlacíonal ou inquérito o investigador não manipula qualquer

.:::. todos os dados relacionados com todas as variáveis são recolhidos si-

~?:nente. O termo

correlação

também se refere a uma técnica para anali

-6es entre variáveis (ver capítulo 8) mas, no presente contexto, designa

.: .:ieplano de investigação. Nem sempre o investigador pode escolher

:::: --:25 dois tipos de estudos vai utilizar. Hirschi, por exemplo, não podia

:: ?IDas crianças mais envolvidas com a escola e outras menos para ob-

Page 27: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 27/128

6

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Locke e Schweiger, 1979 .

 

importante realçar que, na maior parte dos casos, a

natureza do plano de investigação - experimental ou correlacional- é conhe

cida no princípio da sequência representada na figura LI, de modo que as ca

racterísticas do plano escolhido influenciam várias fases do processo de inves

tigação. A natureza do plano de estudo tem também implicações no tipo de

manipulação estatística que pode ser executada com os dados que dele resul

tam. Na próxima secção, serão abordadas com maior pormenor as diferenças

entre os dois planos de estudo.

A recolha de dados

Nesta fase, o investigador recolhe dados a partir da realização de entrevistas,

da aplicação de questionários, da observação ou de qualquer outro método.

Num livro com as características do nosso não seria pertinente abordar os as

pectos técnicos ligados a esta recolha de dados. No caso do leitor não estar fa

miliarizado com este terna deverá consultar um livro sobre métodos de inves

tigação sociológica e psicológica.

A análise de dados

Esta fase tem urna relação muito directa com o terna deste livro.   provável

que o investigador queira descrever os sujeitos com que trabalhou pelo me

nos em termos das variáveis inerentes ao estudo. Pode, por exemplo, estar in

teressado em conhecer qual a proporção de crianças que referem nunca ter co

metido actos de delinquência ou das que referem já ter cometido um ou dois

ou mais deste tipo de comportamentos. As diversas formas de análise e apre

sentação da informação relacionada com uma só variável chamada, por ve

zes,

análise univariada

serão examinadas no capítulo 5. No entanto, a análise

de uma só variável raramente é suficiente e o investigador provavelmente

terá interesse em conhecer a ligação entre essa variável e cada uma das outras

variáveis, i.e., em fazer uma

análise bivariada

O estudo das ligações entre va

riáveis pode ser feito de uma de duas formas. Um investigador que tenha con

duzido uma experiência pode estar interessado em saber qual a magnitude

da diferença entre o grupo experimental e o grupo de controlo em relação a al

gum aspecto. Pode querer saber, por exemplo, se o facto dos sujeitos verem

filmes violentos lhes aumenta a agressividade. O grupo experimental que vê

os filmes violentos e o grupo de controlo que não os vê podem, então, ser

comparados para se avaliar a extensão da diferença existente entre eles. As

técnicas para a verificação destas diferenças serão exploradas no capítulo 7.O

investigador pode, também, estar interessado nas relações existentes entre

variáveis - será que duas variáveis estarão ligadas entre si de forma a que

Page 28: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 28/128

A A 'ÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

7

a variar ao mesmo tempo? Hirschi (1969:121), por exemplo, apresen

quadro que ilustra como o facto de gostar da escola e os actos de delin

.a auto-relatados se encontram em interconexão: enquanto apenas 9

;:rianças que diziam gostar da escola referiam ter cometido dois ou mais

- 5

de delinquência, 49 das que diziam não gostar afirmavam estar den-

- --sa mesma condição. Os métodos que permitem analisar as relações en-

_;:-aresde variáveis serão explicados no capítulo 8. Muito frequentemente,

estigador pretende explorar as conexões entre mais que duas variáveis

do a chamada análise multivariada O capítulo 9 aborda esse tipo de

. -se no sentido da exploração das diferenças, enquanto o capítulo

10

se

-=-ana análise multivariada de relações entre mais do que duas variáveis.

,,::nção entre estudar as diferenças e estudar as relações nem sempre é cla

- .xl.eríamos, por exemplo, verificar que os rapazes apresentam, mais fre-

-emente que as raparigas, comportamentos de delinquência concluindo

que os rapazes e as raparigas diferem em relação à tendência para co

em esse tipo de actos ou, em alternativa, que existe uma relação entre o

~o sujeito e a delinquência.

  esultados

~álise dos dados recolhidos sugere que uma hipótese é confirmada, es

_saltados podem servir de apoio à teoria que a suscitou. Os próximos in

~dores poder-se-ão interessar quer por reproduzir essa mesma conclu

_::erpor estudar outras implicações da teoria. No entanto, o facto de uma

ser refutada pode ser igualmente importante, já que sugere que a

:. :lão é adequada ou, no mínimo, que precisa de ser revista. Por vezes,

=05 alguns pontos da hipótese são confirmados. Uma análise multivaria

-'e indicar que a relação entre duas variáveis só se verifica para alguns

.~S da amostra mas não para os outros (por exemplo, verifica-se para as

2:'eS

e não para os homens ou para os jovens e não para pessoas mais ve-

:;m resultado deste tipo poderá exigir uma reformulação da teoria.

:od.os os resultados se relacionam directamente com uma hipótese.

_.quérito, por exemplo, o investigador pode recolher dados sobre de

~.ados tópicos cuja relevância poderá só ser evidente num contexto

:or.

orno foi dito atrás, a sequência ilustrada na figura 1.1 constitui um mo

processo de investigação que nem sempre pode ser reproduzido

Page 29: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 29/128

8

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

bjectivos de muita da investigação quantitativa nas ciências sociais é a

emonstração de c us lid de i.e., de que uma variável tem impacto sobre

utra variável. Os termos v riável independente e v riável dependente são

requentemente, utilizados neste contexto. O primeiro diz respeito a uma

ariável que influencia a segunda, sendo assim esta última um efeito da va

iável independente. Esta relação causal é bastante explorada ao nível das

iências sociais e um dos principais papéis da análise multivariada é, precisa

ente, elucidá-Ia Bryman 1988a). A possibilidade do investigador estabele

er uma relação de causa-efeito é fortemente afectada pela natureza do plano

e investigação que utiliza.   sobre este assunto que nos vamos debruçar em

 l no de investig ção e c us lid de

omo vimos, no último parágrafo, um dos principais objectivos da investiga

ão quantitativa é estabelecer relações de causalidade. Este facto decorre, em

rande parte, do interesse em estabelecer conclusões semelhantes às das ciên

ias naturais que, frequentemente, tomam a forma de relações de causa-efei

o. Além disso, as conclusões que estabelecem relações deste tipo têm uma

mportância prática considerável: se soubermos que uma coisa afecta outra,

odemos manipular a causa para obter um efeito. Da mesma forma que se de

onstrou que o comportamento de fumar pode provocar um certo número

e doenças, como o cancro de pulmão e certas afecções cardíacas, o investiga

or das ciências sociais, se demonstrar relações de causalidade em contextos

dequados, pode providenciar informações que podem ter importantes apli

ções práticas.

Dizer que uma coisa causa outra não quer dizer que a variável depen

ente o efeito) seja totalmente influenciada pela variável independente a

ausa). Se se fumar não se adquire, necessariamente, uma doença e muitas

as doenças contraídas pelas pessoas que fumam também atingem os não fu

adores. Assim, a palavra causa deve ser encarada como uma forma de re

erir que uma alteração na variável independente conduz a uma alteração na

ariável dependente. Aqueles que fumam muito têm mais probabilidade do

ue aqueles que fumam pouco de contrair uma série de doenças associadas

o tabaco. Os que fumam pouco, por sua vez, têm mais probabilidade de ter

ssas doenças do que aqueles que não fumam. Do mesmo modo, se verificar

os que o facto de ver actos de violência na televisão induz comportamentos

gressivos, isso não significa que só as pessoas que assistem a programas vio

Page 30: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 30/128

Page 31: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 31/128

10 ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Quadro 1 1 Violência na televisão e agressão

Criança

1

2

3

4

5

6

7

8

9

1

Número de horas de

exposição à violência

filmada

Número de horas semanais de

exposião

à

violência filmada

9.50

9 25

8.75

8.25

8.00

5.50

5.25

4.75

4.50

4.00

Número de actos agressivos

registados

9

8

7

7

6

4

4

5

3

3

Número de actos

agressivos

Figura 1 2 Uma relação espúria

o inverso. De facto um efeito nunca pode preceder a causa. Este critério pode

parecer óbvio e extremamente fácil de testar mas como veremos torna se um

problema importante quando se trabalha com planos de investigação não

experimentais.

 l nos experiment is e c us lid de

Um plano de investigação define a estrutura básica do estudo. Embora se

possam delinear vários tipos de planos costuma fazer se uma distinção fun-

damental entre planos experimentais e não experimentais dos quais se desta-

ca o inquérito. Num estudo experimental é fundamental elucidar a relação

Page 32: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 32/128

A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

11

:,:- ernaé aquele que aponta, com clareza, a causa e o efeito.Não é, então, surpre

:::1denteque os estudos experimentais sejam especialmente fortes em validade in

zna, já que foram criados especificamente para darem origem a dados que indi

:::5semrelações de causalidade.

Se quisermos demonstrar que o facto das crianças verem violência na te

.2\'isão aumenta a agressão que manifestam, podemos fazer o seguinte estu

 : :juntamos um grupo de dez crianças que podem interagir e brincar duran

-2duas horas, Nesse período de tempo, observadores registam o número de

:omportamentos agressivos exibidos por cada criança. Em seguida, as mes

::-..ascrianças assistem a um programa de televisão muito violento - poden

 :

designar-se esta condição de exposição à violência filmada por tratamento

~'\perimental- após o que voltam a interagir por duas horas. Os comporta

:: entos agressivos que manifestam são registados tal como na primeira fase

':0 estudo. Na verdade, estamos aqui a seguir uma sequência do tipo:

~:nque OBS1 corresponde à medida inicial do comportamento agressivo (fre

~uentemente designada por pré-teste EXP representa o tratamento experi

:nental em que é introduzida a variável independente e

OBS2

é a medida sub

~quente do comportamento agressivo (frequentemente chamada pós-teste .

Consideremos, agora, que o valor correspondente à

OBS2

é 30 mais

elevado que o relativo à

OBS1,

o que significa que a quantidade de comporta

:nento agressivo aumentou consideravelmente. Será que podemos dizer que

aumento da agressão foi provocado pela violência a que os sujeitos assisti

::'am?De facto, não podemos fazer essa atribuição uma vez que a relação que

=-quiaparece, e que supomos ser causal, pode ter outras explicações alterna ti

 as: as crianças podem ter-se tornado mais agressivas apenas como conse

~uência de estarem juntas acabando por se irritarem mutuamente, ou ficaram

de mau humor porque tinham fome ou sede e os experimentadores lhes de

:-ampouca comida ou bebida. Pode até acontecer que os diferentes observa

dores presentes na fase de pré e de pós-teste tenham utilizado critérios dife

:-entes de agressão. Sendo assim, e como não podemos excluir estas explica

.;ões alternativas, não podemos tirar uma conclusão definitiva sobre a causa

o aumento do número de comportamentos agressivos.

Qualquer pessoa que esteja familiarizada com as ciências naturais sabe

:-á que uma experiência bem conduzida deverá ser controlada de forma a mi

:1Ímizar os factores de contaminação. Para os controlar (e, assim, poder rejei

:ar as explicações alternativas), é necessário trabalhar com um

grupo de contro

Page 33: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 33/128

Page 34: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 34/128

·-\ .~ ÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

13

bs1

istribuição

aleatória

---- Não-Exp

Obs2

EXP1

bs2

istribuição

Obs3

EXP2

bs4

~Obss

EXP3

bs6

ão-exp

bse

bs1

EXP1+Abs2

istribuição

Obs3

EXP1+B

bs4

~ Obss

EXP2+A

bs6XP2+Bbse

rês tipos de planos experimentais

~::J.ono nosso exemplo, tendo mais frequentemente uma menor extensão.

É,

:2.0,

necessário utilizar testes estatísticos que permitam determinar a pro

.0ilidade dessa diferença ocorrer por acaso. Esses testes serão descritos nos

-:-:1ulos7 e 9.

Nesta investigação que imaginámos, cumprem-se os três critérios que

=:m.itemestabelecer a causalidade e, por isso, se de facto verificássemos que

~ ...;ffientona variável dependente tinha sido bastante maior para o grupo ex

.rmental do que para o grupo de controlo, poderíamos afirmar com uma

_~-iançaconsiderável que assistir à violência através da televisão tinha cau

: 0

mais agressão. Em primeiro lugar, verificámos a existência de uma reIa-

demonstrando que os sujeitos expostos à violência filmada exibiram

~ comportamentos agressivos do que aqueles que não assistiram. Em se

_ 1dougar, o facto de termos simultaneamente um grupo de controlo e uma

...5:ribuiçãoaleatória dos sujeitos pelos grupos permite-nos eliminar a hipó

. - da relação ser apenas espúria, uma vez que se houvesse outros factores a

os resultados, eles influenciariam de forma idêntica os dois grupos.

::: terceiro lugar, a ordem temporal das variáveis é demonstrada pelo au-

:ltO do comportamento agressivo após a exposição do grupo experimental

·colência na televisão. Como a variável independente é manipulada pelo

Page 35: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 35/128

Page 36: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 36/128

, > A,....-ALISEDE DADOS E O PROCESSO DE INVESTIGAÇÃO

 

Satisfação no trabalho

• I Produtividade

1 5 Uma relação entre duas variáveis

Satisfação no trabalho

Antiguidade na empresa

1 6 A relação será espúria?

Produtividade

Frequentemente, este tipo de plano de estudo é designado por

plano cor

onal para salientar a sua tendência para revelar relações entre variáveis e

alimitação no que diz respeito à possibilidade de estabelecer processos

;.ais.Precisamente porque neste tipo de investigação as variáveis não são

LÍpuladas(e muitas vezes não são susceptíveis de o ser) a possibilidade do

stigador determinar a causa e o efeito fica limitada. Vamos supor, por

lplo, que estamos a recolher dados sobre os níveis de satisfação com o

alhoe a produtividade dos operários de uma empresa. Podemos verifi

través das técnicas examinadas no capítulo 8, que existe uma forte asso

àoentre as duas variáveis, o que quer dizer que os trabalhadores que ma

tam níveis elevados de satisfação têm também altos valores de produti

de. Podemos, assim, dizer que existe uma associação entre as duas variá

ver figura 1.5),mas como já vimos, isto é apenas um primeiro passo para

monstraçãode que existe causalidade.

É

também necessário provar que a

ão não é espúria. Poderia acontecer que os trabalhadores mais antigos na

fossem, precisamente, os mais satisfeitos e os mais produtivos (ver figu-

6).Os métodos através dos quais se pode verificar a possibilidade da rela

er ou não ser espúria são analisados no capítulo 10.

No entanto, o terceiro obstáculo - estabelecer que a potencial causa

ede o potencial efeito - é extremamente difícil de superar. O problema é

Page 37: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 37/128

 

Satisfação no trabalho

Satisfação no trabalho I

ANÁLISE DE DADOS EM CIÊNCIAS soe

  Produtividade I

I

Produtividade

1.7

  uas possibilidades de interpretação causal de uma relação

roblema é através de uma reconstrução da ordem causal que se supi

ntre as variáveis. Muitas vezes, este processo de inferência pode se

É o que se passa, por exemplo, quando encontramos uma relaçã

aça e o número de anos de escolaridade e inferimos que a segunda

fecta a primeira. Contudo, este modelo de conexões causais prováve

rágil quando não é óbvio qual das variáveis afecta a outra, como é

igação entre satisfação e produtividade. Quando surgem estas dific

ode ser necessário incluir uma nova etapa de recolha de dados rela

esmos sujeitos de modo a verificar, por exemplo, se o impacto da S

om o trabalho na produtividade subsequente é maior que o impact

utividade na subsequente satisfação com o trabalho. Este tipo de p

ignado por

estu o e p inel

 Cramer, 1988),mas não é muito comum]

ias sociais. Neste livro, a discussão sobre investigação não experime

rar-se-á, essencialmente, nos planos correlacionais/inquéritos de

m que se recolhem, em simultâneo, dados sobre diferentes variávE

Os métodos relacionados com a possibilidade de fazer inferên

ais, tendo como base dados obtidos através de inquéritos, são analÜ

lO,

onde se aborda a análise multivariada das relações ent

eis. O aspecto principal a reter da discussão anterior é que a inferênc

exões causais entre variáveis pode ser feita, com maior facilidade, S

os perante dados provenientes de investigações em que se utilizou

o experimental, do que se dispusermos de resultados recolhidos a

m plano correlacional.

Page 38: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 38/128

A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO

 

são sintetizadas e pouco aprofundadas A hipótese foi confirmada: os

leitores do primeiro tipo de jornais têm urna probabilidade duas vezes

maior de responder correctamente a urna série de questões destinadas a

avaliar os seus conhecimentos de política O investigador conclui que os

diários de qualidade induzem maiores níveis de conhecimentos so-

bre política do que o segundo tipo de jornais Avalie este raciocínio

Page 39: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 39/128

Page 40: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 40/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

A maior vantagem de se utilizar um programa como o SPSSconsiste err

poder registar e analisar dados quantitativos de muitas formas diferentes e

com grande rapidez a partir do momento em que se adquire domínio sobre

programa. Por outras palavras ele será uma grande ajuda para o leitor livran-

do o das intermináveis horas gastas a registar dados e a fazer cálculos e d05

inevitáveis erros que geralmente se cometem durante essas operações. Vai

permitir lhe também a aplicação de técnicas estatísticas mais complexas e

frequentemente mais adequadas que de outro modo não se aventuraria a

usar.

Existe é claro uma forte desvantagem em usar programas de computa-

dor para analisar dados é que temos que aprender a trabalhar com eles

Contudo o tempo gasto nessa aprendizagem será muito menor do que o que

seria necessário para analisar os mesmos dados sem a sua ajuda. Acresce que

ao mesmo tempo que aprende a dominar o programa adquire uma série de

conhecimentos que lhe serão úteis num mundo em que a utilização de com-

putadores se vai tornando cada vez mais generalizada. A possibilidade de fa-

zer o mesmo com maior velocidade e menor esforço torna se também diverti-

da e frequentemente mais fácil do que se supôs no início.

Quando se procura aprender algo de novo é inevitável fazer erros que se

podem revelar frustrantes e desencorajadores. Inclusivamente pode pare-

cer nos que fazemos mais erros quando aprendemos a trabalhar com tur.

computador do que quando desempenhamos qualquer outra actividade. Iss

justifica se porque para que os programas de computador funcionem é neces-

sário que as instruções sejam dadas de um modo muito preciso e muitas vezes

de acordo com uma ordem específica. Esta forma de dar as ordens ao compu-

tador pode parecer nos menos óbvia do que a de concretizarmos outras acti-

vidades que realizamos no dia a dia.   importante notar no entanto que os

erros que eventualmente se façam durante a aprendizagem não danificam de

forma alguma o computador ou o programa.

Para conseguir fazer um número mínimo de erros é importante que

nesta fase se sigam exactamente as instruções enunciadas nos exemplos da-

dos neste e nos capítulos subsequentes respeitando os caracteres e os espaços

utilizados para cada ordem. Embora por vezes possam ocorrer falhas é na-

tural que os erros que vierem a surgir sejam resultado de algum engano do

leitor e não de um defeito da máquina ou do programa. O próprio programa

dir lhe á qual o erro cometido se a sua falha tiver sido cometida ao dar as ins-

Page 41: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 41/128

 -=.3.-\R DADOS COM O COMPUTADOR

 

- cheiro de dados

. ::::>

poder analisar os seus dados, necessita de criar um ficheiro onde

2--ão armazenados. Para ilustrar a maneira de criar esses ficheiros va

---:.un conjunto de dados fictícios que, hipoteticamente, foram recolhi

::-.~-:irde um questionário conhecido como Questionário do Trabalho.

':2.'::05

derivam de duas fontes: um questionário aos empregados que

.::=:na perguntas sobre eles próprios e um questionário aos superviso-

- :-~-pondem a questões sobre cada um dos empregados. As perguntas

=:: apresentadas no apêndice 2.1, no fim deste capítulo, e a codificação

:.açãoou dos dados recolhidos é ilustrada pelo quadro

2.1.

Neste es

,:=-,ectode análise era a pessoa, normalmente designada por

suj ito

pe

:::::::ugose por inquiri o pelos sociólogos. Apesar de se terem usado

;.~=::nplo dados recolhidos através de um questionário, é importante

~u SPSSe os procedimentos de análise de dados descritos neste livro

;:icar-se a outras formas de dados quantitativos, como sejam estatís-

~;:; ou medidas de observação.

o conjunto destes dados é relativamente grande, pode ser mais

..-;.~~:e

pedir a alguém experiente que os introduza num ficheiro apro

 = =

::alfor possível, basta criar um simples ficheiro de texto em formato

~ ~gla ASCII significa American Standard for Information Interchan

;::urmato é utilizado, frequentemente, para transferir informação de

_ ..::ador para outro. Uma vez realizada esta tarefa, o SPSS pode ler

. Se não conseguir aceder a ninguém que lhe crie um ficheiro des

_ 3e o conjunto de de dados for pequeno, pode ser mais fácil introdu

?::--amente no SPSS, numa janela chamada   t Editor. Tanto um

-:::;,roomo o outro serão discutidos no final deste capítulo.

T: endoa um simples ficheiro de texto, os dados são introduzidos

=~ definido por um grande número de linhas e, na maioria dos com

 t ::

~.?Or 80 colunas. Cada coluna em linha pode, apenas, comportar

ou seja, um único dígito. Os dados referentes à mesma variável

::~rroduzidzas na(s) mesma(s) coluna(s) e uma determinada linha

::-'-e:las,s dados relativos a um mesmo objecto de interesse ou

c so

~=:'......cnte, os casos são pessoas mas qualquer entidade de interesse

:::ia, a escola, o hospital, a região, ou o país - pode constituir um

:eresse.

cmais simples analisar dados que sejam representados só por nú

-._c lidar com uma mistura de números e de outros caracteres, como

:etras do alfabeto, todas as variáveis ou respostas ao questioná

Page 42: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 42/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

s dados do Questionário do Trabalho

6600 29 1O2

22

3O714600 26 5O

1

4

1

8

1

7800 40 54

41121

1

3O1

6400 46

15

1

23

4

2

8600 63

3613513O6000 54

31

1

4

4

1

16600 29

2

3332O7600 35 2

2

33

2

2

7600 33

4

3

1

412

25

2

3800 27

6

3

1

1

4

1

4200 29 421

2

5

3

2

38

1

O9 2

1

2

11

4313

4

18000 55

35

35

1

5

1

7000 29 131

312

O

1

8200 48 831

2

43

4511

5800 32 7323

422

4

1

6600 4814

1

2

2

5

1

513400 18 1

2

5

1

365000 28 2

43

3

4

37600 37

1

2

1411

3

O 43

6

4

,

3

4

267400 39 6

223

1

5

8000 53 5

4

31

532

6000 34

9

3

11

1

4

4

139

7000 43

17

11

24000 21 1

43

3

1

536200 5028

3

15

51

8

2400 31

92

5

1

21

452

O3600 3112

3

11

5

6

2

6400 5221

2

304400 5412

3

42922400 28

10

11

21

4

926600 50

23

33

33

5526000 5221

33

331

4

5000 4021433

2261

1800 19 1

212

 

3

3

1

7600 38

4

41

31

14

818000 6141

1212

2

4

35600 37 8

25

14

48

13400 3115

25

15

2

5000 4321

2

12O

1

3600 23

3

2

5

1

1

4

184000 27 51

11

451

1

95000 28 7313

2

3

9

3200

O

0

1

25

11

013400 18 123

 

330600 48

23

1

2383600 2910

14

1

41

4600 421015

4O

8200 5312

15

2

44

15200 3212

1

3323

1

3000 31

2

33511

89000 5519

33

3

313

O4800 26 8

41

3

3

12

32

7200 532214

1

21

O

5600 513133

11

8008

3316

Page 43: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 43/128

ANALISAR DADOS COM O COMPUTADOR

 

58

1

3800 488

1

2

1524

2

58 624

35

4I7

I74

57

3

2

233

4I4

78004202

214

3

321

4200

21

23

121

3

I22

O

2 12800 268

I

2

11

3

II4

3600462

51225

21000

9

13354

24200303

431

2

3

2

460029

22133I

5

01

3800

45

3

33

2

916000

53

05125

2

I23800 472251

1

possa ser posto em causa, tal como muitos conceitos das Ciências Sociais, elas

::orrespondem a um tipo de informação que, por vezes, é recolhido nos inqué

:::os e funcionam, aqui, como exemplo de uma variável nominal; ao longo do

lIVro, e para simplificar, passaremos a designar a primeira categoria apenas

por branco ). Sempre que possível, quando se constrói um questionário, é

aconselhável fazer corresponder números às várias respostas previsíveis

para que, depois de recolhidos, não seja preciso trabalhar os dados antes de

os dar a introduzir a outra pessoa. Antes de fazer cópias do questionário,

convém verificar sempre com a pessoa que vai lançar os dados se a cada

resposta foi, de facto, atribuído um número.

É também importante reservar um valor numérico para dados omissos,

ou seja, para as situações em que temos que registar uma resposta que é ambí

gua ou que não é suficientemente clara. Esse número não pode ser igual a

qualquer outro que tenha sido designado para codificar dados reais ou não

omissos. Por exemplo, se se utilizou os valores de 1a 5para representar as res

postas à questão sobre o grupo étnico de pertença, é necessário considerar um

número diferente para as respostas omissas. Neste questionário todos os da

dos omissos, excepto os referentes ao absentismo, foram codificados com um

Ouma vez que esse valor não pode ser confundido com os números escolhi

dos para corresponder aos dados reais. Como houve alguns empregados que

nunca estiveram ausentes do trabalho (i.e., cuja ausência é de Odias), as res

postas omissas a esta pergunta não poderiam ser representadas por um O .

Em vez disso, foram codificadas com 99 já que nenhum empregado se au

sentou por tanto tempo. Como veremos mais tarde, usar o O tem, ainda, a

vantagem de tornar mais fácil o processamento desses dados quando algu

mas variáveis similares são combinadas. Por vezes, poderá ser necessário dis

tinguir vários tipos de respostas omissas como, por exemplo, distinguir uma

Page 44: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 44/128

  ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

quando for necessário, ser mais fácil ter acesso a um determinado caso. Este

número de sujeito deve ser colocado nas primeiras colunas de cada linha.

Corno no nosso exemplo ternos apenas setenta sujeitos, basta-nos ocupar as

colunas 1e 2. Se tivéssemos 100 sujeitos já teríamos que utilizar as três primei

ras colunas para registar essa informação, urna vez que o número correspon

dente ao último sujeito seria constituído por três dígitos. Pode deixar-se

embora não seja necessário - um espaço em branco entre as colunas onde são

introduzidos dados correspondentes a diferentes variáveis.

De acordo com este formato, só precisamos de urna linha para registar

toda a informação sobre um sujeito; assim, essa linha fica reservada para ele e

os dados referentes ao próximo sujeito serão inscritos na linha seguinte. Se

para os dados referentes a cada inquirido forem necessárias mais do que urna

linha, as linhas ocupadas com a informação adicional devem ser as subse

quentes. Neste caso, pode haver vantagem em dar a cada urna das linhas

onde se encontram os dados de um mesmo sujeito, um número de identifica

ção que nos ajude a ler mais rapidamente a informação; chamaríamos, então,

à primeira linha número I, à segunda número 2 e assim por diante. Cada linha

de dados relativos a um sujeito é chamada, no SPSS, um registo recard .

A primeira variável do nosso questionário e do nosso ficheiro de dados

refere-se à origem racial ou étnica dos inquiridos. Corno ela só pode tornar um

de seis valores alternativos se incluirmos a possibilidade de eles não terem

respondido a esta questão), podemos colocar esta informação numa única co

luna. Se deixarmos um espaço entre os dois dígitos correspondentes ao nú

mero de identificação do sujeito e o dígito que representa o número do seu

grupo étnico de pertença, este último dado ficará inscrito na coluna 4. Sendo

também a segunda variável - o sexo - passível de ser codificada apenas

com um dígito, o seu valor será registado na coluna 6. Contudo, a terceira va

riável- rendimento bruto anual- requer que utilizemos cinco colunas para

o seu registo, urna vez que dois sujeitos o 47 e o 65) receberam mais do que

10,000 libras. Deste modo, os dados referentes a esta variável irão ocupar as

colunas 8 a 12, inclusive de notar que, ao introduzir os dados, a vírgula que

sinaliza o separador dos milhões e o símbolo que representa as libras não se

rão considerados).

Urna lista completa das variáveis e das colunas que elas ocupam é forne

cida no quadro 2.2. O ficheiro de dados é designado por

qtb d t

que é urna

abreviatura de questionário q) do trabalho t) dados dat) brutos b) . Corno

o SPSS aceita letras maiúsculas por exemplo, QTB.DAT) ou minúsculas

 qtb.dat) é mais simples usar as minúsculas. As restrições e convenções relati

vas ao formato destes nomes serão descritas posteriormente neste capítulo.

Page 45: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 45/128

ANALISAR DADOS COM O COMPUTADOR

2.2 Nomes e localização das variáveis do Questionário de Trabalho no SPSS

 5

da variável

de identificação

racial

ento Anual Bruto

ade na empresa

mento com a empresa

de satisfação no trabalho

1

2

3

4

de autonomia no trabalho

1

2

3

4

de rotina no trabalho

1

2

3

4

ça na reunião

Como ter acesso ao SPSS

Nome no SPSS

id

gpracial

sexo

rendim

idade

anos

envolv

satis1

satis2

satis3

satis4

autonom1

autonom2

autonom3

autonom4

rotina1

rotina2

rotina3

rotina4

reuniao

especial

produtiv

qualid

absent

Colunas em que se localiza

1 2

4

6

8 12

14-15

17 18

 

24

 6

 8

3

3

34

36

38

4

4

44

46

48

50

5

54-55

usar O SPSS, é necessário dispor de um computador pessoal. Um compu

r pessoal é constituído por um teclado através do qual se escrevem as ins

um rato, que fornece uma forma alternativa de movimentação no

e de selecção de instruções, e um monitor VDU) ou écran que permite

lizar aquilo que se digitou. Na medida em que a informação apresenta

cada momento, no monitor é, necessariamente, limitada, informação

onal pode ser obtida através da utilização apropriada do teclado ou do

Os computadores pessoais dispõem ainda, habitualmente, de uma im

sora que pode ser utilizada para imprimir informação guardada no com

Page 46: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 46/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

movimentação de um ponteiro, chamado cursor, cursar este que é operado

através de um teclado ou de um rato. O comando é efectivado pressionando a

tecla ente r ou o botão esquerdo do rato ou ainda, no sistema Windows 95 / 98,

seleccionando a opção next. A selecção de opções com o rato é, pois, mais fácil

do que através do teclado, na medida em que envolve movimentos simples.

Com o teclado, algumas opções são selecciona das através das teclas de cursor

apropriadas, enquanto outras são seleccionadas através da utilização de ou

tras teclas. As teclas de cursor encontram-se, habitualmente, localizadas no

lado direito do teclado, e possuem setas que indicam a direcção para a qual o

cursar é movimentado. Em resumo, o rato pode ser preferível para realizar

determinadas operações, enquanto que o teclado pode ser útil para outras.

Para aceder ao SPSSno ambiente Windows, basta seleccionar o botão .:gfâtf

no fundo do

écr n

o que abre a primeira coluna (ou menú) apresentado na ca

ixa 2.1. Seleccionar Programs neste menú, o que abre o segundo menú (colu

nas 2 e 3 da caixa 2.1). Note-se que, na maior parte dos computadores, estes

menús podem conter menos programas do que os mostrados na caixa 2.1.

~onrneService$:

ta

PUleVoice

ta s,••Up

@Jw~

O eudo .

f 10000000e

'i J

I_EI<I'I ••••

l~ Microsoft Acce<,

~ M 'o,.f'E><eeI

iIi ilM ,osoftO_

~M ,osoftP_

li

MictosoftW ••d

,ia MS.flOS F10mpl

i~

O_El<pIe

Illi S'~l'Iin

~W_EI<l'I<>

m

WIrlTun91

'.~ Wmip32

~ Mictosof tOff lCeT '

'1 ilI MÍCfooof, FrontPege

·:[ta EQSf ••

W_

@l

NortonAntlVlrus

ta QuickTine

'@l USRELf •• Win<:lowo95

ti

SPSS for Windows ~

. ,@J Tine Zooe Corwert ••

,ta QuickTine forWlrldow,

ta Net .cape Communical • •

)oiGa

D•.••

Caixa 2.1

A janela de abertura do Windows 95/98

Page 47: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 47/128

Page 48: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 48/128

 

ANÁL ISE DE DADOS EM CIÊNCIAS SOCIAIS

Caixa 4

A caixa de diálogo Select Cases

for Windows, que abre sobre o Data Editor cada vez que se acede ao SPSS,

pode ser eliminada seleccionando Don t show this dialog in the future no

fundo desta caixa de diálogo. Em opção, e de forma a introduzir dados direc

tamente nas células do Data Editor, podemos seleccionar Cancel.

No topo da janela do Data Editor encontram-se os nomes de diferentes

procedimentos, tais como File, Edit, ete. Para verificar o conteúdo destes pro

cedimentos basta mover o cursor para uma destas opções e pressionar uma

vez o botão esquerdo do rato. Um menu

  rop own

aparecerá, tal como exem

plificado na caixa 2.3 para a opção Data. Para ver as restantes opções, basta

deslocar o cursor até elas.

As opções dos menús   rop own seguidas de reticências ... ), tal como

na opção Select Cases ... , indicam que uma caixa de diálogo aparecerá uma

vez selecionada a opção. Por exemplo, se seleccionarmos a opção Select Ca

ses ... , surgirá uma caixa de diálogo com o mesmo nome ver caixa 2.4).

Note-se que este procedimento é conseguido uma vez que alguns dados te

nham sido introduzidos no Data Editor. Para remover esta caixa de diálogo,

carregar no botão Cancel.

A ponta de uma seta apontando para a direita ~) seguida de uma opção,

tal como acontece no procedimento Merge Files, indica que, após selecciona

do, aparecerá um submenu à direita tal como mostrado na caixa 2.8). Uma

Page 49: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 49/128

ANALISAR DADOS COM O COMPUTADOR

 

:- ão sem qualquer tipo de sinais significa que não aparecerão novos menus

  ::>rJ down para seleccionar.

Ainda imediatamente abaixo destas opções existe uma barra de ferra

::-.entas com botões. Estes permitem a realização de procedimentos sem ter

~e passar pela selecção de menus e opções. As funções destes botões são

::-.ostradas colocando o rato sobre cada um deles aparecerá uma caixa amare

...2. e uma descrição da função no seu interior. Esta descrição surge, também, no

:-.:ndo do écran Assim, por exemplo, o primeiro botão diz respeito à opção

Open File. Podem adicionar-se mais botões a esta barra. A opção Help des

=:ra nas pp. 40-41) fornece instruções para realizar este procedimento.

A introdução e edição de dados no Data Editor

-. Íorma mais simples de introduzir dados no SPSS será a de inscreve-los di

=- ,,--tamentea matriz de colunas e de linhas numeradas da janela do Data

~ditor, apresentada na caixa 2.2. Note-se que, neste caso, cada coluna pode

,::mter mais do que um dígito. Quando se acede ao SPSS, o curso r encontra-se

:-2. célula correspondente à primeira linha da primeira coluna. O contorno

::;?stacélula é apresentado a negrito de forma a evidenciar que esta se encon

::-aactiva. Para introduzir um valor em qualquer das células será necessário,

==n

primeiro lugar, torná-las activas movendo as teclas de cursor ou o rato ins

::-evendo, de seguida, o valor e, por último, deslocando o cursor para outra

:;?:ula em que se deseje repetir esta operação. As colunas são consecutiva

::-,ente numeradas uma vez introduzido um valor. Assim, se introduzirmos

  ::: número na quinta coluna, as colunas 1 a 5 serão númeradas varOOOOla

arOOOOS.ara modificar um valor já introduzido, deslocar o curso r para a cé

. : :aque contém o valor a modificar e introduzir o novo valor. Se quisermos

::::ixaruma célula em branco, basta remover o valor com a tecla Backspace ou

;:}elete emover o cursar para outra célula. Na célula em branco deverá, agora,

=gurar um ponto .), o que denota a presença de um valor omisso.

Nomear variáveis no Data Editor

?:rra dar um nome a uma variável no Data Editor, seleccionamos Variable

lew no canto inferior esquerdo da janela. De seguida, e sob a coluna Name,

_scolhemos a linha onde queremos introduzir o nome da variável por exem

:-;0, e tal como apresentado na caixa 2.5, gpracial na primeira linha).

Page 50: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 50/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

 aixa

2.5

  j nel

Variable View do ata Editor

Os

nomes no SPSS

Os nomes usados para designar ficheiros de dados ou quaisquer variáveis

no SPSS têm que estar de acordo com determinadas condições. Não podem

ser formados por mais do que oito caracteres e é preciso que comecem com

uma letra (A-Z). Os restantes caracteres permitidos podem ser letras, núme

ros, pontos,@, ou_.2Nãoépermitido, também, deixar espaços em branco e

os nomes não devem terminar com um ponto nem, de preferência, com _.

Adicionalmente, algumas palavras, as chamadas palavras-chave

 key-

words ,

não podem ser utilizadas porque poderiam ser interpretadas pelo

SPSS como se fossem comandos. Por exemplo, estão nesta situação palavras

como

  somar ,  n e   ny  qualquer , or  ou

e

to  a .

Se se utilizar, aci

dentalmente, uma dessas palavras como nome, o programa avisar-nos-á

que se trata de um procedimento inválido. Nenhuma das palavras-chave in

clui números, o que significa que um nome de variável que contenha núme

ros será sempre reconhecido como tal. É importante lembrar que não se

2 Os nomes de variáveis não podem incluir caracteres portugueses como o ç ou o ã .

 N. do T.

Page 51: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 51/128

ANALISAR DADOS COM O COMPUTADOR

 

?ode utilizar o mesmo nome para designar variáveis ou ficheiros diferentes.

_\ssim, não é possível usar a palavra satis para referir as quatro questões re

~ativas à satisfação no trabalho, mas deve-se diferenciá-las de alguma forma,

?odendo, por exemplo, acrescentar o número da pergunta. Nesse caso, o

:1ome das variáveis seria satisl, para a resposta à primeira questão, satis2,

?ara a resposta à segunda, e assim por diante. Os nomes do SPSS dados às va

:iáveis do questionário de trabalho são apresentados no quadro 2.2.

A definição de outros aspectos das variáveis no Data Editor

Para além do seu nome, podemos definir nove tipos de características das va

riáveis presentes no Data Editor. Estas características encontram-se listadas

nas colunas da matriz de dados e variam entre o tipo de variável Type à es

querda e o seu nível de mensuração Measure à direita. Na medida em que

pode não ser possível ver todas estas características de uma só vez no moni

ror, podemos modificar a largura de cada coluna seleccionando a linha adja

cente ao seu nome e colocando-a na posição desejada, tal como fizemos na

caixa 2.5.

As definições previamente existentes à criação de uma base de dados no

SPSSencontram-se apresentadas e são conhecidas como as opções por defei

to. Se desejarmos modificar quaisquer destas definições, podemos seleccio

nar a linha e coluna apropriada e proceder às alterações desejadas. De uma

forma geral, e para aquilo que nos interessa neste momento, a definição mais

importante a alterar é a relativa aos dados omissos Missing values .

A definição de dados omissos missing values

No questionário do Trabalho, existem valores omissos para as avriáveis

rendim casos 12 e 21 , idade caso 45 , satisl casos 1e 2 , satis2 caso 2 ,

produtiv caso 1 e absent caso 31 Assim, teremos que especificar os va

lores omissos apropriados para estas variáveis, e que são

O

para as primei

ras cinco rendim, idade, satisl, satis 2 e produtiv e 99 para a sexta variá

vel absent . Para realizar esta operação, basta seleccionar, no Variable

View do Data Editor, a linha apropriada da coluna Missing, seguida da se

lecção da elipse ou das reticências que aparecem nessa célula. Este último

comando abre a caixa de diálogo Missing Values apresentada na caixa 2.6.

Para as nossas variáveis, escolhemos a opção Discrete Missing Values, in

Page 52: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 52/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Missing Values   il J

No missing values

ío:l Qiscrete missing values

I~

 1

Caixa 2 6

A caixa de diálogo Missing values

Se os dados foram introduzidos por outra pessoa, será conveniente

dar-lhe a conhecer a forma como planeámos a codificação dos dados omissos.

A definição de casas decimais

o

número de casas decimais definidas por defeito pelo SPSSé de duas. Para a

maior parte das utilizações, é mais fácil codificar as variáveis através de nú

meros, tal como fizemos para o Questionário do Trabalho. Como todas os va

lores destas variáveis assumem números inteiros, poderíamos alterar o nú

mero de casas décimais de 2 para Ona coluna DecimaIs da janela Variable

View. Para tal, bastaria seleccionar a linha correspondente a esta coluna uma

linha de cada vez e pressionar o botão com a seta apontando para baixo até

surigir o valor O.

A definição de etiquetas das variáveis e dos seus valores value labels

Os nomes das variáveis no SPSSsão restringidos a 8caracteres, oque significa que,

a maior parte das vezes, teremos que os alterar, tomando o seu significado menos

claro. Usando esta opção, podemos criar etiquetas labels das variáveis que apa

recerão no output. Estas etiquetas podem ser bastante extensas, ainda que a maior

parte dos outputs não as apresentem. Por exemplo, a variável do SPSS gpracial

pode ser etiquetada grupo racial. Para realizar esta operação, introduzimos, na ja

nela Variable View, aquela etiqueta na primeira linha da coluna Labels. Desta for

ma, o nome completo da variável será apresentado nas caixas de diálogo em que

exista listagem de variáveis por exemplo, ver caixa 2.12 , seguido do seu nome

Page 53: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 53/128

.-\.. lALISAR DADOS COM O COMPUTADOR

33

-. alue Labelss;;;;;;7=.

1

=

 Branco

2 = Asiático

3 = Indiano

4

=

 Africano

A caixa de diálogo Value labels

Podemos, também, etiquetar os valores de uma dada variável, esco

_- endo a linha apropriada na coluna Values (por exemplo, gpracial), seguido

 :a selecção da elipse, ou das reticências, presentes nessa célula. Este procedi

=:ento faz abrir a caixa de diálogo Value Labels apresentada na caixa 2.7. De

:-ois, basta escrever o valor (por exemplo, 1) na caixa designada Value:, a eti

~:leta (por exemplo, branco) na caixa designada Value Label: e seleccionar

Add. As etiquetas dos valores de uma variável podem conter até 60 caracte

:-.:s,ainda que a maior parte dos outputs não os mostrem na íntegra. Para re

:::lOveruma determinada etiqueta basta seleccioná-la e escolher Remove.

?ara modificar uma etiqueta, teremos que seleccioná-la, introduzir as altera

;ões desejadas e escolher Change. Terminadas estas operações, pressiona

::lOSOK para fechar a caixa de diálogo Value Labels.

  definição do form to e linh mento d s colun s

 =: pouco provável que desejemos modificar a largura de uma coluna do Data

Editor. Contudo, se o quisermos fazer basta seleccionar a linha apropriada na

:oluna Columns e pressionar o botão com as setas apontando para cima e

?ara baixo até obter o valor desejado. Se pretendermos alterar o alinhamento

;:iosdados numa determinada coluna, teremos que seleccionar a linha apro

?riada na coluna Align, pressionar a seta apontando para baixo seguida de

-..unadas duas opções que aparecem na sequência desta operação.

Definir variáveis consecutivas em simultâneo

Sedesejarmos definir o mesmo formato para variáveis consecutivas (como por

exemplo, satis1 a rotina4), teremos que definir a primeira variável ( satis1),

Page 54: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 54/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

opiar esta linha, seleccionar as linhas subsequentes a modificar (9 a 19), selec

ionar Paste ou Paste Variables ... e renome ar as variáveis de acordo com o

u nome original.

Guardar

os

dados no ata ditor

uando pretendemos encerrar uma sessão de trabalho no SPSS, ou utilizar

utra base de dados numa mesma sessão, devemos guardar os dados, ou

ualquer alteração que tenhamos operado sobre os mesmos, num ficheiro.

odemos, portanto, gravar este ficheiro no disco rígido do computador. Con

do, se outras pessoas utilizam este equipamento podem, inadvertidamen

, apagar o nosso trabalho. Mesmo que mais ninguém utilize o computador,

sempre conveniente fazer uma cópia de segurança do nosso ficheiro numa

u mais disquetes formatadas. Adisquete é, normalmente, inserida numa dri-

do computador.

Para que o ficheiro seja identificável, é necessário dar-lhe um nome. O

ome de um ficheiro consiste de uma prefixo com o máximo de oito caracte

s, seguido de um ponto e de um sufixo (ou extensão) com três caracteres. O

ome do ficheiro refere-se, usualmente, ao seu conteúdo (tal como no nosso

 lar

View ºal3LIranslorfl _~naiYzeJàraphs

•.-1ia J iiia

-Dsta ...

fulntax. ..

QutpuL

SJ;<ripl

Olher .

Untilled - SPSS Data Editor

S~itch Server...

RecenUyUsed Da a •.

Recently Used files •.

Ej it

Page 55: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 55/128

ANALISAR DADOS COM O COMPUTADOR

: Save Data As 6 EJ

35

GjJaldar em: IGi Disquele de 3li (A:)

_orne do ficheiro:

Guardalcorno ipo: SPSS ( .sav)

qúardaít

:eã Siew~

Cãncelar

k.

::aixa 2.9

A caixa de diálogo Save Data As

:.asoqtb refere-se a questionário de trabalho - dados brutos), enquanto que o

:-.orneda extensão refere-se ao tipo de ficheiro. Os ficheiros criados no Data

Editor possuem, por defeito, uma extensão sav. Assim, o nosso ficheiro de da

 : ospode tomar o nome de qtb.sav. Nos sistemas operativos mais recentes, as

~·,tensões aparecem representadas sob a forma de símbolos e não de nomes

:al como mostrado na caixa 2.10).

Ao longo desta obra, vamos utilizar uma notação particular para des

:::-everos passos envolvidos num procedimento do SPSS. A selecção de um

-;asso ou de uma opção será indicada por uma seta apontando para a direi-

-2. ?,o que indica as opções dos menus ou caixas de diálogo a serem esco-

_---:idas.Todas as explicações adicionais aos procedimentos serão introdu

.::das entre parêntesis rectos. Os passos referentes a uma caixa de diálogo,

::1 a uma subcaixa de diálogo que é uma caixa que só pode ser acedida

=?Ós ter sido aberta uma caixa de diálogo principal) começam numa linha

- .)\Oa.A totalidade da sequência de procedimentos será identada. Assim, a

- ;)tação dos procedimentos para gravar o ficheiro que referimos anterior-

::-.ente numa disquete introduzi da na drive A é:

? File [apresentado na caixa 2.8] ? Save As ... [abre a caixa de diálogo

Page 56: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 56/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Nome do ficheiro: [qtb

Ficheiros do ipo:

I5Ps

5 [ .sav J

Caixa 2.10 A caixa de diálogo Open File

 ~ii ~ ~ l

l'

Eailte'

Recuperar um ficheiro guardado no Data Editor

Se quisermos recuperar o ficheiro anterior numa fase posterior, vamos utili

zar o procedimento seguinte:

~ File ~ Open Data [abre a caixa de diálogo Open File apresentada na

caixa 2.10f

escrever a:\qtb.sav na caixa situada ao lado de File name: ~ Open

Abrir um ficheiro de dados em ASCII no Data Editor

Se os dados foram guardados numa disquete sob a forma de um ficheiro

ASCII chamado qtb.dat, então teremos que seguir o procedimento seguinte

para abrir este ficheiro no Data Editor:

~ File ~ Read Text Data ... [abre a caixa de diálogo Open File apresen

tada na caixa 2.10]

3 Esta instrução está omissa no original. Contudo, como o leitor pode verificar, o procedi-

mento File seguido de Open exige a escolha de uma opção adicional, isto é, a opção

entre abrir um ficheiro de dados (Data), de sintaxe (Sinta x), de resultados (Output), ete.

 N do R

Page 57: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 57/128

ANALISAR DADOS COM O COMPUTADOR

 el

Imporl Wrzard - Slep 1 016

Welcome lo lhe texl impor l wizard

T

hís wizerd wili help you read dale f omyour lexl file end

specify informálion ebout lhe variables.

oes your text fi le match e predefined formei?

CJYes

37

Textfile:

O

I

~~ 66 29 4 3422422223223

2 46 26 52 2322 23444 344

3 78 4 5442452 222 23 434

4 64 46 522 22 22232232334

~

:aixa 2.11 A caixa de diálogo Tex Impor Wizard

Help

escrever a:\qtb.dat na caixa situada ao lado de File name: ~ Open

[abre a caixa de diálogo Text Import Wizard Step 1 of 6apresentada na

caixa 2.11]

~ Next> [abre a caixa de diálogo Text Import Wizard Step 2 of 6]

~ Fixed width ~ Next> [abre a caixa de diálogo Text Import Wizard-

Step 3 of 6]

~ Next> [abre a caixa de diálogo Text Import Wizard Step 4 of 6]

~ Next> [abre a caixa de diálogo Text Import Wizard Step 5 of 6]

~ Next> [abre a caixa de diálogo Text Import Wizard Step 6 of 6]

~ Finish [fecha a caixa de diálogo Text Import Wizard Step 6 of 6 e

apresenta os dados no Data View]

~ Variable View [para definir os dados]

Procedimentos estatísticos

=;.epoisde termos introduzido os dados no Data Editor estamos preparados

Page 58: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 58/128

38

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

~Descriplives

E

<t> gpracial

<t> sexo

<t> rendim

<t>

anos

<iI )

envolv

<t> satis1

<t> satis2

/ L~atis3

Save standardged values as variables

aixa 2.12 A caixa de diálogo Descriptives

uadro 2.3 O  ut ut do comando Descritptives

Descriptive Statistics

)

IDADE

69

8

3

12,32

9

ue calcule a idade média  mean da amostra. Podíamos fazê-lo a partir de vá

ios comandos do programa mas vamos usar apenas o que aparece com o

ome de Descriptives Satistics estatísticas descritivas). Este fornece-nos,

ambém, acesso a outras estatísticas descritivas da variável. O procedimento

ara realizar este comando é:

~ Analyze 7 Descriptive Statistics ~ Descriptives ... [abre a caixa de

diálogo Descriptives apresenada na caixa 2.12]

~ variável [por exemplo, idade; note-se que as variáveis encontram-se

listadas por ordem no Data Editor]

~~[botão] [coloca a variável seleccionada na caixa abaixo de Varia

ble[s]:] ~ OK

Page 59: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 59/128

· - ALISAR DADOS COM O COMPUTADOR

 

escriplives: Options

D

Help

rlSke~ness

r~~um

_Minimum

C.Ma] imum

riS.&.. mean

.:1ean

rsion

-spla , Order

• VariaQle list

êlphabetic

As.Qending means

Qescending means

: xa 2 13 A subcaixa de diálogo Descriptive: Options

adro 2 4 O

ou pu Mean Descriptive

Descriptive Statistics

IDADE

  alid

N

3:atísticas descritivas foram calculadas. Se olharmos para as idades do Qu

:õ:ionáriode Trabalho, podemos confirmar que a idade mínima é, de facto, 18

:'.os(caso número 1),enquanto que a idade máxima é de 63 anos (caso núme

= 3). Devemos notar, também, que a idade de um dos respondentes (caso nú

-.ero45) é omissa, o que faz com que o número total de dados válidos para

3,avariável seja 69 e não 70.

Como se pode observar no quadro 2.3, o

output

apresentado na janela

ewer é sempre precedido pelo nome do procedimento estatístico realizado.

,) presente caso, o procedimento que utilizámos foi o Descriptive. Por ra

~€sde espaço de edição, os

outputs

que apresentaremos ao longo desta obra

o

contêm este tipo de títulos.

Page 60: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 60/128

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

?re:emiessemos obter, apenas, a média das idades da nossa amos

ra sem as :-e::. i:ch .tesstatísticas, poderíamos proceder do seguinte modo: se

eccionar Options ... na caixa de diálogo Descriptive: Options apresent~a

a caixa 2.13. Depois, remover a selecção Std. deviation, Minimum e Maxl

um, ffim e: .cio o cursor para as caixas adjacentes a cada uma destas opções.

Oll pl ; corre:,,-pondente a este procedimento é apresentado no quadro 2.4.

Se ::ecessitarmos de voltar ao Data Editor, podemos optar por um de

ois procedimentos: seleccionar qtb-S ... no fundo do écran ou a opção Win

ow segmeia de 1 qtb-SPSS Data Editor do menú drop down Se uma opera

ão do SPSS ioi começa da e não concluída (por exemplo, se todas as caixas de

iálogo r~-peitantes a uma dada operação não foram encerradas), não será

ossí,,:,el percorrer o conteúdo da janela Viewer.

Guardar e imprimir o Output

ara imprimir o conteúdo de uma janela, basta torná-la activa e executar a se

ência seguinte:

~ File ~ Print ... ~ OK

e quisermos guardar os conteúdo de uma janela numa disquete, podemos

eguir os passos seguintes:

~ File ~ Save As ~ janela [abre-se a caixa de diálogo Save As]

~ identificar a drive e nomear o ficheiro na caixa ao lado de File name:

[por exemplo, a:\qtb.spo] ~ Save

nome, por defeito, das extensões dos ficheiros de output é spo, ou seja, a

breviatura de ficheiro spss

output

Estes ficheiros podem ser editados antes

e serem gravados: por exemplo, pode desejar apagar-se determinadas análi

es ou escrever comentários adicionais às análises efectuadas.

Sistema de ajuda

SPSS possui um sistema de ajuda que pode ser muito útil para evitar o re

urso constante a um livro como o presente, ou ao manual do programa.

omo este sistema foi concebido para ser auto-explicativo, o leitor deverá

er capaz de o utilizar depois de adquirida alguma experiência. Para obter

Page 61: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 61/128

..•..'\lALISAR DADOS COM O COMPUTADOR

' '

. ' ..

.

 

.

.::I

ue

 O..C1:> _odor como, polel<et' llpio, índice remissivo',

'1\

'

 

• Tliorials

• Dist,;buted Analysis

Data management

• 5 tatistical anal}lsis

• Graphical analysis

• Inleractive charts

Output management

Saving Files

•• Printing Files

.:::.

l~~:~~:e~~r~~~~~o,~ ..__

  l

fj

Alíi1r

1I1' ~~llr~1

2.14 A caixa de diálogo Help Topics Content

41

~ Help ~ Topics [abre a janela Help Topics Contents apresentada na

caixa 2.14]

~ Find [abre a janela Help Topics Find apresentada na caixa 2.15] ~ na

primeira caixa escrever o termo a pesquisar, ou o mais próximo possível

do desejado [por exemplo, file] ~ Select some matching topics to nar

row your search [por exemplo, File] ~ Click a topic, then click Display

[por exemplo, Open file] ~ Display [abre a caixa de informação Help

apresentada na caixa 2.16]

~ ? [para minirnizar (Minimise) ou fechar (Close) o sistema de ajuda]

::ecessitarmos de ajuda enquanto se trabalha numa caixa de diálogo, selec

_:.ar a opção Help nessa mesma caixa.

Terminar uma sessão de trabalho no SPSS

-==. terminar uma sessão no SPSS, seleccionar File seguido de Exit. Se tive-

Page 62: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 62/128

42

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Lõcaizar

I

~ CiQua num tópico e, em seguida. sobre tAoollar

Add Cases

Add Cases 01Variables: Rename

Add Cases: Dictionary Information

Add Files Command Synla.

Add Variables

AJJding T\,xt

 Jmpor

~u

 

ftecoristruit.u

 111X

/

Caixa 2.15

A caixa de diálogo Help Topics Find

Opens lhe selected data file.

O nl~ one dala file can be open ai a lime. T he current dala

file is aulomaticall~ c10sed when a new dala file is opened.

If ~ou wanllo have mulliple data files open ai lhe same

time ~ou can starl mulliple sessions.

Click See Also above for addilional information on

opening data files.

Caixa 2.16

A caixa de informação Help

não existir nenhum ficheiro já previamente gravado). O leitor deve notar bem

Page 63: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 63/128

ANALISAR DADOS COM O COMPUTADOR

Exercícios

 

Você pretende recolher informação sobre as preferências religiosas dos

seus inquiridos e lembrou-se das seguintes alternativas: agnóstico,

ateu, budista, católico, hindu, judeu, muçulmano, protestante e taoísta.

Que outra categoria deveria ainda ser incluída?

Você pretende gravar esta informação num ficheiro de dados, para ficar

armazenada num computador. Como deveria codificá-la?

Depois de ter os questionários preenchidos, você repara que num deles

o sujeito não respondeu a esta pergunta. Quando introduzir os dados no

ficheiro de dados, como é que vai referir este facto?

Suponha que um outro sujeito assinalou duas categorias em vez de uma

só. O que faria nesta situação?

Os primeiros dois sujeitos da sua amostra de cinquenta descrevem-se

como agnósticos e os dois seguintes como ateus. As idades destes sujei

tos são, respectivamente, 25, 47, 33 e 18. Como escreveria esta informa

ção no ficheiro de dados?

Quantas colunas de um ficheiro ASCII são necessárias para codificar as

respostas dos sujeitos à pergunta sobre a sua filiação religiosa, se todas

as opções tiverem sido escolhidas pelo menos uma vez?

Como é que o SPSS sabe o que representam os diferentes números que

constituem o ficheiro de dados?

Em cada linha, qual o número de colunas disponível para colocar dados

ou comandos que existe na maior parte dos computadores?

Qual o número máximo de caracteres que podem ser usados para desig

nar uma variável no SPSS?

Apêndice 2 Questionário do Trabalho

 uestionário aos mpregados

.stequestionário foi construído para estudar alguns factos sobre si e sobre o

u trabalho. Por favor, responda com sinceridade. Não existem respostas

rtas ou erradas.

Código

Coluna

Page 64: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 64/128

  ANÁLISE DE DADOS EM CJ~NCJAS SOCIAIS

--Indiano 3

-- Africano 4

--outro 5

ual o seu sexo? 6

-- Masculino 1

-- Feminino 2

Actualmente, qual é o seu rendimento anual bruto antes dos descontos

e impostos ?

-€ 8-12

Quantos anos tem?

--anos 14-15

Há quantos anos trabalha nesta empresa?

--anos 17-18

Por favor, indique em relação a cada uma das afirmações seguintes se 1

discorda totalmente, 2 discorda, 3 está indeciso, 4 concorda, ou 5

concorda totalmente. Para cada afirmação, assinale só uma resposta.

 a Não deixaria esta empresa mesmo

que pudesse ganhar um pouco mais noutra

 1 2 3 4 5 20

 b Para mim, o meu emprego é como

um o y  1 2 3 4 5 22

 c A maior parte das vezes tenho

que meforçar a ir para o trabalho  1 2 3 4 5 24

 d Quase todos os dias me sinto entusiasmado

como meu trabalho  1 2 3 4 5 26

 e O meu trabalho émuito desinteressante

 1 2 3 4 5 28

 f Tenho autorização para executar

o meu trabalho da forma que me

parecer melhor  1 2 3 4 5 30

 g Posso tomar decisões sobre a forma

de executar omeu trabalho  1 2 3 4 5 32

 h Na secção da empresa onde estou inserido,

as pessoas podem executar o seu trabalho

da forma que mais lhes agradar

 1 2 3 4 5 34

 i Se eu quiser fazer uma pequena alteração

na minha forma de trabalhar, não preciso

deconsultarosupervisor

 1 2 3 4 5 36

 j

Faço o meu trabalho praticamente

Page 65: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 65/128

ANALISAR DADOS COM O COMPUTADOR

Estevepresente na reunião da empresa, estemês?

--sim 1

--não 2

 uestionário ao upervisor

45

46

::car-lhe-ía grato se pudesse responder às perguntas que se seguem sobre

~a das pessoas cujo trabalho supervisiona:

_;ome do Empregado.

Por favor, descreva o nível de especialização que lhe parece

exigir o trabalho que essa pessoa desempenha.

Qual das seguintes descrições seria mais adequada?

 Assinale uma das alternativas

-- não especializado 1

-- semi-especializado 2

-- bastante especializado 3

-- muito especializado

Como classificaria a sua produtividade? Assinale uma das

alternativas

-- muito fraca 1

--fraca 2

--Média 3

--Boa 4

Muito boa 5

Como classificariaa qualidade do trabalho dele a ?

 Assinaleuma das alternativas

-- muito fraca 1

--fraca 2

--Média 3

--boa 4

muito boa 5

Nos últimos doze meses,quantos dias ele a faltou?--dias

48

4

50

 

54-55

Page 66: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 66/128

Capítulo 3

ANALISAR DADOS COM O COMPUTADOR

Dominar melhor o SPSS para Windows

-_gora que já sabe como se cria um ficheiro de comandos para o SPSS, pode

apresentar-lhe outros procedimentos que lhe podem vir a ser muito

.::eis Estes procedimentos permitir-lhe-ão fazer o seguinte: seleccionar casos

-pecíficos por exemplo, os homens brancos com menos de 40 anos), para fa

er análises separadas; criar novas variáveis por exemplo, a classificação

..lffia escala de atitudes ou de personalidade) e novos ficheiros de dados

?ara as guardar); criar descrições mais completas das variáveis; e

• Select Cases

S

Page 67: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 67/128

 

1 >

gpracial

1 >~

1 >

rendim

1 >

idade

~anos

~envolv

1 >satis

1 >

satis2

< >

satis3

.~ satis4

· to

autonom

.:;jp autonom2

A~

aixa 3.2

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

A subcaixa de diálogo Selecl Cases: 11

crescentar comentários que lhe permitam recordar aquilo que já fez. O SPSS

ode também executar operações que não são descritas neste livro, como seja

ombinar ficheiros de diversas maneiras. Se precisar de utilizar operações

ue não sejam mencionadas neste livro, deverá consultar o menu Help aju

a) ou o Guia do SPSS.

Seleccionar casos

ara seleccionar casos com determinadas características, usa-se o menu Data

a opção Select cases ... , o que abrirá uma caixa de diálogo Select Cases se

ccionar casos) tal como pode ser observado na caixa 3.1. Se quiser descobrir,

or exemplo, a idade média dos homens da amostra que respondeu ao Ques

onário do Trabalho, deverá seleccionar If condition is satisfied se a condi

o for satisfeita), seguido de If, o que abrirá a subcaixa de diálogo Select ca

s: If seleccionar casos: se) apresentada na caixa 3.2. Na caixa em branco de

erá introduzir as condições que deseja que os seus dados satisfaçam para se

m seleccionados. De acordo com o nosso exemplo, vamos introduzir a con

ição sexo

=

1, na medida em que, na base de dados, os homens foram codifi

dos com o número 1. De seguida, seleccionamos Continue continuar) de

rma a fechar a subcaixa de diálogo Select cases: If, e OK para fechar a caixa

e diálogo Select Cases.

Para calcular a média de idades dos homens da amostra, vamos proce

Page 68: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 68/128

ANALISAR DADOS COM O COMPUTADOR

uadro 3 Idade média dos sujeitos do sexo masculino do Questionário de Trabalho

Descriptive Statistics

 

IDADE

Valid N

7 idade 7~ [botão] 7 Options [abre a subcaixa de diálogo Descripti

ve: Options apresentada na caixa 2.13]

Std.deviation [para remover a selecção] 7 Minimum 7 Maximum

7 Continue

  K

resultado deste procedimento é apresentado no quadro 3.1.

A selecção dos casos mantém-se activa até ser dada uma instrução para

terminar. Se se pretender levar a cabo análises estatísticas com a totalidade

a amostra ou, somente, com mulheres, deve alterar-se a selecção dos casos.

ara realizar análises com a totalidade da amostra deve seleccionar-se All ca

s na caixa de diálogo Select Cases ; se se desejar, apenas, utilizar sujeitos

o sexo feminino deve introduzir-se a condição sexo = 2 na subcaixa de diálo

o Select cases: If.

Operadores relacionais

m operador relacional como =  igual compara o valor à sua esquerda por

xemplo, sexo com o da sua direita por exemplo, 1 . Há seis operadores rela

ionais que podem ser representados pelos símbolos que se seguem:

igual a equal to

não igual a not equal to

menor que less than

menor ou igual a less than or equal to

maior que greater than

= maior ou igual a greater than or equal to

Page 69: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 69/128

Page 70: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 70/128

..••..ALISAR DADOS COM O COMPUTADOR  

Uma outra forma de fazer esta escolha de sujeitos entre os 30 e os 40 anos

  e idade inclusive, consiste em utilizar a função lógica range

 amplitude ,

em

?e será seleccionado qualquer caso em que a variável idade apresente um

alor dentro desse intervalo de idades:

~ge(age,30,40)

Recodificar os valores das variáveis

Por vezes, é necessário mudar ou recodificar os valores de algumas variáveis.

_~sim, por exemplo, é recomendável que a-construção das questões que vão

servir para criar uma escala, um índice ou uma medida composta que varie

 ::eforma a que as pessoas que respondam sim a todas as perguntas ou, pelo

-ontrário, não a todas, não tenham um valor extremo. Repare-se, por exem

?lo, que construímos duas das quatro questões destinadas à avaliação da sa

:isfação no trabalho no Questionário do Trabalho - pergunta 6c ( A maior

?arte das vezes, tenho que me forçar a ir para o trabalho ) e pergunta 6e

( 0

~eu trabalho é muito desinteressante ) - na direcção oposta das outras duas

- pergunta 6b ( Para mim, o meu emprego é como um

hobby

e pergunta 6d

 Quase todos os dias sinto-me entusiasmado com o meu trabalho ). A res

?osta a estas questões é dada numa escala de cinco pontos que vai desde 1

 discorda totalmente ) até 5 ( concorda totalmente ). Poderíamos inverter a

escala para os itens 6c e 6e, mas talvez os sujeitos percebessem o que nós pre

tendíamos. Assim, é mais simples inverter os códigos quando se analisam os

dados. Se quisermos que a um resultado mais elevado corresponda uma

maior satisfação no trabalho, deveremos recodificar as respostas destes dois

itens, de modo a que o 1 seja o 5, o 2 seja o 4, o 4 seja o 2 e o 5 seja o 1. Para o

• Recode inlo D.f1erenl Vaflables

Ei

,o ......v__ ;

satis2 u> rsatis2

JI

~ame: •••••

I

; Change

. rsalls4 Jrl _

I LabeI:

It

=

~

I

NumericVariable·) OutpulVariable:

() gpracial

~sexo

~rendim

 IF>idade

,~ anos

~envolv

~salis1

~salis3

~autonom1

~autonom2

~aulonom3

~aulonom4

Page 71: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 71/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

aixa 4

A subcaixa de diálogo Recode inlo Differenl Variables: Old and New Values

zermos, poderemos usar o comando Recode recodificar que se encontra

o menu Transform transformar . Podemos recodificar valores utilizando a

esma Into Same Variables ... ou uma variável diferente Into Different

ariables ... .

Se quisermos comparar os valores originais de uma variável com os re

odificados, ou se pretendermos guardar os valores originais, podemos utili

ar a opção Into Different Variables ... , a qual abre a caixa de diálogo Recode

to Different Variables recodificar para uma variável diferente apresenta

a na caixa 3.3. Por exemplo, se pretendermos recodificar as variáveis satis2 e

atis4 noutras variáveis novas rsatis2 e rsatis4, transferimos satis2 para a cai

a intitulada Numeric Variable ~ Output Variable:, escrevendo o nome da

ova variável rsatis2 na caixa Name: e seleccionamos Change. Podemos re

etir esta mesma operação para a variável satis4, recodificando-a para umaova variável rsatis4.

De seguida, seleccionamos Old and New Variables ... , o que abre a sub

aixa de diálogo Recode into Different Variables: Old and New Values apre

entada na caixa 3.4. Na caixa intitulada Value na secção Old Value, onde o v

Page 72: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 72/128

ANALISAR DADOS COM O COMPUTADOR

• S ummarize Cases

EJ

i

53

(~ rotina1

< >rotina2

< >rotina3

< >rolina4

< >reuniao

(t;> especial

< >produtiv

< >qualid

<:~ absent

< >,rsalis4

< >satis

< t>

ethnigpc

Show ,Çase numbers

~ariables:

< >salis2

< >rsatis2

< >satis4

 irouping Variable(s):

Help

aixa 3.5

A caixa de diálogo Summarize Cases

a esquerda para a direita e modificados somente uma vez. Neste sentido,

1

é, inicialmente, recodificado para 5

(1~

5 não é, subsequentemen

e, reconvertido para

1

 5 ~

1).

No caso de existirem valores omissos missing

alues , como no presente exemplo, deve seleccionar-se System- or

ser-missing na secção Old Value e System-missing na secção New

Após estes procedimentos, seleccionamos Continue para fechar a sub

aixa de diálogo Recode into Different Variables: Old and New Values e OK

ara fechar a caixa de diálogo Recode into Different Variables. Podemos, en

ão, verificar os valores recodificados nas colunas correspondentes satis2,

satis2, satis4 e rsatis4 do editor de dados Data Editor .

Em alternativa, podemos verificar os valores recodificados de rsa

is2 e rsatis4 seleccionando Summarize Cases, de forma a obter uma lis

agem dos valores de satis2, rsatis2, satis4 e rsatis4 para, por exemplo, os

Page 73: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 73/128

54 ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

adro 3.2 O ou/pu/ do comando Case Summaries mostrando os valores recodificados de rsatis2 e

rsatis4

Case Summaries

TI ?

3

 00

4 00

O

 00

4

 00

1

 00 5

 00

4

 00 4

 00

1

 00

5

 00

3

 00

3

 00

3

 00

2 00

2

 00 1

 00

4

 00

2

 00

3 00 9

0 10

-+ seleccionar variáveis [por exemplo, satis2] -+~ [botão] -+ Limitcases

to first e escrever um número [por exemplo, 10]

-+OK

e não pretendermos guardar os valores originais, podemos seleccionar a

pção Into Same Variables ... que abre a caixa de diálogo Recode Into Same

ariables apresentada na caixa 3.6. Por exemplo, se quisermos recodificar as

riáveis satis2 e satis4 temos que as seleccionar e colocar na caixa intitulada

De seguida, procedemos, como anteriormente, seleccionado Old and

ew Values ... , o que abre a caixa de subdiálogo Recode Into Same Varia

es: Old and New Values apresentada na caixa 3.7. Na caixa intitulada Va

e: na secção Old Value), escrevemos o primeiro valor a recodificar por

emplo, 1), enquanto que na caixa Value na secção New Value) escrevemos

novo valor por exemplo, 5) e seleccionamos Add. Repetimos este procedi

ento consecutivamente para os outros três valores a recodificar 2,4 e 5). Po

mos fazer o mesmo para o valor 3. Se existirem valores omissos  missing v -

como é o caso deste exemplo, devemos seleccionar System- or

ser-missing na secção Old Value) e System-missing na secção New

Em alternativa, podemos seleccionar All other values, escrever o valor

na caixa intitulada Value: na secção New Value) e seleccionar Add.

Após este procedimento, seleccionamos Continue para fechar a subcai

Page 74: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 74/128

ANALISAR DADOS COM O COMPUTADOR

 

<%> gpracial

< >

sexo

<%> rendim

<%> idade

<%> anos

<t- envolv

' > salis

<%>

satis3

 

<%>

aulonom

lf...

.Qldand New Values ...

Caixa 3.6

A caixa de diálogo Recode into Same Variables

Aecode ;nlo Same Variables OId and New Values ~

I

O sj->

New:

1 ..> 5

2 ..> 4

4 ..> 2

5 ..> 1

MISSING ..> SYSMIS

.~.k~ ::.~••••••••••••••••••••••••••••••••••••••••••

Caixa 3.7

A subcaixa de diálogo Recode into Same Variables: Old and New Values

podem existir diversos valores originais. Por exemplo, se desejarmos cons

truir uma escala de 3 pontos concordo, discordo, indeciso), podemos faze-lo

recodificando os valores 1 e 2 para 1, 3 para 2, e 4 e 5 para 3. Na medida em que

só podemos introduzir um valor na caixa intitulada Value de cada vez, tere

Page 75: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 75/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

Senão desejarmos especificar qual o limite inferior do intervalo de valo

s, podemos faze-lo através do comando Range:. Se não desejarmos especifi

r o limite superior do intervalo, podemos seleccionar Range:. Por exemplo,

odemos utilizar estas opções para categorizar a nossa amostra em sujeitos

ima e abaixo dos 40 anos de idade, recodificando lowest through 39 para 1 e

0 through highest para 2.

Se a nossa amostra possuísse idades não expressas em números inteiros,

to é, idades compreendidas entre os 39 e os 40 anos por exemplo, 39,9 , es

s não seriam recodificadas pelo procedimento anterior. Para evitar este pro

lema, podemos especificar limites superiores e inferiores coincidentes no

omando Range, ou seja, lowest through 40 recodificado para 1 e 40 through

ighest para 2. Neste exemplo, todos os sujeitos com idade inferior a 40 anos

riam recodificados para o valor 1. Como os valores são codificados conse

utivamente e de uma vez só, o valor 40 anos não seria recodificado para 2.

Criar uma nova variável

or vezes podemos pretender criar uma nova variável. Por exemplo, usá

os quatro itens para avaliar aspectos ligeiramente diferentes de satisfa

ão no trabalho e, em vez de tratarmos estes itens como medidas separa

as, podemos achar preferível e até mais razoável combiná-los num único

dice, constituindo assim uma medida composta. Para o fazermos deve

os usar o comando Compute no menu Transform, o que abre a caixa de

iálogo Compute Variable apresentada na caixa 3.8. Podemos, assim, cri

r uma variável nova satis que corresponde à somas das variáveis satisl,

satis2, satis3 e rsatis4. Deste modo, começamos por escrever o nome da

<~ rolinal

~rolina2

 ~ rolina3

~rOlina4

Page 76: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 76/128

ANALISAR DADOS COM O COMPUTADOR

 

Quadro 3.3 O output do comando Case Summaries mostrando os valores de satis1, rsatis2, satis3,

rsatis4 e satis

Case SummarieS

1

O

,00

4,00

,00

O

,00,00 4

,00

4

,005,00 2

,00

2

,00

,00 3

,00

4

,004,00

2

,00

3

,00,00

3

,00

2

,001,00

2

,00

4

,004,00

3

,00

2

,002,00

3

,00

3

,003,00 8

010

nova variável satis na caixa intitulada Target Variable:. Depois, seleccio

namos SUM numexpr, numexpr ... na caixa Functions. Esta função será ins

crita na caixa Numeric Expression:. Nesta última caixa, substituímos ?,? por

satis1, rsatis2, satis3, rsatis4 e seleccionamos OK. Se o nome dos itens deri

vasse sempre da palavra satis, bastaria substituir

?,?

pelo primeiro item a so

mar satis1 , seguido do último satis4 .

Se olharmos para os valores de satis no editor de dados Data Editor ,

verificamos que o valor do primeiro caso é 9,00 3+4+2

=

9,00 , 5,00 para o se

gundo 2+3 = 5,00 e 15,00 para o terceiro 4+2+4+5 = 15,00 . Para listar os va

lores desta variável, podemos usar o comando Case Summaries ... O quadro

3.3 apresenta os resultados deste procedimento para os primeiros 10 casos.

Dados omissos e cálculo de valores para formar medidas compostas

Como vimos, faltam o valor satis1 para o primeiro sujeito e o valor satis1 e sa

tis2 para o segundo, Em investigação, é muito frequente que haja alguns da

dos omissos. Os sujeitos podem não responder a algumas questões, podem

assinalar duas respostas diferentes à mesma pergunta, o experimentador

Page 77: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 77/128

  ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

omitir os dados desse sujeito uma vez que pode haver algum problema com a

forma como esses dados foram obtidos. Pode acontecer, por exemplo, que o

sujeito não estivesse a prestar atenção ao que estava a fazer.

Na medida em que os dados disponíveis para construir um índice de ro

tina no trabalho são omissos para alguns indivíduos, não será apropriado uti

lizar a função somatório das respostas para calcular este mesmo índice. De

facto, um sujeito que responda concordo totalmente (codificação 5) nos

quatro itens de rotina no trabalho, terá uma pontuação total de 20, enquan

to que um que concorde totalmente com todos os itens mas que, por algu

ma' razão, não tenha respondido a um deles, terá, apenas, uma pontuação

de 15. Por outras palavras, quando existem valores omissos nos itens que

constituem um índice, necessitamos de tomá-los em consideração. Neste

sentido, um índice mais apropriado para esta situação será calculado com

base na média dos valores não omissos, isto é, cinco para o primeiro caso

(20/4

 

5) e para o segundo (15/3

 

5) sujeitos. Outra vantagem de utilizar

a média de uma escala, como a da rotina no trabalho, é a de que o resultado

médio corresponde às respostas dos itens individualmente, ou seja, um re

sultado de 4,17 indica que um sujeito respondeu, de uma forma geral,

 concordo a estes itens.

Contudo, não será aconselhável calcular o resultado médio de um sujei

to com um número significativamente grande de dados omissos. Podemos

aplicar, nestes casos, uma regra prática que consiste em verificar se, para um

sujeito, faltam 10 por cento ou mais dos dados referentes a um determinado

índice. Se for esse o caso, então o próprio índice é definido como omisso para

esse sujeito. Se aplicássemos este princípio aos dois primeiros sujeitos do nos

so exemplo, não deveríamos calcular o valor da satisfação no trabalho para

estes indivíduos. Pelo contrário, poderíamos calcular os valores de rotina no

trabalho e de autonomia.

Para calcular o resultado médio utilizamos a função MEAN (numexpr,

numexpr,,,.) que se encontra na caixa de diálogo Compute Variable (secção

Functions). Se quisermos especificar um número mínimo de valores não

omissos para que a média seja calculada, inserimos um ponto final após a fun

ção MEAN seguido do número mínimo de valores. Utilizaremos os quatro

itens da escala satis para ilustrar este procedimento. Com apenas quatro itens

não podemos utilizar um ponto de cut of de exclusão de valores omissos aci

ma dos 10 . Utilizaremos, então, um critério mais leniente de 50 . Semais de

50 (isto é, dois ou mais) das respostas de um sujeito aos itens de satisfação

no trabalho forem omissas, codificaremos a variável satis como omissa para

este sujeito. Por outras palavras, o número mínimo de valores não omissos

para que a média seja calculada é três. Como anteriormente, a nova variável a

criar designa-se satis, mas a expressão numérica a inserir na caixa Numeric

Page 78: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 78/128

ANALISAR DADOS COM O COMPUTADOR

59

que, para o primeiro caso, ele é de 3,00 9,00/3=3,00),. para o segundo caso

na medida em que só existem dois valores válidos) e 3,75 para o terceiro

 15,00/4=3,75).

Para recodificarmos os resultados médios omissos da variável satis para o

valor zero, utilizamos o procedimento Recode into Same Variables, seleccio

nando System-missing na caixa intitulada Old Value e escrevendo zero na caixa

intitulada Value: na secção New Value) e, por fim, seleccionado Add.

Para converter os resultados médios de uma variável em resultados to

tais que consideram o número de resultados válidos variando, portanto, en

tre 3 e 4), multiplicamos cada resultado médio pelo número máximo de itens,

isto é, 4. Assim, utilizamos o procedimento Compute Variable, no qual a

nova variável toma, novamente, o nome de satis e a expressão numérica a in

troduzir é satis*4.

Na medida em que desejamos criar três variáveis novas satisfação no

trabalho, autonomia no trabalho e rotina no trabalho), teremos que repetir o

procedimento Compute Variable para os itens da escala de rotina no trabalho

e de autonomia no trabalho. Ainda que se saiba, de antemão, que não existem

valores omissos neste dois conjuntos de variáveis, podemos ter alguma cau

tela e assumir que, na realidade, podem existir alguns. Se quisermos determi

nar a presença ou ausência destes valores, podemos utilizar o procedimento

Frequences ver capítulo 5).

As medidas compostas de satisfação no trabalho, autonomia no traba

lho e rotina no trabalho, que usaremos nos capítulos seguintes, foram criadas

através da soma dos 4 itens de cada escala, especificando como omisso o re

sultado total da escala baseado em mais de 10 de valores omissos nos itens

correspondentes. Na medida em que dois dos 70 casos do Questionário de

Trabalho possuíam uma ou duas respostas omissas nos itens da escala de sa

tisfação no trabalho, o número de casos para os quais foi possível calcular um

resultado global foram 68. As variáveis que contemplam os resultados totais

das escalas de satisfação no trabalho, autonomia no trabalho e rotina no tra

balho intitulam-se satis, autonom e rotina respectivamente. Uma vez mais,

para a variável satis, por exemplo, calculámos, em primeiro lugar, a média

dos itens da escala através da expressão numérica MEAN.4 satis1 to satis4),1

convertendo-a, em seguida, para um resultado total através da expressão nu

mérica satis*4.

Quando a nossa amostra possui um número elevado de variáveis as

quais, por alguma razão, podemos prescindir, pode revelar-se mais conveni

ente criar um novo ficheiro que contemple, apenas, as variáveis que vamos

sujeitar a análise. Por exemplo, se quisermos analisar, somente, as variáveis

Page 79: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 79/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

atis, rotina e autonom, e não os itens que as constituem, podemos criar um

ovo ficheiro que contém, apenas, estas variáveis juntamente com outras

ue possamos necessitar . Para tal, apagamos os itens individuais seleccio

ando as variáveis satisl a rotina4 no editor de dados Data Editor e selec

ionando Edit, seguido de eut. Podemos, então, gravar estes dados num

ovo ficheiro, que designaremos por qtt.sav Questionário q do Trabalho t

dados totais t e que utilizaremos em análises subsequentes. Os dados des

e ficheiro são apresentados n~ quadro 3.4.

Exercícios

Qual o comando do SPSS que serve para seleccionar, entre os sujeitos

que responderam ao Questionário do Trabalho, homens e mulheres de

origem africana?

Escreva um comando do SPSS que sirva para seleccionar, entre os sujei-

tos que responderam ao Questionário do Trabalho, mulheres asiáticas

ou das índias ocidentais que tenham 25 anos ou menos.

Para seleccionar sujeitos que não tenham respostas omissas em relação

à satisfação no trabalho no Questionário aplicado, qual o comando do

SPSS que usaria?

Qual o procedimento do SPSSpara recodificar a variável do Questioná-

rio do Trabalho especial na mesma variável, mas de forma a que passe

apenas a duas categorias não especializado / semi-especializado v sus

bastante / muito especializado .

Qual o procedimento do SPSS para recodificar a variável rendim numa

nova variável gprendim, com três grupos: os que ganham menos que

5,000 libras, os que ganham entre 5,000 libras e 10,000 libras e os que ga

nham mais de

ElO,OOO,

considerando os valores omissos como zero.

Usando o operador aritmético

 

exprima a variável semanas em dias-

por outras palavras, converta o número de semanas no número de dias

correspondente.

Page 80: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 80/128

dro 4

Os dados transformados do Questionário de Trabalho

gpracial

exo

endim

dade

nos

nvolv

atisutonomotinaeuniao

specialrodutivualid

bsent

1

.300 29

 

09 2.300 26

 

51 3.900 40

5

73 3.200 46502 2.300 636

41

8

1

.000 54126

1 1

.300 2919

4

2 3.800 35421

2

.800 3320

2

.900 273851

1

.100 2962 2

 

9231

4

.000 55534991 1.500 29951 3.100 48431 2.900 32180

2

1.300 484077

1

1.700 1886

1

3.500 28530 3.800 37

1

88

1

1

1

4362

11

32

1

.700 39005

1

.000 5331143 2.000 3442 3.500 4373931 1.000 2134 1.100 50830691 1.200 3172

1

.800 312

1

08 2.200 5212420 1.200 5424059 3.200 28011 2.300 5034432

Page 81: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 81/128

 continuação

34

2.000

52

153301

1

.500 40111092 2.900 1902

2

.800 3864 2.000

61

1569 1.800

37

08 2.700 3192 2.500 4313222 3.800 2371 2.000 27721 1.500 2844 1.600 O016

1

10 3.700 183063 10.300 483339

1.800

2900

7

111 1.300

42

017024 1.100 53296 1.600

32

20

12

31

1

.500 3182

1

1

.500

55

9553 3.400 2654 1.600 53264

1

.800 511239

1

.700 48391 1.900 48802

2

.900 620

1

82 2.700

57

30831

1

.900 42042

1

.100 2121O

3

.400 2601

1

1.800 4602 10.500

59

150 4.100 3009

71

2

1

.300 2928520

3

.900

45

023 3.000

53

007622 1.900 472

2

1611

Page 82: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 82/128

Capítulo 4

OS ON EITOS E SU MEDIÇÃO

Os conceitos representam um aspecto fundamental na investigação social. As

hipóteses contêm conceitos que são afinal produtos das nossas reflexões so

bre o mundo. Os conceitos exprimem elementos comuns do mundo aos quais

é atribuído um nome. Podemos verificar que algumas pessoas não gostam de

membros de raças diferentes da sua atribuindo-lhes muitas vezes caracte

rísticas negativas. Outros indivíduos apoiam fortemente os outros grupos ra

ciais talvez vendo-os como elementos que podem enriquecer a cultura acres

centando-lhe novos aspectos. Ainda há outros que são apenas tolerantes não

defendendo um ponto de vista radical nem a favor nem contra os outros gru

pos raciais. Por outras palavras é fácil apercebermo-nos de que as pessoas po

dem assumir uma grande diversidade de posições face aos grupos raciais. Po

demos considerar que entre estas atitudes existe algo em comum embora as

atitudes em si possam ser antagónicas. O ponto de contacto entre essas orien

tações diversas é que qualquer delas reflecte uma posição em relação ao pre

conceito racial . Quando atribuímos um nome às diferentes orientações que

as pessoas podem tomar face aos membros de outras raças estamos a tratá-los

como um conceito isto é como uma entidade que está para além das observa

ções sobre a hostilidade e o apoio raciais que desencadearam a formulação de

um nome para essas ob ervações. O conceito de preconceito racial envolve al

guma abstracção que o fa transcender as reflexões que conduziram à sua for

mulação. Assim o conceito e preconceito racial torna-se algo que os outros

podem utilizar para dar forma as suãS-prôprias reflexões sobre o mundo so

cial. Deste modo podem formular-se hipóteses que postulem conexões entre

o preconceito racial e outros conceitos: por exemplo pode supor-se que ele se

relaciona com a classe social ou com o autoritarismo.

Uma vez formulado o conceito ele próprio e os conceitos que se supõe

estarem com ele relacionados como a classe social ou o autoritarismo preci

sam de ser definidos oper ion lmente para que se possa conduzir uma investi

Page 83: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 83/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

operações) que permitem que as diferenças entre indivíduos em relação a es

es conceitos possam ser especificadas com precisão. Aquilo a que, de facto,

os estamos a referir é à

medição

  isto é, ao acto de fazer corresponder núme

os a unidades de análise - sejam elas pessoas, organizações ou nações - a

ue um conceito se refere. Amedição permite que seja possível especificar pe

uenas diferenças entre unidades. Podemos dizer que alguém que, de uma

orma activa, faz afirmações contra membros de outras raças tem um precon

eito racial enquanto alguém que defende activamente esses membros de ou

ros grupos raciais tem um posicionamento oposto, mas é difícil especificar as

iferentes posições entre estes dois extremos que as pessoas podem assumir.

medição proporciona a possibilidade de especificar essas diferenças, per

itindo determinar as diferenças sistemáticas entre pessoas.

Para providenciar definições operacionais dos conceitos são necessá

indi dores

que correspondam a esses conceitos. Pode acontecer que um

nico indicador seja suficiente para medir um conceito, mas em muitos casos

ão o será. Assim, por exemplo, seria suficiente medir o fervor religioso

través de um questionário em que se pedisse às pessoas que dissessem qual

frequência com que vão à missa? Evidentemente que não, uma vez que ir à

issa é apenas uma das formas com que um indivíduo pode exprimir o seu

ervor religioso. Essa medida não contempla a devoção pessoal, o comporta

ento secular coerente com a sua religião, o facto de estar informado sobre a

ua própria religião ou o grau de adesão aos dogmas centrais dessa religião

Glock e Stark, 1965). Estas reflexões implicam que, em muitos casos, para se

edir conceitos seja necessário utilizar vários indicadores; de outra forma,

ode argumentar-se que os resultados da nossa investigação não são exactos

orque apenas considerámos uma das facetas do conceito em análise.

Se vamos analisar mais do que um indicador do conceito, podemos pre

isar de testar hipóteses em relação a cada um desses indicadores. Imagine

os uma hipótese em que o conceito estudado é a dimensão da organiza

ão . Podemos medir i.e., definir operacionalmente) este conceito através do

úmero de funcionários da empresa, do seu movimento comercial ou dos

eus lucros líquidos. Embora estes três potenciais indicadores est .am, prova

elmente, interligados não estabelecerão entre si uma relação per . a Child,

973). Sendo assim, as hipóteses acerca da dimensão da organização m

er que ser testadas usando cada um dos três indicadores. Do mesmo modo,

e quisermos medir o fervor religioso , para além de avaliarmos a frequên

Page 84: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 84/128

05 CONCEITOS E A SUA MEDIÇÃO

 

--~;das compostas, que se constroem a partir de uma multiplicidade de

o Questionário do Trabalho a variável satis é um exemplo de medida

,;::csés de múltiplos itens. Obtém-se esta medida perguntando aos sujeitos

::aI é a sua posição face a um certo número de indicadores que, todos juntos,

3c:-:- empara avaliar o conceito. De um modo semelhante, existem quatro in-

~.:adores, quer para

rotina

quer para

autonom

Poder-se-ia testar uma hipó

t::se com cada um dos indicadores. Contudo, se usarmos os dados do Ques

::;:mário do Trabalho para examinar uma hipótese relacionada com a variável

satis e a variável

autonom

 

uma vez que cada uma delas tem quatro indica

  ores - precisaríamos de dezasseis testes diferentes. A maneira de analisar

~-:as medidas constituídas por múltiplos itens é agregar a resposta de cada

:::divíduo a cada questão e tratar a medida total como uma escala em relação

=

qual cada unidade de análise tem um valor. No caso das variáveis satis,

au-

:onom e rotina

é usada uma escala de Likert o que constitui uma abordagem

~ 1abitualquando se trata de criar medidas compostas com base em múltiplos

 :ens. Na escala de Likert, apresentam-se aos indivíduos um certo número de

2...c 1nnaçÕesue parecem relacionar-se com um tema comum; em seguida, eles

: ldicamo seu grau de acordo ou desacordo numa escala de cinco ou de sete

?Ontos. A resposta a cada uma das questões que compõem a escala (ou seja, a

.:.adaitem) é quantificada, podendo ir, por exemplo, de 1 para Desacordo To

:al até 5 para Acordo Total se a escala escolhida for de cinco pontos. Os resul

:ados individuais são somados para formar um valor total para cada sujeito .

.-\S escalas com múltiplos itens podem ser muito longas; as quatro questões

referentes a satis foram retiradas de uma escala criada por Brayfield e Rothe

1951) que compreende dezoito questões.

Estas escalas de itens múltiplos são populares por várias razões. Em pri

meiro lugar, é mais provável que se consiga captar a totalidade de um concei

to abrangente como a satisfação no trabalho através de vários itens do que a

partir de uma única pergunta. Em segundo lugar, estas escalas permitem de

linear diferenças mais precisas entre sujeitos. A medida

satis

compreende

quatro questões que podem tomar valores de 1a 5, de forma que os valores to

tais para cada inquirido podem variar entre 4 e

2

Se só se fizesse uma per

gunta a cada um, a variação seria entre 1e 5 - um intervaloJle~ariação possí

el muito mais restrito. Em terceiro lugar~--um--sujeífÔ não compreender

bem alguma questão e se essa pergunta for a única a que ele tem que respon

der, então ele será mal classificado; se se utilizarem várias perguntas, a falta

Page 85: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 85/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

anifestam. Quando se conduz uma

  nálise univ ri d

pretende conhecer-se

forma como os indivíduos se distribuem em relação a uma só variável.

ssim, por exemplo, podemos querer saber quantos casos podem ser encon

ados em cada uma das categorias ou níveis da medida em análise, ou pode

os querer saber qual é a resposta média. Na

  nálise biv ri d

o nosso interes

centra-se nas conexões entre duas variáveis ao mesmo tempo. Dessa for

a, por exemplo, podemos pretender saber se as alterações na variável

satis

tão associadas às alterações de uma outra variável como a

autonom

ou se

s homens e as mulheres diferem em relação a essa variável. Em qualquer dos

sos, o foco de interesse é a variação.

  ipos de variáveis

m dos mais importantes factores da compreensão das operações estatísticas

a capacidade de avaliar se é possível aplicar determinados testes. Para esta

aliação, é importante a aptidão para reconhecer as diferentes formas que as

ariáveis tomam, porque os diversos testes estatísticos só são aplicáveis a cer

s tipos de variáveis. Este ponto será retomado mais à frente, em capítulos

A maioria dos autores de livros de estatística segue uma distinção cria

a por Stevens (1946) entre níveis de medida ou escalas nominais, ordinais e

e intervalo / proporcionais. A primeira, a escala

nomin l

(também designada

ategorial), conduz à classificação do indivíduo em relação a um conceito. No

uestionário do Trabalho, a variável

gpracial

que classifica os inquiridos

uma de cinco categorias - branco, asiático, indiano, africano ou outro - é

m exemplo de uma variável nominal. Os indivíduos podem ser colocado~

uma categoria, mas a medida não permite mais do que isso; enquanto forma

e medida não há mesmo muito mais a dizer sobre esta escala. Por exemplo

ão podemos sequer utilizá-la para ordenar as categorias de alguma forma

Esta impossibilidade contrasta com as possibilidades oferecidas pela:

iáveis ordin is

que permitem que os indivíduos sejam categorizados ma:

mbém permitem que essas categorias possam ser ordenadas em termos d

ais ou menos face ao conceito abordado. No Questionário do Trabalh

variáveis

especial produtiv e qualid

são ordinais. Se considerarmos a pr:

eira das três, i.e., a variável

especial

podemos verificar que as pessoas n~

e limitam a ser categorizadas numa de quatro categorias - muito especial:

ado, bastante especializado, semi-especializado, não especializado - já q

possível dizer que alguém que é classificado como bastante especializado  

Page 86: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 86/128

OS CONCEITOS E A SUA MEDIÇÃO

Quadro 4 Tipo de variáveis

Tipos Descrição

Nominal Classificação de objectos (pessoas, firmas, nações, etc)

em categorias descontínuas.

Ordinal As categorias associadas à varivel podem ser ordenadas.

Os objectos podem ser ordenados do maior para o menor.

Intervalo (a) Nas verdadeiras variáveis de intervalo, as categorias

associadas à variável podem ser ordenadas, como no caso

das variáveis ordinais, mas as distâncias entre categorias

são iguais.

intervalo (b) São variáveis que, em rigor, são ordinais mas que incluem

um grande número de categorias como

é

o caso das medidas

de múltiplos items em questionários. Assume-se que estas

variáveis têm propriedades similares às verdadeiras variáveis

de intervalo.

Jicotómicas São variáveis que têm apenas duas categorias.

onte: Lazarsfeld (1958); Hall (1968); Snizek (1972).

67

Exemplo nos dados

do Quest. do

Trabalho

gpracial

Envolv

especial

produtiv

qualid

Rendim

idade

anos

absent

Satis

rotina

autonom

Sexo

reuniao

A variável

é

ordinal ~.----

A variável é de intervalo/rácio ••----

Mais do que duas categorias?

A riá l dlootóml . Não~

r

s distâncias entre

s m~r ?

A 1. d .

categonas po em

~m~r?

variável é nominal

 

Não

Page 87: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 87/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

pesar de podermos ordenar as categorias que constituem a variável espe-

continuamos a estar limitados em relação àquilo que podemos dizer so

e elas. Assim, por exemplo, não podemos dizer que a diferença entre ser

uito especializado e bastante especializado é igual à que separa a categoria

stante especializado e semi-especializado. Tudo o que nos é possível dizer

que aqueles que forem considerados muito especializados têm uma especi

ização maior do que aqueles que foram classificados como bastante especi

izados e que estes, por sua vez, são mais especializados que os semi-especi

izados e assim por diante. Além disso, embora codifiquemos os semi-espe

alizados com o algarismo 2 e os muito especializados com um 4, não pode

os dizer que as pessoas classificadas como muito especializadas tenham o

obro da especialização das semi-especializadas. Por outras palavras, deve

r-se o cuidado de não atribuir uma qualidade aritmética - que o uso de nú

eros parece implicar - aos números usados para a codificação das categori

de uma escala ordinal.

Com as variáveis de intervalo proporcionais podemos dizer muito mais

relação às suas qualidades aritméticas. De facto, esta categoria compreen

e dois tipos de variáveis - as de intervalo e as proporcionais. Ambos os ti

os se caracterizam por apresentarem iguais diferenças entre categorias

or exemplo, alguém com 20 anos tem mais um ano do que alguém que tem

9 e alguém que tem 50 anos é mais velho um ano do que quem tem 49. Em

ada caso, a diferença entre as categorias é idêntica - um ano. Uma escala é

esignada como escala de intervalo quando os intervalos entre as categorias

ão iguais. As medidas proporcionais, além disso, têm um ponto fixo que

onstitui o zero. Assim, as variáveis

id de bsent e rendim

têm pontos nulos

gicos. Esta característica significa que se pode dizer que alguém que tem 40

nos tem o dobro da idade de quem tem 20 anos. Do mesmo modo, alguém

ue faltou seis vezes no ano ao trabalho faltou três vezes mais do que uma

essoa que só deu duas faltas. Contudo, é habitual que os autores não estabe

çam a distinção entre escalas de intervalo e escalas proporcionais porque,

as ciências sociais, as verdadeiras variáveis de intervalo são, com frequên

ia, também variáveis proporcionais é o caso, por exemplo, do rendimento e

a idade . Neste livro, o termo variável de intervalo será, por vezes, empregue

ara considerar também as variáveis proporcionais.

As variáveis de intervalo/proporcionais correspondem, reconhecida

ente, ao mais elevado nível de medida porque permitem muito mais opera

ões do que os outros dois tipos de variáveis, existindo um leque mais vasto

e testes estatísticos que se lhes aplicam.

 

importante notar que quando uma

ariável de intervalo/proporcional, como a idade, é agrupada em categorias

como 20-29, 30-39, 40-49,50-59, etc. - torna-se uma variável ordinal. De

Page 88: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 88/128

OS CONCEITOS E A SUA MEDIÇÃO

 

pontos em que as pessoas se localizam dentro desses grupos. Por outro

.:.ado,estes agrupamentos de indivíduos são, por vezes, úteis para a apresen

:ação e fácil assimilação da informação. Deve notar-se ainda que a posição

das variáveis di otómi s face a estas três categorias de variáveis é algo ambí

gua. Nestas variáveis há, apenas, duas categorias, como, por exemplo, ho

:: leme mulher para a variável sexo. Habitualmente, pensa-se numa variável

iicotómica como uma variável nominal, mas por vezes ela pode ser conside

:-ada ordinal. Quando, por exemplo, existe uma ordem inerente a essas cate

50rias parecem estar presentes as características inerentes a uma variável or

iinal, como no caso das categorias passar e falhar .

Rigorosamente falando, medidas como satis, autonom e rotina, que de

::\'am de escalas de itens múltiplos, são variáveis ordinais. Assim, por exem

?lo, não sabemos se a diferença entre um valor de

 

na escala satis e um valor

'::e18é a mesma diferença que existe entre 10 e 8. Isto coloca um problema aos

::n'estigadores, uma vez que a impossibilidade de tratar estas variáveis como

scndo de intervalo, implica que determinados métodos de análise como a

:orrelação e a regressão (ver Capítulo 8), que são métodos conhecidos e

:0rangentes, não possam ser utilizados para avaliar as suas relações por se

:-emapenas aplicáveis a variáveis de intervalo. Por outro lado, muitas das me

.::idas de itens múltiplos criadas pelos investigadores são tratadas por eles

:0mo se fossem variáveis de intervalo, porque essas medidas permitem que

x considere um vasto número de categorias. Quando uma variável compre

:?:1deapenas um pequeno número de categorias ordenadas, como no caso de

envolv, produtiv, especial e qualid no Questionário do Trabalho, em que

:ada uma compreende apenas quatro ou cinco categorias, seria pouco razoá

o'el,aos olhos da maior parte dos analistas, tratá-las como se fossem variáveis

:'e intervalo. Quando o número de categorias é consideravelmente maior,

:omo no caso das variáveis satis, autonom e rotina, em que cada uma pode

:;)rresponder a dezasseis categorias de 5 até

20,

é mais aceitável tratá-las

:;)mo variáveis de intervalo.

Parece haver um certo movimento na direcção deste procedimento mais

~ral em relação às escalas de múltiplos itens, tratando-as como se possuís

xm as características das variáveis de intervalo. No entanto, muitos puristas

::msiderariam esta posição incorrecta. Além disso, não parece haver uma re

~a precisa que permita ao analista decidir se a variável é ordinal ou é de in

'::,:yalo. Contudo, ao longo deste livro, vamos ao encontro da prática corrente

::':rataremos as medidas baseadas em múltiplos itens como é o caso de satis,

tonom e rotina como se fossem escalas de intervalo. Labovitz

(1970)

ainda

:ti

mais longe ao sugerir que quase todas as variáveis ordinais podem e de

Page 89: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 89/128

Page 90: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 90/128

01 11 ••• 1 101I11 nl

Especificação doelecção deormação de

ndicadores

scalas ou

Associação

stou presente, com

scala I

Jf

profissional como

egularidade, nas reuniões

referência

profissionais

Penso que a minha profissão,

scala 11

ais do que qualquer outra,

 

ssencial para a sociedade

Crença na

 s meus colegas da mesma

scala 111 •

uto-regulação

rofissão julgam de forma

dequada a competência uns

outros

s pessoas desta profissão Escala IV

entem um verdadeiro

hamamento para a exercer

o meu trabalho, tomo as

scala V

inhas próprias decisões

m relação ao que vou

 dez indicadores por

ensão - um indicador

o exemplo de cada

ra 4 2

Conceitos, dimensões e medidas

s: Lazarsfeld  1958 ; Hall  1968 ; Snizek  1972 .

Page 91: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 91/128

72

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

odo a que se verifique se inclui diferentes aspectos ou dimensões. A pa

em por este estádio permite reconhecer a complexidade do conceito.

ropõe cinco dimensões do profissionalismo:

O

uso da associação profissional

como uma referência fundamental.

significa que, para o profissional no contexto do seu trabalho, a asse

ção profissional e os colegas da mesma profissão são uma fonte pri

paI de ideias e opiniões.

Acreditar que se está a servir o público. De acordo com este aspecto, a

fissão é vista como indispensável à sociedade.

creditar que existe uma auto-regulação.

Esta noção implica que o trab

de um profissional pode e deve ser julgado apenas por outros meml

da profissão porque só eles têm a qualificação necessária para er

avaliações adequadas.

A sensação de ter vocação para essa função.

O profissional é alguém qt

dedica ao seu trabalho e que, provavelmente, quereria ter essa profi

mesmo que as recompensas materiais fossem menores.

Esta dimensão final indica que o profissional tem que se

paz de tomar decisões e fazer julgamentos sem pressões quer dos c

tes, quer das organizações onde trabalha, quer ainda de pessoas d

tras profissões.

estádio de especificação do conceito não só é útil para se reflectir e apr

er a complexidade dos conceitos, mas também como forma de fazer a p

ntre a formulação geral do conceito e a sua medição, uma vez que o estal

imento de dimensões reduz o grau de abstracção dos conceitos.

O estádio seguinte é o da

selecção de indicadores

em que o investiga

rocura indicadores para cada uma das dimensões. No caso de Hall, f

eleccionados dez indicadores para cada dimensão. Cada indicador foi

retizado numa afirmação que os inquiridos teriam que classificar -

uito correcta, correcta, pouco correcta ou muito pouco correcta - de ao

om a forma como achavam que descrevia o seu comportamento e os

entimentos enquanto membros da sua profissão. Há também uma cate

eutra. A figura 4.2 apresenta as cinco dimensões do profissionalisml

ara cada dimensão, um dos seus dez indicadores. Por fim, Lazarsfeld af

Page 92: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 92/128

OS CONCEITOS E A SUA MEDIÇÃO

 

diferentes perfis em relação a essas dimensões - nalgumas, pode ter-se um

esultado elevado nas dimensões 2, 3 e 5,moderado na

 

e baixo na 4, enquan

o noutras profissões podem aparecer outras combinações.

Para verificar se os indicadores se agrupam da forma proposta pela de

finição

a priari

das dimensões, utiliza-se com frequência a

análise factarial

uma

técnica que será examinada no capítulo   A análise factorial permite ao in

estigador verificar se, por exemplo, os dez indicadores criados para avaliar a

 autonomia estão, de facto, relacionados uns com os outros e não com os in

dicadores que foram escolhidos para medir outras dimensões. Pode desco

rir-se que um indicador que é suposto medir a autonomia pareça estar asso

ciado com muitos dos indicadores de crença no serviço ao público , enquan

to um ou dois dos indicadores desta última dimensão apareçam relacionados

com os que deveriam corresponder à dimensão crença na auto-regulação , e

assim por diante. De facto, quando se fez uma análise factorial em relação à

escala de profissionalismo de Hall, verificou-se que a correspondência entre

as cinco dimensões e os seus supostos indicadores era fraca (Snizek, 1972;

Bryman, 1985). Contudo, o aspecto fundamental a reter sobre este assunto é

que a especificação de dimensões para os conceitos é, frequentemente, um

passo importante para a formulação de uma definição operacional.

Em psicologia e em sociologia há algumas medidas que são construídas

com pouca (se existe alguma) atenção à questão das dimensões dos conceitos.

Assim, por exemplo, a medida da satisfação no trabalho constituída por de

zoito itens e desenvolvida por Brayfield e Rothe (1951) - que já foi referida

: tãoespecifica dimensões, embora seja possível aplicar a análise factorial para

 ::eterminar as suas dimensões de facto. O objectivo fulcral desta secção é sa

: :entar que a procura de dimensões pode dar um importante auxílio na com

?reensão da natureza dos conceitos, e que quando elas são identificadas

- Jriari podem constituir um passo significativo no caminho a percorrer des

: e a complexidade e abstracção do conceito até às formas como ele pode ser

=:edido.

  lid de e fidelid de d s medid s

-.ceita-se, em geral, que quando um conceito foi definido operacionalmente,

-:::1.dosido proposta uma forma de o medir, o instrumento usado para essa

==dição deve ser fiel e válido.

Page 93: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 93/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

interna. A fidelidade externa é a noção que se usa mais vulgarmente e refe

re-se ao grau de consistência de uma medida ao longo do tempo. Se tivermos

uma balança de cozinha que registe pesos diferentes cada vez que se pesa o

mesmo saco de açúcar temos uma medida do peso que não tem fidelidade ex

terna, já que o valor obtido flutua ao longo do tempo quando não deviam sur

gir diferenças de acordo com o momento em que o saco é pesado. Da mesma

forma, se aplicarmos um teste de personalidade a um grupo de pessoas, pas

sarmos o mesmo teste às mesmas pessoas pouco tempo depois e houver uma

fraca correspondência entre os valores obtidos nos dois momentos de aplica

ção, provavelmente teremos que considerar que o teste não tem fidelidade ex

terna porque as medidas que proporciona parecem flutuar. Quando avalia

mos a fidelidade externa desta forma, ou seja, administrando o mesmo teste

em duas ocasiões distintas ao mesmo grupo de sujeitos, estamos a avaliar a

  -

delidade teste-reteste. Poderíamos prever que as pessoas que, na primeira apli

cação, tivessem valores elevados os teriam, também, na segunda; por outras

palavras, esperamos que a posição relativa do resultado de cada pessoa se

mantenha relativamente constante. O problema de usar este procedimento

consiste na impossibilidade de sabermos se os acontecimentos que medeiam

as duas aplicações podem justificar, pelo menos em parte, a discrepância en

tre os dois conjuntos de resultados. Assim, por exemplo, se a satisfação no tra

balho de um grupo de pessoas for avaliada agora e voltar a ser testada daí a

três meses pode verificar-se que, de um modo geral, os inquiridos tenham

manifestado níveis mais elevados de satisfação na segunda do que da primei

ra vez. Pode acontecer que, no período de intervalo entre as duas avaliações

eles tenham recebido um aumento ou que tenha havido uma alteração na or

ganização do trabalho ou até que, no momento da primeira avaliação, tives

havido algum motivo de descontentamento que entretanto teria sido resolvi

do. Além disso, se o teste e o reteste forem muito próximos no tempo, os sujei

tos podem reproduzir as respostas que tinham dado antes havendo, assim

uma consistência entre os dois testes que é, apenas, aparente. Contudo, a fide

lidade teste-reteste é um dos principais meios de avaliar a fidelidade externa

A fidelidade interna é particularmente importante em relação às escal~

de múltiplos itens. Levanta a questão de se saber se cada escala está a med1:

uma única ideia e se os itens que constituem a escala têm consistência intelTh:.

Existem vários procedimentos para avaliar a fidelidade interna e dois dele

podem ser conduzidos a partir do SPSS. Em primeiro lugar, a avaliação da Í

Page 94: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 94/128

OS CONCEITOS E A SUA MEDIÇÃO

 

da mesma maneira que o coeficiente de correlação de Pearson ver o Capítulo

8), na medida em que varia de

O

a 1; quanto mais perto estiver de 1 - ideal

mente, sendo maior ou igual a 0.8 - maior fidelidade interna tem a escala.

Em segundo lugar, o vulgarmente usado

alfa de Cronbach alpha

traduz, es

sencialmente, a média de todos os coeficientes de bi-partição possíveis. Mais

uma vez, a regra básica é que se deve situar entre 0.8 e 1. Esta regra é, também,

usada em relação à fidelidade teste-reteste. Quando um conceito e a sua me

dida compreendem várias dimensões, é habitual calcularem-se os coeficien

tes de fidelidade para cada uma das dimensões subjacentes em vez de calcu

lar um só para a medida no seu todo. De facto, se uma análise factorial confir

ma que existe um certo número de dimensões, a fidelidade interna da escala,

se for considerada na totalidade, terá provavelmente um valor baixo, já que

os coeficientes de bi-partição serão certamente reduzidos.

Os valores alfa ou o coeficiente de bi-partição podem ser, facilmente,

calculados com o SPSS.   necessário assegurarmo-nos de que todos os itens

estão codificados na mesma direcção. Assim, no caso da variável satis é preci

so verificar se os itens que estão na forma inversa como o satis2 e o satis4) fo

~amrecodificados utilizando Recode) de modo a que o acordo com a frase in

iique falta de satisfação no trabalho. Estes dois itens já foram recodificados

?ara rsatis2 e rsatis4, e serão utilizados no exemplo seguinte. Para calcular o

:este de fidelidade dos 4 itens que constituem o valor satis, teríamos que reali

2ar este procedimento:

~ Analyze ~ Scale ~ Reliability Analysis ... [abre a caixa de diálogo

Reliability Analysis apresentada na caixa 4.1]

~ Seleccionar satisl, rsatis2, satis3 e rsatis4 enquanto se pressiona a te

cla ctrl [as quatro variáveis devem ficar selecciona das no écran] ~ ~ [bo

tão] [coloca satisl, rsatis2, satis3 e rsatis4 na caixa Items:] ~ Model ~

Alpha no menu drop-down.

~OK

:.::desejarmos determinar a fidelidade através de um coeficiente de bi-parti

~o Spli-half), devemos seleccionar esta opção no menu Model, em vez de

~..ipha.O resultado do cálculo do coeficiente alpha quadro 4.2) sugere que a

 :.riável satis é internamente fiável, na medida em que o coeficiente determi

ado é de 0,76. Este valor está pouco abaixo do critério de 0,8, e pode ser consi

-~ado como garante da fidelidade desta variável. Se uma escala çlemonstrar

-:.a

fidelidade interna reduzida, a estratégia a adoptar para esta eventuali-

- - .:iepode passar por retirar um ou mais itens que constituem esta escala e

Page 95: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 95/128

76

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

: Reliability Analysis EJ

o@> especial

o@>

produtiv

o@> qualid

o@> absent

 ~satis

o@> ethnigpc

Items:

- o@> sa;is1

o@>

satis3

o@> rsatis2

 

aixa 4.1 A caixa de diálogo Reliability Analysis

uadro 4.2 O ouput da análise de fidelidade da variável satis Questionário do Trabalho

E L I A B I L I T Y A N A L Y S I S - S C A L E A L P H A

Reliability Caefficients

N af Cases; 68.0 N af Items ; 4

Alpha; .7618

delidade alpha à medida que se vão retirando itens. Como se pode verificar

do este procedimento revela-se desnecessário para a variável satis.

Para além da fidelidade interna e externa é importante mencionar ou

os dois aspectos ligados à fidelidade. Em primeiro lugar quando o material

stá a ser codificado por temas deve testar-se a fidelidade do esquema de co

ificação. Isto pode ocorrer quando o investigador com o intuito de encon

ar temas gerais subjacentes às respostas necessita de codificar as respostas

as pessoas às perguntas de uma entrevista que não chegaram a ser pré-codi

cadas ou quando conduz uma análise de conteúdo de anúncios de jornais

ara estudar a forma como os tópicos das notícias tendem a ser abordados.

m qualquer dos casos deve utilizar-se mais do que um codificador e calcu

afidelidade inter juizes para garantir que o esquema de codificação está

Page 96: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 96/128

os

CONCEITOS E A SUA MEDIÇÃO

 

ei bilily

Analysis: Slalislics I I

Continue

Etesl

_~ Friedman chi·s,guare

Cochran chi square

Inter·lle

CorreJations

O.Covarianc~s

HOlellin,g s T-square

In r aclass correlalion coefficienl

escriplives for

 lem

.s.cale

~~i~O .(.(í~i.n.:.ª.~i~.í~

-Slnmaries

Means

yariances

CQvariances

Co relations

:.aixa 4.2

A subcaixa de diálogo Reliability Analysis: Statistics

_ 1ter-observações e inter-codificadores, podem utilizar-se métodos de análi

5<? bivariada (ver Capítulo 8). Pode encontrar-se uma discussão de alguns mé

:odos concebidos especificamente para a avaliação destes dois tipos de fideli

i de na obra de Cramer

(1998).

  lid de

_-\validade refere-se à avaliação do grau em que uma determinada medida

:::1ede,de facto, o que se pretende medir. Como é que podemos saber que uma

:::1edidade satisfação no trabalho mede mesmo a satisfação no trabalho e não

Jutro conceito qualquer? No mínimo, um investigador que crie uma nova

:::1edida deve garantir que ela tenha

v lid de f cí l

 

ou seja, que aparente

:::1entea medida reflicta o conteúdo do conceito em questão.

O investigador pode tentar calcular, ainda, a

v lid de concorrente

do con

.:eito. Neste caso, o investigador utiliza um critério que seja reconhecido

.:omo relevante para o conceito em causa e que diferencie as pessoas. Assim,

Page 97: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 97/128

  ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

balho do que as que não estão satisfeitas. Se não se encontrar correspon

ncia, por exemplo, se os que não estão satisfeitos faltarem com a mesma fre

ência que os que estão satisfeitos, podemos ser tentados a interrogar

o-nos sobre se a nossa medida estava realmente a avaliar a satisfação no tra

lho. Outra forma de se avaliar a validade da nova medida é calcular a

vali-

de preditiva caso em que o investigador usa um critério relacionado com o

turo e não com o presente como acontecia na validade concorrente. No caso

validade preditiva, o investigador examinaria a validade da satisfação no

abalho com base no critério de níveis futuros de absentismo.

Alguns autores defendem que o investigador também deve calcular a

lidade de constructo de uma medida Cronbach e Meehl, 1955 . Aqui, o inves

gador é encorajado a deduzir hipóteses que decorram de uma teoria rele

nte para o conceito. A partir das suas noções sobre o impacto da tecnologia

a experiência do trabalho por exemplo, Blauner, 1964 , o investigador pode

tecipar que as pessoas que estão satisfeitas com os seus trabalhos são me

os frequentemente aquelas que têm funções rotineiras; e que aquelas que

ão estão satisfeitos são, com mais frequência, os que têm trabalhos rotinei

s. De acordo com isso, podemos investigar essa dedução teórica examinan

o a relação entre satisfação no trabalho e rotina da função. Por outro lado, é

ecessário ter algum cuidado quando se interpreta a ausência de uma relação

tre a satisfação no trabalho e a rotina da função. Em primeiro lugar, a teoria,

u a dedução que é feita a partir dela, pode não ser correcta. Em segundo lu

ar, a medida criada para a rotina da função pode ser uma forma inválida de

valiar o conceito.

Todas as abordagens da investigação sobre a validade que foram discu

das até agora são procedimentos para avaliar aquilo que Campbell e Fiske

959 designam como validade convergente Em qualquer dos casos, o investi

ador preocupa-se em demonstrar que a medida se harmoniza com outra me

ida. Campbell e Fiske argumentam que este processo, em geral, não vai sufi

ientemente longe, uma vez que o investigador deveria usar diferentes medi

as do mesmo conceito para ver o grau em que existe convergência. Assim,

or exemplo, além de usar uma medida baseada num questionário sobre a ro

na da função, o investigador poderia utilizar observadores que classificas

em as características das funções para distinguir entre os graus de rotina das

unções existentes numa empresa por exemplo, Jenkins

et aI

1975 .A valida

e convergente poderia levar à demonstração de que existe uma convergên

ia entre as duas medidas, embora seja difícil interpretar uma falta de conver

ência já que qualquer das duas medidas pode ser inadequada. Muitos exem

Page 98: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 98/128

OS CONCEITOS E A SUA MEDIÇÃO

 

quando sugeriram que se deve ainda demonstrar que uma medida tem

v li-

i de discrimin nte Ainvestigação sobre a validade discriminante implica que

:ambém se deve procurar b ixos níveis de correspondência entre uma medida

e outras medidas que se supõe corresponderem a outros conceitos. Embora a

validade discriminante seja uma importante faceta da validade de uma medi

da, é provavelmente mais importante que o estudante se centre nos diferentes

aspectos, já discutidos, da validade convergente. Para investigar os vários ti

?OS de validade convergente e de validade discriminante, podem utilizar-se

as técnicas abordadas no Capítulo 8 que se centram nas relações entre pares

de variáveis.

Exercícios

1 Qual das afirmações está correcta? Uma escala de Likert é:

a um teste de validade;

b um procedimento que dá origem a medidas de itens múltiplos;

c um teste de fidelidade;

d um método para identificar as dimensões dos conceitos

Por que razão é útil considerar a hipótese de que um conceito compre

ende várias dimensões quando se pretende operacionalizá-Io?

3 Considere as seguintes questões utilizadas num questionário acerca de

hábitos de consumo de bebidas alcoólicas. Decida se cada uma das va

riáveis é nominat ordinat intervalar / proporcional ou dicotómica:

a Alguma vez consumiu bebidas alcoólicas?

Sim__

Não __ siga para a pergunta 5

b Se respondeu sim na questão anterior, qual das seguintes bebidas

alcoólicas consumiu mais frequentemente escolha uma só categoria ?

Cerveja __

Bebidas Brancas __

Vinho __

Licores __

Outras __

c Com que frequência consome bebidas alcoólicas? Assinale

a resposta que mais se aproxima do seu comportamento habitual

Diariamente __

A maior parte dos dias __

Uma ou duas vezes por semana __

Uma ou duas vezes por mês__

Algumas vezes por ano__

Page 99: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 99/128

 

ANÁLISE DE DADOS EM CIÊNCIAS 50

 Assumimos que o entrevistador pode ajudar os respond

a traduzir aquilo que consomem em unidades de álcool)

Número de unidades __

No Questionário do Trabalho, a variável absent é nominal,

 

intervalo ou dicotómica?

A fidelidade teste-reteste é um teste da fidelidade interna ou

Que procedimento do SPSSse deveria usar para que o  ut ut

sente o alfa de Cronbach para

 utonom

O que fez para a pergunta 6 seria um teste da fidelidade

ÍJ

externa?

Um investigador cria uma nova medida de múltiplos itens pa

servadorismo político . Administra amedida a uma amostra

duos e pergunta-lhes, também, como votaram nas últimas el

rais, para validar a sua medida. O investigador relaciona as

dos sujeitos com o seu voto. O que está ele a avaliar? a) a vali

corrente da medida, b) a validade preditiva da medida ou c)

é

discriminante da medida?

Page 100: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 100/128

Capítulo 5

RESUMIR OS OS

Quando os investigadores são confrontados com um conjunto de dados refe

~entes a cada uma das múltiplas variáveis usadas, necessitam de reduzir a in

:vrmação que recolheram. Se pudermos reduzir grandes quantidades de da

.:10S, torna-se possível detectar padrões e tendências que, de outra forma, fica

:-iamocultos.

É

bastante simples determinar o padrão de uma variável quan

io

temos, por exemplo, dados sobre dez casos. Contudo, se formos além dos

--inte casos começa a tornar-se difícil discriminar esses padrões, a menos que

- 5

dados sejam sintetizados de alguma forma. Além disso, quando queremos

~presentar os dados que recolhemos a outras pessoas, temos que ter consciên

=a de que seria extremamente difícil aos nossos leitores reter a informação re

:e ante. Este capítulo centra-se nos vários procedimentos que se podem utili

::ar para resumir uma variável.

 istribuições de frequência

~aginemos que dispomos de dados relativos a cinquenta e seis sujeitos que

: i.dicama que faculdade, de uma determinada Universidade, cada um deles

 ?-ertence(ver quadro 5.1). A Universidade tem apenas quatro faculdades:

 :: lgenharia, Ciências Puras, Arte e Ciências Sociais. Apesar de cinquenta e

~is ser um pequeno número de sujeitos, não é muito fácil ver como esses es

-..:.dantesse distribuem pelas diferentes faculdades. Um p~il~~iro passo que

 ?0de ser considerado quando se reduzem dados referentes a uma variável

: .)minal como esta (uma vez que cada faculdade corresponde a uma catego

: 2 discreta) é a construção de uma

distribuição de frequências

ou de uma

tabela

  .=. Tequências. Uma distribuição de frequências mostra-nos quantos casos ca

: :m em cada categoria. Por frequência entende-se simplesmente o número

Page 101: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 101/128

82

ANÁLISE DE DADOS EM CIÊNCIAS -

aculdades a que pertencem cinquenta e seis alunos Dados Fictícios

Caso nO

Faculdade

aso nO

a~u.~_rte9

ng

CP

 S

CS 

P

Eng

2S

Eng

3

rte

CS4

S Arte5

ng

CP6

P

Eng

7

ng

CS8S CS9

rte

CP S

Eng

 

ng

Arte2

P

Eng

3S CP

4P CS

5

ng

Eng

6

rte

CP7

ng

Arte8P

Eng

9

ng

Eng

 

rte

CP

 S Arte2

ng

Eng

3

rte

CP

4

ng

Arte5S CP

6

S

uma das frequências, i.e,

  frequênci rel tiv

O quadro 5.2 mostra-nos :._

número 11 é a frequência com que aparece a categoria Arte, o que sig::

que há onze alunos da amostra que estudam Arte e que esse número c

ponde a 20 por cento do número total de alunos.

O procedimento que permite criar uma distribuição de frequências :

o SPSS será explicado posteriormente, mas entretanto deve ficar compre:;

do que para construir uma tabela de frequências tem apenas que se cor,~

número de casos que cabem dentro de cada categoria. Habitualmente, é .:

também a percentagem que corresponde a cada categoria. Isto fornece-nc-;:

formação sobre a

frequênci rel tiv

da ocorrência de cada categoria nwr_=

riável, o que nos dá uma boa indicação da preponderância relativa COIr.

uma categoria surge numa amostra. O quadro 5.2 mostra-nos a distrib

de frequências dos dados apresentados em 5.1. As percentagens foram

I

dondadas, por defeito ou por excesso, até ao número inteiro correspon .

  usando a regra de que 0.5 ou mais corresponde ao número inteiro segui:

que para valores abaixo de 0.5 o número é arredondado por defeito :

Page 102: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 102/128

RESUMIR OS DADOS

Quadro 5 2 Tabela de frequência referente aos dados apresenados no quadro 5 1

n

ercentagem

 8

2

 3

3 4

5

56

 

aJ

18

16

14

12

n 10

8

6

4

2

o Engenharia Ciências Puras Artes Ciências Sociais

83

Figura 5 1

Gráfico de barras referente à distribuição dos estudantes por faculdades

tornar mais fácil a leitura do quadro. A letra

n

é, muitas vezes, utilizada para

referir o número de casos de cada categoria ou seja, a frequência . Uma forma

alternativa de apresentar uma distribuição de frequências referente aos da

dos apresentados em 5.2 consistiria em omitir as frequências de cada catego

ria e apresentar, apenas, as percentagens relativas. Esta abordagem reduz a

quantidade de informação que o utilizador tem de reter. Quando se faz essa

opção,

é

necessário indicar o número total de casos Le, n= 6 por baixo da co

luna das percentagens.

O quadro 5.2 pode ser facilmente adaptado a uma apresentação diagra

mática dos dados. Estes diagramas são, em geral, designados por gráficos de

barras  bar chart ou bar diagrams e são frequentemente escolhidos em detri

mento dos quadros por serem de assimilação mais fácil. Um gráfico de barras

Page 103: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 103/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

ategoria. Não é preciso organizá-las por qualquer tipo de ordem por exem

lo, das maiores para as mais pequenas ou vice-versa . As barras não devem

icar encostadas umas às outras, sendo preferível mantê-las nitidamente se

  necessário salientar que o gráfico de barras não fornece mais infor

ação do que o quadro 5.2; de facto, até se perde alguma informação - as

ercentagens. A vantagem principal deste tipo de representação é a facilida

e com que pode ser interpretada, característica que pode ser particularmen

útil quando a apresentação dos dados se dirige a indivíduos pouco familia

izados com material estatístico.

Quando é uma variável intervalar que se pretende apresentar numa ta

ela de frequências, os dados têm que ser agrupados. Deve calcular-se o nú

ero de casos que cabem em cada intervalo. Como exemplo, podemos anali

ar os dados respeitantes à variável r n im do Questionário do Trabalho.

ispomos de dados de sessenta e oito indivíduos faltam os dados de dois ,

as se não agruparmos os dados ficamos com trinta e três categorias de ren

imentos, o que é excessivo para permitir construir uma tabela de frequên

ias. Além disso, as frequências de cada categoria acabariam por ser demasia

o pequenas. No quadro 5.3, apresenta-se a distribuição de frequências dos

alores que a variável r n im assume. Foram utilizadas seis categorias. Na

onstrução destas categorias deve ter-se em conta um certo número de princí

ios. Em primeiro lugar, há autores que sugerem que o número de categorias

onsideradas se deve situar entre seis e vinte, uma vez que um número de

lasses demasiado grande ou demasiado pequeno pode distorcer a forma da

istribuição da variável em análise ver, por exemplo, Bohrnstedt e Knoke,

982 . Contudo, não é necessariamente verdade que o número de categorias

fecte a forma da distribuição. Além disso, quando os casos são poucos o nú

ero de categorias tem que ser inferior a seis, para que em cada categoria cai

a um número razoável de sujeitos. Por outro lado, um grande número de ca

gorias não tornará fácil a assimilação dos dados e, neste aspecto, a regra

rática de Bohrnstedt e Knoke, ao considerar que as categorias podem ser

inte, é um pouco exagerada. Em segundo lugar, as categorias devem ser dis

retas. Nunca se deve agrupar os dados de modo a ter categorias como estas

2.000 ou menos, 12.000-14.000, 14.000-16.000, e assim por diante. Em que ca

goria se incluiria o valor 12.000 ou 14.000 libras? Isto significa que as catego

ias devem ser discretas, como no quadro 5.3, de modo a que não haja qual

uer dúvida em relação ao grupo a que corresponde cada caso. Repare-se que

Page 104: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 104/128

RESUMIR OS DADOS

85

Quadro 5 3 Distribuição de frequências para os valores de rendim dados do Questionário do

Trabalho

Libras

até 12,000

12,000-13,999

14,000-15,999

16,000-17,999

18,000-19,999

20,000 e mais

Total

Nota: faltam dois casos.

30

20

10

C

::l

o

o O

n

1

16

 

7

2

68

Percentagem

1,5

23,5

29,4

32,4

10,3

2,9

100,0

/

Figura 5

até

\:12000 1:14000 \:15999 \:18000 1:19999

1:12000 \:13999 \:16000 \:17999 \:20000e mais

GPRENDIM

Histograma para os valores da variável rendim  dados do Questionário do Trabalho

houver um grande número de casos omissos relativos a urna determinada

  ariável.

A informação dada pelo quadro 5.3 pode com vantagem ser apresenta-

da na forma diagramática através de um

histograma histogram .

Um histogra-

:na é igual a um gráfico de barras excepto no facto de as barras estarem em

.:ontacto urnas com as outras; essa forma de representação pretende eviden-

;:iar a natureza contínua das categorias da variável em questão. A figura 5.2

3.presenta um histograma para os dados relativos à variável rendim As suas

Page 105: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 105/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

grupar os valores que ela toma. Pode, simplesmente, contar-se o númerc

asos em cada uma das quatro categorias e calcular-se as percentagens cor

É possível utilizar-se um histograma para apresentar os dac

ma vez que as categorias da variável estão ordenadas.

Utilizar o para criar tabelas de frequências e histogramas

ara criar uma distribuição de frequências para a variável rendim do Q1

onário do Trabalho, vamos necessitar de agrupar os dados. Caso contriÍ

bteremos uma frequência e uma percentagem para cada valor da variá

bteremos, também, um gráfico onde cada barra corresponde a um valor

a variável o que, numa amostra de grande dimensão, tornaria este grá

legível. Para agrupar os dados da variável

rendim

vamos utilizar o proo

Reeode.

Assim, vamos criar uma nova variável designada

rendill

isto é, grupos de rendimento). O objectivo desta recodificação é o de agru

s sujeitos da nossa amostra em seis grupos de rendimento: até f 12,000, d

,000-13,999; das

f

14,000-15,999; das

f

16,000-17,999; das

f

18,000-19,95

0,000 e mais. O procedimento seguinte permite realizar esta recodificaç

7 Transform 7 Reeode 7 Into Different Variables ... [abre

a caixé

diálogo

Reeode into Different Variables

apresentada na caixa 5.1]

7 rendim

 ~ [botão] [transfere a variável

rendim

para a caixa

NU

rie Variable70utput Variable:] 7

caixa abaixo de

Output Vari

Name

escrever

gprendim 7 Change

[tranfere

gprendim

para a C

NumericVariable70utputVariable:] 7 OldanNewValues ...

[ab

subcaixa de diálogo

Reeode into Different Variables: Old and New

lues

apresentada na caixa 5.2]

7 Na caixa à direita de

Value

[na secção

Old Value]

inserir O7 seleC

nar

Value

na secção

New Value

e escrever 0.7 Seleccionar

Range:

west through

e escrever

11999

na caixa a seguir a

through 7

seleccio

Value

na secção

New Value

e escrever 1

7 Add

[onovo valor aparec

na caixa

Old 7 New:] 7

seleccionar

Range:

e escrever

12000,

bem c

13999

na caixa a seguir a

through 7

seleccionar

Value

na secção N

Value e escrever 27 Add 7 seleccionar Range: e escrever 14000,  

Page 106: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 106/128

RESUMIR OS DADOS

• Resode inlo DIHerenl Vallables EI

 

:t> gpraeial

~ se o

i>

idade

i>

anos

  i>

envolv

~satis1

'~sa is2

i> satis3

.:11)

satis4

i>

autonom1

i>

autonom2

:'$)

autonom3

Numeric:- ariable·) OulpulVariable:

Caixa 5 A recodificação de rendim para rendimgp

•• nff~'I~:II ~IJ['i TTIi

-OldValue

r

Yalue:

r ~lem;riúSSing

r

Syslem- or J, ser·missing

r Ra.tJge:

L

r Range:

[i:l.~'l\f'tt~r(jYg·

lo Aall9 l:

120000 L tnrough highest

r

AliQlher alues

:aixa

5.2

A subcaixa de diálogo Recode into Different Variables: Old and New Values

Different Variables: Old and New Values]

~OKl

:)e seguida é necessário definir os rótulos de cada uma das seis categorias da

  ariável rendimgp (ver capítulo 2 para uma descrição deste procedimento).

Page 107: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 107/128

 

Variable{s}:

.-

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

aixa 5.3

A caixa de diálogo Frequencies

abela de frequências para rendimgp  output o SPSS)

GPRENDIM

,

,

I

Cumulative

Percent

até E12000 1

,4 1,5

,5

16

2,9 23,55,0

20

8,6 29,44,4

22

1,4 32,46,8

7

0,0 10,37,1

2

,9 2,900,0

68

7,1 100,0

00

2

,9

7000.0

A sequência seguinte dá origem à tabela de frequencias apresenta

uadro 5.4.

~ Analyze ~ Descriptive Statistics ~ Frequences ... [abre a cai:

Page 108: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 108/128

llSl.: VIIR OS DADOS

 

~==Slacked

SLnlI1lariesforgrbups of cases

SLnlI1lariesof se~arate yariables

Values of individual cases

~ ~a 5.4

A caixa de diálogo Bar Charts

:asas (Percent); a frequência associada com cada categoria na forma de uma

?€rcentagem que toma como base todos os casos de cujos dados dispomos

Valid Percent); e a percentagem acumulada (Cumulative Percent).

Para obtermos um histograma da variável rendimgp, devemos realizar

.)procedimento seguinte:

7 Graphs 7 Histogram ... [abre a caixa de diálogo Histogram]

7 rendimgp 7~ [botão] [coloca rendimgp na caixa Variable:] 7 OK

o histograma resultante apresentará barras de rendimento tal como defini-

das pelos critérios por defeito do SPSS.

Para produzir um gráfico de barras para uma variável nominal como

gpracial, podemos realizar o seguinte:

7 Graphs 7 Bar ... [abre a caixa de diálogo Bar Charts apresentada na

caixa 5.4]

7 Simple 7 Summaries for groups of cases 7 Define [abre a subcaixa

de diálogo Define Simple Bar: Summaries for Groups of Cases apre-

sentada na caixa 5.5]

7 gpradal 7 ~ [botão] próximo da caixa Category Axis [coloca gpra-

dal nesta caixa] 7 N of cases por baixo de Bar Represent [se esta opção

não estiver seleccionada, caso contrário proceder sem seleccionar] 7

OK

Page 109: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 109/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

. Oeline S.mple Bar Summalles fOI GlOupS 01 Cases -

Ei

~ sexo

~rendim

 fP idade

~anos

~envolv

· iP

salis1

~salis2

~salis3

 i

salis4

~aulonom1

~aulonom2

 

utonom

~aulonom4

~rolina1

'?> rolina2

 

aixa 5.5

%of~e

Curo. % 01 cases

A subcaixa de diálogo Define Simple Bar: Summaries for Groups of Cases

Africano

2,9%

Indiano

20,0%

Asiatico

25.7

Branco

51,4%

igura 5.3

Diagrama de queijo para gpracial (dados do Questionário do Trabalho)

ma forma de apresentação de dados muito útil quando o objectivo

é

salien

ar o tamanho relativo de cada fatia em comparação com a totalidade da

mostra. A figura 5.3 apresenta um gráfico de tipo queijo para a variável

pracial gerado pelo SPSS.Para obter este tipo de gráfico devemos proceder

a seguinte forma:

Page 110: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 110/128

Page 111: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 111/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

atia possa ser distinguida de outra. O gráfico da figura 5.3 foi editado a

e dois passos essenciais: a cor branca foi aplicada a todas as fatias e pa

iferentes foram aplicados a cada uma delas. Os procedimentos segt

ermitem realizar este tipo de edições:

~ Duplo dique em qualquer parte do gráfico. Isto abre a caixa

Editor. O gráfico aparecerá no Chart Editor a sombreado

Para encher cada fatia de cor branca:

~ seleccionar cada fatia do gráfico pequenos pontos aparecerão

mite da fatia

~ Format ~ Color ... [uma paleta de cores aparecerão] ~ Fill ~ ,

~ Apply ~ outra fatia e aplicar às restantes, ainda que possa ser

uma fatia numa cor mais escura ~ CIos e

ara criar um padrão diferente em cada fatia:

~ seleccionar cada fatia do gráfico pequenos pontos aparecerão

mite da fatia

~ Format ~ Fill pattern ... [uma palete de padrões aparecerão pa

leccionar] ~ seleccionar padrões ~ Apply ~ outra fatia

~ outro padrão [lembre-se que deve aplicar um padrão diferente

fatia] ~ Apply [continua até que cada fatia branca tenha um padr,

ferente] ~ Close

ote-se que os rótulos dos valores serão necessários para produzir as

as apresentadas na figura 5.3. Podemos adicionar as percentagens da

a que cada fatia representa tal como se pode observar na figura 5.3

uinte forma: quando posicionados no Chart Editor, dicar em Chart e d

m Options ... ; seleccionar Percents [a caixa ao lado de Text deve, tarr

ncontrar-se seleccionada]. Podemos, ainda, criar efeitos no gráfico

omo destacar uma das fatias do círculo de modo a salientar a sua impc

ia. Para fazer isto, dique na fatia pretendida e:

~ Format ~ Explode Slice

Page 112: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 112/128

RESUMIR OS DADOS

 edid s de tendênci centr l

93

Uma das formas mais importantes de sintetizar a distribuição de valores de

urna variável é estabelecer a sua

tendência central-

o vaIar típico da distribui

ção. Perguntamo-nos, por exemplo, onde tendem a concentrar - se os valo

res da distribuição? Para muitos leitores, isto pode significar que se procura a

 média de uma distribuição de vaiares. Contudo, quando os estatísticos fa

lam de valores médios referem-se a várias medidas. Discutiremos aqui três

medidas dos valores médios (i.e., medidas de tendência central): a média

aritmética, a mediana e a moda. Sephan J.Gould, um paleontólogo conhecido

pelos seus escritos científicos, ilustra duas destas medidas da seguinte forma:

Um político do partido do poder pode dizer, com algum orgulho: O rendimen

to médio dos nossos cidadãos é de 15,000 por ano . O líder da oposição pode

retorquir: Contudo, metade dos cidadãos ganha menos de 10,000 por ano .

Ambos estão correctos, mas nenhum cita as estatísticas com objectividade. O

primeiro utiliza a média, enquanto o segundo a mediana (Gould, 1991: 473).

~o fundo, este comentário não nos assegura relativamente à possível utiliza

ção indevida das estatísticas, mas ilustra bem as diferentes formas de apre

sentar um resultado médio.

A média aritmética arithmetic mean

Amédia aritmética é um método de calcular a média da distribuição que cor

responde à noção comum de média. Consideremos a seguinte distribuição de

 alares:

12 10 7 9 8 15 2 19 7 10 8 16

Determinar a média aritmética consiste em adicionar todos os valores (neste

caso, o resultado é 123) e dividir esse total pelo número de valores (no nosso

exemplo, 12).Neste caso, a média aritmética é 10.25.É este tipo de cálculo que

conduz a afirmações tão bizarras como: o número médio de crianças é

2 37

. :0

entanto, a média aritmética que é, frequentemente, simbolizada por

x

é,

de longe, a mais utilizada medida de tendência central. Muitos dos testes es

:atísticos que serão abordados em capítulos posteriores deste livro relacio

.,am-se directamente com a comparação das médias de diferentes amostras

au grupos de sujeitos (por exemplo, a análise de variância - ver capítulo 7). A

Page 113: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 113/128

94

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

ixos cujo efeito é, respectivamente, o de aumentar ou diminuir de forma en

nosa a sua magnitude. Isto tende a acontecer particularmente quando se

spõe de relativamente poucos dados; quando se tem muitos dados épreciso

e esteja presente um valor muito exagerado para distorcer o valor da mé

a. Assim, por exemplo, se na distribuição de doze valores que já apresentá

os substituirmos o 19por 59, a média seria 13.58em vez de 10.25, valor subs

ncialmente diferente e que constitui uma fraca representação da amostra no

u todo.

De uma forma semelhante, no quadro 8.10 do capítulo 8, a variável ta

anho da empresa contém um valor extremo (outlier; caso número 20), ou

ja, uma empresa com 2700 empregados. Note-se que a empresa seguinte

ssui, somente, 640.Amédia desta variável é de 499,mas se excluírmos o va

r extremo ela passa para 382,6. Como se depreende deste exemplo, um valor

tremo pode ter um impacto substancial na média aritmética, especialmente

ando o número de casos de uma amostra é pequeno.

A mediana median

mediana é o ponto médio de uma distribuição de valores. Parte uma distri

ição de valores em duas partes. Imaginemos que os valores de uma distri

ição são ordenados de forma crescente - por exemplo, 2, 4, 7, 9, 10: neste

emplo, a mediana é o valor central, isto é, 7. Quando o número de valores é

r, a mediana é a média dos dois valores do meio. Assim, no primeiro grupo

doze valores, para calcular a mediana poderíamos ordená-los deste modo:

2 7 7 8 8 ~ 10 12 15 16 19

este conjunto de valores, tomamos os dois valores sublinhados - o sexto e o

timo - somamo-los e dividimos o total por 2, i.e. (9+10)/2=9.5. Este valor

é

geiramente inferior à média a ritmética de 10.25, o que se deve provavelmen

à presença de três valores elevados no extremo final-15, 16 e 19. Se, em

z do 19 tivéssemos o 59, a média seria 13.58mas a mediana não seria afecta

porque enfatiza o centro da distribuição e ignora os extremos. Por esta ra

o, muitos autores sugerem que, quando existe um valor desviante que dis

rce a média, se deve considerar a mediana por ser um indicador mais repre

Page 114: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 114/128

RESUMIR OS DADOS

A moda mode

95

~te último indicador de tendência central é raramente utilizado na investi

;ação mas é frequentemente mencionado nos livros. A moda é simplesmen

:e o valor que ocorre com maior frequência numa distribuição. No exemplo

ie distribuição de doze valores que apresentámos há três modas - 7 8 elO .

.-\0 contrário da média que só se pode utilizar com variáveis de intervalo a

::nada pode ser utilizada a qualquer nível de medição. A mediana pode ser

:.:sada para variáveis ordinais e de intervalo mas não para variáveis nominais .

.-\ssim embora a moda pareça um indicador mais flexível é pouco utilizada

?orque não usa todos os valores da distribuição e porque no caso de existir

::1ais do que uma moda na distribuição não é fácil de interpretar.

 edir dispersão

?ara além de se interessarem pelo valor típico ou representativo de uma dis

:ribuição de valores os investigadores também procuram conhecer a quanti

dade de variação que a distribuição evidencia.

 

isto que se designa por dis-

::ersão   a extensão da distribuição. A dispersão pode dar-nos informações

:mportantes: por exemplo podemos encontrar duas empresas em que o ren

dimento médio dos trabalhadores manuais seja semelhante. Contudo numa

delas os salários podem ser mais variados com valores consideravelmente su

?eriores e inferiores aos da outra firma. Assim embora a média de salários

seja similar uma das empresas apresenta muito maior dispersão do que a ou

:ra. Pode ser útil acrescentar esta informação aos valores de medida de ten

dência central.

A mais óbvia medida de dispersão consiste em considerar o valor mais

alto e o valor mais baixo da distribuição e subtrair o segundo do primeiro. Ao

 esultado assim obtido chama-se amplitude da distribuição range . Embora de

:ácil compreensão tem a desvantagem de ser susceptível à distorção por in

]uência de valores extremos. Isto pode ser ilustrado com os dados fictícios

apresentados pelo quadro 5.5 que mostram as notas numa escala de 100 obti

das por duas classes de vinte alunos num teste de matemática. Cada uma das

classes é orientada por um professor diferente. As duas turmas têm médias

semelhantes mas os padrões das duas distribuições de valores são muito dife

 entes. A turma do professor A tem uma distribuição de notas pouco diversi

: icada enquanto que a do professor B apresenta muito maior dispersão.

::nquanto a nota mais baixa obtida na turma do professor A foi 57 a mais bai

xa na turma do professor B foi 45. De facto no caso do professor B há oito no

Page 115: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 115/128

96

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

dro 5.5 Resultados de um teste de aptidão matemática aplicado aos alunos de dois professore,

 Dados Fictícios

édia aritmética

Professor A

65

70

66

59

57

6

66

71

58

67

61

68

63

65

71

69

67

74

7

6

65.55

4.91

66

Professor B

57

49

46

79

72

54

66

65

63

76

45

95

62

68

50

53

58

65

69

72

63.2

12.37

64

arece exagerar essa dispersão. Para o professor A esse intervalo é 74-57,

7. Para B, o intervalo

é

95-45, i.e. 50. Este valor exagera a quantidade de

ersão uma vez que todos os valores excepto três se situam entre 72 e 45, o

plica que para a maioria dos valores o intervalo de variação seja igual a 2

Uma solução para este problema consiste em eliminar os valores ext

os. A amplitude interquartis

 inter-quartil range ,

por exemplo, é por ve:

comendada neste sentido (ver figura 5.4). Isto implica organizar os vaIo

uma ordem crescente. O intervalo é dividido em quatro partes iguais,

odo a que os primeiros 25 fiquem na primeira parte e os 25 maiores

uem na última. Estas divisões servem para definir quartis. Consideremo

rimeira distribuição que utilizámos para o cálculo da mediana:

Page 116: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 116/128

RESUMIR OS DADOS

Mediana

 

01 02 03

1 1

25 das

observações

t

Valor

mínímo

25 das

observações

25 das

observações

25 das

observações

t

Valor

máximo

Amplitude interquartis

Observações por ordem crescente

Figura 5 4 Amplitude interquartis

é

a diferença entre o primeiro e o terceiro quartis, ou seja, 14.25-7.25

=

7.Como

a figura 5.4 indica, a mediana é o segundo quartil mas não é um componente

:tecessário para o cálculo da amplitude interquartis. A principal vantagem

desta medida de dispersão é eliminar os valores extremos e a sua grande limi

:ação é ignorar 50 dos valores da distribuição, o que significa uma grande

?erda de informação. Um compromisso possível entre estes dois aspectos

?ode ser atingido através da divisão da distribuição em dez partes decis) e

do cálculo da amplitude interdecis. De um modo similar ao que se fazia para a

amplitude interquartis eliminam-se os valores mais altos e os mais baixos.

:\reste caso, só se perde 20 da distribuição.

Sem dúvida que o mais utilizado método de avaliar a dispersão é o des

: io-padrão standart deviation).

Na essência, o desvio-padrão reflecte a quanti

dade média de desvio em relação à média. O seu cálculo é, de algum modo,

mais complicado do que esta definição sugere. No capítulo 7, pode encon

trar-se uma descrição mais pormenorizada do desvio-padrão. O desvio-pa

drão evidencia o grau em que os valores de uma distribuição se afastam da

média aritmética. O seu valor é, em geral, apresentado em conjunto com a mé

dia, uma vez que é difícil compreender o seu significado sem fazer alusão a

esta segunda medida.

Podemos comparar as duas distribuições do quadro 5.5 Apesar das mé

dias serem muito semelhantes o desvio-padrão na turma do professor B

12.37) é muito maior do que o da turma do professor A 4.91). Deste modo, o

desvio-padrão permite a comparação directa dos graus de dispersão quando

Page 117: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 117/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

nterpretar. O desvio-padrão pode ser afectado pelos valores extremos mas

omo o seu cálculo depende de todos os valores envolvidos a distorção é me

os pronunciada do que no caso da amplitude. Por outro lado não devemos

gnorar a possibilidade de distorção por efeito dos valores extremos. No en

anto a menos que haja boas razões para não querer usar o desvio-padrão a

ua utilização é recomendada sempre que se pretenda obter uma medida de

É uma medida referida em geral nos relatórios de investigação e é

mplamente reconhecida como a principal medida de dispersão.

Anossa abordagem da dispersão destacou as variáveis de intervalo. Só

om esse tipo de variáveis se pode utilizar o desvio-padrão. A amplitude e a

mplitude interquartis podem ser usadas com variáveis ordinais embora

ssa não seja uma prática vulgar. Também com as variáveis nominais é pouco

requente a utilização de testes de dispersão. Provavelmente a melhor mane

ra de avaliar a dispersão das variáveis nominais e ordinais é usar gráficos de

arras histogramas e distribuições de frequências.

 edir a tendência central e a dispersão com o S SS

odas estas medidas podem ser geradas no SPSS.Tomando a variável ren im

título de exemplo vamos realizar a seguinte sequência de procedimentos:

~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de diá

logo Explore apresentada na caixa 5.8]

 

ren im

 

[botão] próximo da caixa

 epen ent

List [coloca a variá

vel ren im na caixa  epen ent List:]

~OK

• Explore

E

Eil

~~:

facto Lisl:

GO

T=_

I

J

Page 118: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 118/128

RESUMIR OS DADOS

99

uadro 5.6 O output do comando Explore para a variável rendim

 es riptives

~t ti<tic

c.

~

ean

15638,2353

42,0376Lower Bound

5155,1261

pper Bound

16121,3444

15582,3529

5600,0000

983590,869995,8935

18001000

200

500,0000370

291

- 294

74

P10t

Leaf

8

448

0244466668888

0022246668

0000246688

00002446666

00244666688

000226

O

6

O

Stem

 

11

12

13

14

15

16

17

18

19

20

21

1000

1 case s)

RENDIM Stem-and-Leaf

Frequency

1. 00

3.00

13.00

10.00

10.00

11. 00

11. 00

6.00

1. 00

1. 00

1. 00

Stem width:

Each 1eaf:

resultado deste procedimento é apresentado no quadro 5.6; através dele

btemos a média aritmética a mediana a amplitude os valores mínimo emá

imo o desvio-padrão e a amplitude interquartílica da variável rendim.

Métodos de apresentação dos dados: diagramas troncos-e-folhas

e diagramas extremos-e-quartis

:m1977 John Tukey publicou um importante livro com o título Exploratory

ata nalysis em que pretendia apresentar aos leitores uma série de técnicas

ue ele próprio tinha desenvolvido enfatizando o cálculo aritmético simples

Page 119: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 119/128

 

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

ntagem, aos procedimentos ortodoxos. Para a presente discussão, são bas

nte relevantes duas representações dia gramáticas dos dados - o diagrama

oncos-e-folhas stem and leaj

e o

diagrama extremos-e-quartis box and whiskers

boxplot .

Método troncos-e-folhas de classificação dos dados

ste tipo de representação é um modo muito simples de apresentar dados re

rentes a uma variável de intervalo, utilizando uma forma semelhante a um

stograma mas sem se sofrer a perda de informação que este último tipo de

áfico implica. Pode ser facilmente construído

à

mão, embora isso seja mais

fícil quando se trabalha com grandes quantidades de dados De forma a

strar a construção de um diagrama de troncos-e-folhas, vamos utilizar os

dos de um indicador de desempenho de uma autoridade local. Durante

certo período de tempo, o governo britânico encarregou uma Comissão

Auditoria com a tarefa de recolher dados relativos ao desempenho de au

ridades locais, de modo a poder comparar o seu desempenho. Um dos crité

os para medir este desempenho era a percentagem de necessidades satisfei

s aos munícipes num período de seis meses. Este critério demonstrou uma

ande variabilidade entre as diversas autarquias, tal como foi salientado, na

tura, por um jornalista do The Times:

Se uma criança em Sunderland necessitasse de educação especial, não teria qu~

quer probabilidade de ver esta necessidade satisfeita nos seis meses mais próxi

mos. Contudo, se esta mesma criança mudasse de residência para Durnham,

cerca de uma ou duas milhas de distância, teria 80 de probabilidade desta ne

cessidade ser satisfeita num curto espaço de tempo (Murray, 1995: 32).

e estes dados medem eficiência ou não é um problema de validade das medi

as utilizadas nesta auditoria (ver capítulo 4), mas não existe margem p~

úvida de que há uma grande variação relativamente à percentagem de ne

ssidades satisfeitas no espaço de seis meses. Como podemos observar r.

uadro 5.7, esta percentagem varia entre Oe 95

A figura 5.5 mostra o diagrama de troncos-e-folhas relativo a esta va.ru

l, que passamos a designar por necess. O gráfico possui duas componen

senciais: em primeiro lugar, os números à esquerda da linha vertical cons::

em o tronco e servem de pontos de partida para a apresentação de cada --

Page 120: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 120/128

RESUMIR OS DADOS

101

o

5.7

Percentagem de necessidades satisfeitas pelas autarquias num período de seis meses

em Inglaterra e Escócia. 1993-1994

londrinos

ICondados inglesesutoridades metropolitanas

ondados escoceses

1reat Manchester

Clwyd

0

5

olton

9

yfed

67

erkshire

16

ury

16

went

17 14

uckinghamshire

69

anchester

35

wynedd

88

36

Cambridgeshire

7

ldham

50

id Glamorgan

48

6

heshire

25

ochdale

O

powys

80

44

leveland

32

alford

10

outh Glamorgan

45 8

ornwall

3

tockport

16

West Glamorgan

4 4

umbria

35

ameside

16

2

Derbyshire

17

raflord

11

0evon 55

igan

21

' -lamlets

37

orset

33

erseyside

4

urham

72

nowsley

83

ast Susses

8

iverpool

95

Essex

9

t Helens

212

loucestershire

45

elton

37

40

ampshire

12

irral

13

37

Hereford

 

Worcs

3outh Yorkshire

23

Hertlordshire

61

arnsley

15

24

umberside

14

oncaster

127

I sle of Wight

60

otherham

10

3

Kent

15

heflield

4 2

ancashire

14

Tyne   Wear

10

eicestershire

.

ateshead

4

1

incolnshire

36

ewcastle upon Tyne

30 O

orfolk

1

orth

Tyneside

48

gdon

7

orthamptonshire

48

outh Tyneside

5 20

orthumberland

79

underland

O

27

orth Yorkshire

34est Midfands

16

Nottinghamshire

10

irmingham

5

3

xfordshire

22

oventry

20

34

hropshire

15

udley

41

27omerset 50

andwell

1

6

taflordshire

20

olihull

3124

uflolk

27

alsall

3

5

olverhampton

36est Yorkshire 14

radford

250

alderdale

28

7

5

-:e: adaptado do The Times 30 de Março 1995. p. 32.

Page 121: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 121/128

102

ANÁLISE DE DADOS EM CIÊNCIAS

soe

P10t

Leaf

00011112233333344444

5566778889

00000112234444

555566666777

001122344

555677779

00012344

55667778

014

558888

00

55

013

79

2

 >=79

NECESS Stem-and-Leaf

Frequency Stem

 

20.00 O

10.00 O

14.00 1

12.00 1

10.00 2

9.00 2

8.00 3

8.00 3

3.00 4

6.00 4

2.00 5

2.00 5

3.00 6

2.00 6

1. 00 7

4.00 Extremes

Stem width: 10.00

Each leaf: 1 case s)

igura 5.5

Diagrama de troncos-e-folhas para a variável necess

onto percentual, podemos observar que apenas cinco autoridades

m 10 das necessidades em seis meses. Todos os números à direita

evem ficar alinhados na vertical. Não é necessário que os seus valor

rdenados de O a 9,mas fazê-lo torna a leitura mais fácil. Note-se qU

uição é achatada no fundo. Aapresentação deste diagrama foi contr

rma a que os incrementos nos valores da variável fossem de 10 1.

ercentuais. Podemos pedir, também, que os valores extremos out]

m apresentados separadamente. Os investigadores experientes en

e dados exploratória utilizam um critério específico para a iden

estes valores extremos: os que se posicionam próximo do valor mí

istribuição podem ser identificados através da fórmula seguinte:

primeiro quartil- 1,5 x amplitude interquartílica)

Page 122: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 122/128

RESUMIR OS DADOS

  3

::-onco-e-folhas seguimos o mesmo procedimento do utilizado para produzir

~ medidas de tendência central e de dispersão (ver caixa

5.5):

~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de diá

logo Explore apresentada na caixa 5.8]

~ necess ~~ [botão] próximo de Dependent List: [tranfere a variável

necess para a caixa Dependent List:]

~ Plots na caixa próximo de Display ~ OK

  output

resultante é apresentado na figura 5.5. Os valores da coluna mais à

::-squerda representam a frequência de cada ocorrência. Podemos, também,

= 9servar que existem dados omissos para duas autoridades locais.

Este método proporciona-nos uma apresentação semelhante ao histo

~ama, na medida em que nos dá uma ideia da forma da distribuição (se, por

::xemplo, os valores se centram num extremo), o grau de dispersão que apre

õ-entame a existência ou não de valores extremados. Contudo, ao contrário do

_--.lstograma,mantém toda a informação de modo a que os dados possam ser

.:n-ectamente analisados para se verificar quais os valores predominantes.

Diagrama extremos-e-quartis

-.:,.igura 5.6 mostra-nos a estrutura de um diagrama de extremos-e-quartis. O

-2ctângulo representa os

50

centrais das observações. Assim, o seu extremo

_Lferior,em termos da medida a que se refere, é o primeiro quartil e o seu ex

::-emo superior é o terceiro quartil. Por outras palavras, este diagrama com

:,:-eende a amplitude interquartílica. A linha assinalada é a mediana. As li

:-.hastracejadas dirigem-se para baixo até ao valor mínimo da distribuição e

:-ara cima até ao valor máximo, excluindo valores extremos

 outliers

que são

_-:dicados separadamente. Este tipo de apresentação tem um certo número de

u311tagens. Tal como foi discutido anteriormente, este método dá-nos infor

::-:açãosobre a forma e a dispersão da distribuição - por exemplo, o rectân

;..Jloestá mais próximo de um extremo ou do meio? Se se desse o primeiro

~,,-so,sso indicar-nos-ía que os valores tendiam a concentrar-se num pólo. A

:-:-imeira situação mostraria que os valores tendem a concentrar-se no limite

Page 123: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 123/128

Page 124: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 124/128

RESUMIR OS DADOS

  5

? ocedimento referido na página 103, o SPSSvai gerar um diagrama de tron

:~-folhas e um de extremos-e-quartis.

Qualquer destas técnicas de análise exploratória dos dados pode ser re

:omendada como um passo útil no sentido de conhecer os dados quando co

:::1eçamosa estudá-los. Deverão elas ser utilizadas como alternativa aos histo

~amas e a outras abordagens mais comuns? De facto, elas têm a desvanta

~em de serem pouco conhecidas. Das duas, o diagrama de troncos-e-folhas é,

:alvez, o mais fácil de assimilar, uma vez que o diagrama extremos-e-quartis

:equer a compreensão da noção de quartil e de mediana. Qualquer um deles,

~ for usado para um público pouco familiarizado com estas técnicas, pode

::iar algumas dificuldades; se, pelo contrário, o público os dominar, estes mé

:odos de apresentação dos dados têm muito a seu favor.

  form de um distribuição

-á fizémos referência em várias ocasiões à forma da distribuição. Assim, por

exemplo, os valores de uma distribuição podem tender para um dos extremos

)u concentrar-se no centro. Nesta secção, vamos especificar melhor os aspec

:05

ligados à forma da distribuição e introduzir conhecimentos fundamentais

::>araa compreensão de alguns métodos de análise de dados que serão abor

iados em capítulos posteriores.

Os estatísticos descreveram uma série de curvas de distribuição. A mais

:.mportante é sem dúvida, a distribuição norm l A distribuição normal tem a

:orma de um sino. Pode tomar uma variedade de aspectos diferentes, depen

jendo do grau de dispersão dos dados. Na figura

5.8

temos exemplificadas

iu s

curvas características da distribuição normal. O termo normal pode

~'lduzir em erro, porque na realidade é muito raro encontrarem-se distribui

;ões perfeitamente normais. Contudo, os valores da variável podem aproxi

:nar-se da distribuição normal e, quando isso acontece, tendemos a pensar

:ceIes como se tivessem, de facto, as propriedades da distribuição normal.

~.luitas das técnicas estatísticas mais comuns usadas nas ciências sociais pre

5umem que as variáveis analisadas têm uma distribuição próxima da normal

\-er a discussão de testes paramétricos e não paramétricos no capítulo

7).

A distribuição normal resulta de todos os casos que abarca debaixo da

5ua curva. Cinquenta por cento dos casos ficarão de um lado da média

=.ritmética; os outros cinquenta por cento ficarão do outro lado (ver figura

~ 9 Amediana será igual à média: é por isso que a curva tem o seu pico no va

.::lI

da média. Esta distribuição implica que a maior parte dos valores se situ

Page 125: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 125/128

106

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

 

5 8 Duas distribuições normais

50

dos

casos

5 9 Média e distribuição normal

ode ilustrar perfeitamente este tipo de curva. A altura média de uma mulher

dulta no Reino Unido é 160.9 em. Se a altura das mulheres seguir uma distri

uição normal a maior parte delas terá uma altura próxima da média. Muitc

oucas serão muito altas ou muito baixas. Sabemos que a altura das mulheres

m estas propriedades; agora se essa variável tem uma distribuição norma:

erfeita é já um assunto diferente.

Page 126: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 126/128

RESUMIR OS DADOS

107

~:~g~:

~:8~oSOS

~~:~~:

~~7~oSOS

 

-~.~~~l-~~

~~S-

4.13 34.13

·3

dp

·2

dp

.

dp

 

dp

+2

dp

 3

dp

Número de desvios padrão a partir da média

-igura 5.10 Propriedades da distribuição normal

Estas propriedades da distribuição normal são extremamente importantes

quando o investigador pretende fazer inferências sobre a população a partir

de uma amostra. Esta questão é o ponto central em análise no capítulo 6.

É importante ter em conta que há variáveis que não seguem o formato

da curva da distribuição normal. Por vezes, podem até afastar-se bastante

dessa disposição. Essa tendência é muito clara quando os valores de uma dis

rribuição são assimétricos ou enviesados isto é, quando tendem a concentrar-se

num extremo. Quando isso acontece, a média e a mediana deixam de coinci

dir. Estas ideias são ilustradas pela figura 5.11.O diagrama da esquerda mos

tra uma curva que épositivamente assimétrica na medida em que os valores ten

dem a concentrar-se à esquerda e existe uma cauda longa no lado direito. A

variável necess ilustra uma distribuição positivamente as simétrica, tal como

o diagrama extremos-e-quartis da figura 5.7 sugere a média é 24,75 e a me

diana é 20,00). No diagrama da direita, a curva é negativamente enviesada ou

negativamente assimétrica Outro tipo de disposição é a de uma distribuição

com mais do que um pico.

Apesar de se reconhecer que algumas variáveis, em ciências sociais, não

Page 127: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 127/128

  8

ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS

y

Mediana Média

x

y

Média Mediana

x

Distribuição positivamente

assimétrica

Distribuição negativamente

assimétrica

Figura 5.11 Distribuições positiva e negativamente enviesada

argumentariam que não seria correcto aplicar testes estatísticos que pressu

põem que os dados seguem uma distribuição normal quando as variáveis

se:

distribuem de forma pronunciadamente

enviesada.

Muito frequentemente

pode examinar-se se as curvas se afastam da curva característica da distribui

ção normal através da análise de uma distribuição de frequências ou de urr

histograma.

O SPSSpermite-nos avaliar o enviesamento Skewness , através do proce

dimento seguinte avariável rendim vai ser utilizada a título de ilustração :

~ Analyze ~ Descriptive Statistics ~ Frequencies ... [abre a caixa de

diálogo Fequences apresentada na caixa 5.3]

Frequencies: Slalislics I J

Continue

ntral TeriOencl

_.•VaJues are group roidpoínts

Percentae Values

t1 Quartiles

01Cyt points forllQJl equal groups

Page 128: Analise de dados em ciencias sociais.pdf

8/11/2019 Analise de dados em ciencias sociais.pdf

http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 128/128

RESUMIR OS DADOS

  9

~ rendim ~ ~ [botão] ~ Statistics [abre a subcaixa de diálogo Fre

quences: Statistics apresentada na caixa 5.9]

~ Skewness na caixa Distribution ~ Continue [fecha a subcaixa de

diálogo Statistics]

~OK

e não houver   ssimetri ou seja, se a variável for normalmente distribuída,

-€ráregistado um valor de zero ou próximo de zero. Se o valor for negativo os

.ados são negativamente assimétricos; se for positivo são positivamente assi

étricos. Por outro lado, este teste não é fácil de interpretar e é importante

onfrontar a possibilidade de uma assimetria excessiva a partir da observa

o directa dos dados. Isto pode ser feito através de uma distribuição de fre

uências ou através de uma representação diagramática, como um histogra

a ou um diagrama troncos-e-folhas.

Exercícios

Qual o procedimento do SPSSnecessário para criar uma distribuição de

frequências para os dados do Questionário do Trabalho referentes a

produtiv, acompanhada dos valores percentuais e da mediana?

Faça correr, novamente, o procedimento que utilizou na pergunta 1.