investigação por questionario

D I N M I A

CENT RO DE EST UDOS SOBRE A MUDANA SOCIOECONMICA

INVESTIGAO EMPRICA EM CINCIAS SOCIAIS: Um Guia IntrodutrioManuela Magalhes Hill & Andrew HillWP1998/10 Outubro 1998

ndicePREFCIO ..................................................................................................................................................................................1 1. A NATUREZA DA INVESTIGAO EMPRICA......................................................................................................................2 2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS ...............................................................................................................4 3. PASSOS PARA ESCOLHER UM TEMA.................................................................................................................................5 4. A REVISO DA LITERATURA................................................................................................................................................6 5. O PLANEAMENTO DA INVESTIGAO EMPRICA..............................................................................................................9 5.1. AS RELAES ENTRE AS HIPTESES, OS MTODOS DE INVESTIGAO E OS MTODOS PARA ANALISAR DADOS .........................9 5.2. A RECOLHA DOS DADOS ...................................................................................................................................................15 5.2.1.A fiabilidade das medidas feitas por questionrio...............................................................................................16 5.2.2. A validade das medidas feitas por questionrio.................................................................................................21 5.3. AMOSTRAGEM..................................................................................................................................................................27 5.3.1. Definies: o universo de casos e a amostra de casos .....................................................................................27 5.3.2. A escolha de uma amostra ...................................................................................................................................27 6. ALGUNS PROBLEMAS COM A ANLISE DE DADOS .......................................................................................................32 6.1. O AGRUPAMENTO DE CASOS .............................................................................................................................................32 6.2. PROBLEMAS COM AS CORRELAES PARAMTRICAS (TIPO PEARSON R) ...........................................................................35 6.2.1.O problema da no-linearidade .............................................................................................................................35 6.2.2.O significado estatstico e o significado prtico do coeficiente de correlao .................................................35 6.3. PROBLEMAS RELACIONADOS COM O QUI-QUADRADO (2)...................................................................................................36 6.3.1.Que Qui-quadrado utilizar? ...................................................................................................................................36 6.3.2. O problema das frequncias esperadas pequenas.............................................................................................37 6.3.3. Qui-quadrado e percentagens..............................................................................................................................37 6.I.3.4. Um Qui-quadrado fora do usual.........................................................................................................................38 6.4. PROBLEMAS RELACIONADAS COM O TESTE T ...................................................................................................................38 6.4.1. O Teste t para duas amostras independentes: o problema das varincias desiguais ...................................39 6.4.2. O Teste t para duas amostras emparelhadas....................................................................................................39 6.4.3. O Teste t do Tolo .............................................................................................................................................40 6.4.4. Teste t e comparaes mltiplas .......................................................................................................................41 6.5. ANLISE DE COMPONENTES PRINCIPAIS VERSUS ANLISE FACTORIAL ..................................................................................43 BIBLIOGRAFIA.........................................................................................................................................................................45 ANEXO......................................................................................................................................................................................46

DINMIA -Centro de Estudos sobre a Mudana Socioeconmica MANUELA MAGALHES HILL & ANDREW HILL

INVESTIGAO EMPRICA EM CINCIAS SOCIAIS: Um Guia Introdutrio

PREFCIO

O presente working paper destina-se essencialmente a jovens investigadores que ainda no tenham grande experincia no planeamento de trabalhos empricos. No entanto, o working paper pode tambm ser til para alunos de cincias sociais (licenciatura ou mestrado) que pretendam, ou necessitem de, fazer investigao emprica. A ideia de escrever o presente working paper nasceu da experincia dos autores na orientao de teses de mestrado e doutoramento, em particular, na rea dos Recursos Humanos. Por este motivo, os exemplos apresentados ao longo deste working paper vm principalmente do contexto dos Recursos Humanos, embora os princpios da investigao emprica indicados possam ser generalizados a qualquer outra rea das cincias sociais. So dois os objectivos deste working paper:

Apresentar duma maneira simples e acessvel, os pontos essenciais de uma investigao emprica; Referir alguns dos problemas que vulgarmente surgem numa tal investigao e dar conselho prtico para os resolver.

Um guia introdutrio exactamente isso -- introdutrio. Num tal guia no possvel explicar tudo, nem explicar com detalhe exaustivo os assuntos a tratados. Da que, de vez em quando, oferecemos referncias literatura especializada de modo que o leitor possa aprofundar o seu conhecimento. So muitas as investigaes em cincias sociais que utilizam questionrios para recolher os dados. Embora este working paper aborde brevemente os problemas da fiabilidade e da validade de medidas feitas por questionrio, no apresenta conselhos sobre a composio de um questionrio. Este assunto tratado separadamente num outro working paper, complementar a este, intitulado A construo de um questionrio.

1 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


1. A NATUREZA DA INVESTIGAO EMPRICA

Tipos de investigao emprica muito vulgar considerar que h trs tipos distintos de investigao emprica em cincias sociais. Investigao pura: O objectivo deste tipo de investigao descobrir factos novos (dados empricos) para testar dedues feitas de uma teoria que s tem interesse intelectual e que, na altura da investigao, parece no ter aplicao prtica. O objectivo deste tipo de investigao , essencialmente, enriquecer a literatura numa rea terica determinada. Por exemplo, nos anos sessenta, desenvolveram-se muitas investigaes puras em psicologia social sobre a teoria de atribuies. Investigao aplicada: O objectivo deste tipo de investigao descobrir factos novos (dados empricos) para testar dedues (hipteses) feitas de uma teoria que pode, em princpio, ter aplicaes prticas no mdio prazo. Por exemplo, nos anos setenta e oitenta, houve muitas investigaes que aplicaram aspectos da teoria de atribuio em busca da causa de um tipo de depresso. Investigao aplicvel: O objectivo deste tipo de investigao descobrir factos novos (dados empricos) que sejam capazes de resolver problemas prticos no curto prazo. Curiosamente, os trs tipos de investigao no so to diferentes como parecem. O que tm em comum que todos os tipos de investigao emprica so baseados numa reviso da literatura relevante. bvio que, numa investigao pura, o tema e as hipteses de investigao so retirados de uma reviso da literatura. menos bvio, mas igualmente certo, que uma investigao aplicada se baseia numa reviso da literatura (como no exemplo anterior). Neste caso, o tema talvez no seja retirado da literatura, mas as hipteses so deduzidas das teorias a apresentadas e, muitas vezes, os mtodos de investigao vm da literatura. Em relao investigao aplicvel, o tema no depende na literatura -- foi fornecido na forma de um problema prtico que precisa de ser resolvido. Acontece porm que raramente possvel resolver problemas prticos atravs de uma investigao emprica sem ajuda de uma reviso da literatura relevante. Por exemplo, suponha que a Administrao de uma empresa encontra um nvel muito elevado de rotao voluntria nos seus trabalhadores. Este um problema prtico porque um nvel alto de rotao voluntria faz baixar a produtividade. possvel efectuar uma investigao para resolver o problema, mas o que que a investigao deve investigar? A literatura na rea da sociologia aplicada indica que a rotao voluntria est provavelmente relacionada com vrios tipos de atitude, e vrios tipos de insatisfao, dos empregados. Portanto, parece til investigar estes tipos de atitude e insatisfao efectuando entrevistas ou aplicando um questionrio. As duas primeiras seces deste working paper tratam mais de investigao pura no sentido que tratam do processo de investigao e do problema de encontrar um tema para investigar. Portanto, estas seces so especialmente relevantes para a investigao acadmica, em particular para os alunos que tm de fazer um projecto de fim de licenciatura ou para aqueles que tenham de elaborar uma tese de mestrado ou doutoramento.



O processo de investigao emprica O processo de investigao no s um processo de aplicao de conhecimentos mas tambm um processo de planificao e criatividade controlada. Para introduzir a natureza essencial de uma investigao emprica considere-se a seguinte analogia. Imagine que parte de Lisboa para passar uns dias no Alentejo. A viagem tem um objectivo ir em trabalho ou ir apenas de frias. Para tal, vai ter de fazer escolhas ir de carro, de comboio ou de autocarro. Vai ter de planear a viagem -dia e hora de partida. Vai ter de pensar adiante -- que roupas adequadas levar? -- onde vai ficar? A investigao emprica tambm pode ser considerada uma viagem. Tal como a viagem ao Alentejo, a viagem da investigao tem um objectivo e obrigao a fazer escolhas. A viagem da investigao tambm precisa de planeamento e o investigador tem de pensar adiante. Tal como a viagem ao Alentejo, a viagem da investigao uma viagem de ida e volta. Comea no Pas Terico chega ao Pas Prtico e termina mais uma vez no Pas Terico. Em resumo, a viagem da investigao emprica compreende os seguintes aspectos:

Tem como objectivo contribuir para o enriquecimento do conhecimento na rea em que escolheu fazer a investigao. Precisa de escolhas em termos do tema e em termos das hipteses especficas a testar. Obriga-o a planear os mtodos de recolha de dados. Precisa que pense adiante para planear as anlises de dados antes de comear a parte emprica da investigao.

Vejamos ainda o seguinte: para ir de Lisboa ao Alentejo precisa de usar uma ponte para atravessar o rio Tejo e tem varias opes -- ponte 25 Abril, ponte Vasco da Gama ou ponte de Vila Franca de Xira. Na sua viagem da investigao, para passar do Pas Terico para o Pas Prtico tambm precisa de usar uma ponte porque h um abismo grande entre os dois pases (o vale dos investigadores perdidos!). Neste caso, a ponte a hiptese da investigao. Infelizmente esta ponte no existe pelo que tem de ser construda por si -- mas tem vrias maneiras de a construir. O Pas Terico a parte terica da sua investigao e consiste principalmente na reviso de literatura sobre o tema que escolheu. O Pas Prtico a parte emprica da sua investigao e consiste na planeamento e execuo do trabalho emprico. Ao efectuar a reviso de literatura vai encontrar teorias, relatrios e artigos sobre investigaes empricas apresentados por diversos autores. A primeira tarefa ser utilizar essa literatura para deduzir um hiptese, ou um conjunto de hipteses, que vai testar na parte emprica. A hiptese uma parte muito importante do processo de investigao porque, como j dissemos, faz uma ponte entre a parte terica e a parte emprica da investigao. Sendo uma ponte, a hiptese tem um papel fundamental:

A hiptese deve justificar o trabalho da parte emprica da sua investigao. Para compreender a importncia deste ponto suponha que j terminou o trabalho e escreveu o seu relatrio ou tese. Quando algum (por exemplo, o arguente, no caso de ser uma tese) for ler a parte emprica do relatrio, ele/ela tem de ficar convencido de que o trabalho faz sentido e est justificado pela reviso da literatura apresentada na parte terica do relatrio. Quem for ler a tese, s vai entender o porqu da parte emprica se a hiptese estiver claramente ligada com a reviso da literatura e claramente ligada com o trabalho emprico. Estas ligaes so o papel da hiptese, da a hiptese ter sido associada a uma ponte, na analogia.3 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Para encontrar uma hiptese claramente ligada com a reviso da literatura essencial que a reviso da literatura seja estritamente relevante para o tema da investigao. Mas, obviamente, antes de fazer uma tal reviso preciso escolher um tema.

2. A ESCOLHA DE UM TEMA: PRINCPIOS GERAIS

Esta seco refere-se a investigao emprica a desenvolver por alunos de mestrado ou doutoramento, e ainda alunos num ano terminal de licenciatura que tenham de elaborar o projecto final. Vamos usar a palavra tema para representar um assunto especfico, um problema ou uma linha de investigao, para os quais existe literatura desenvolvida e sobre os quais h teoria(s) e trabalhos empricos publicados. No usamos a palavra tema para representar a hiptese da sua investigao. A hiptese vir da sua reviso desta literatura. A escolha do tema pressupe trs princpios fundamentais:.

O tema deve cumprir as regras da licenciatura ou do mestrado

Isto implica que:

o aluno deve demonstrar que beneficiou dos conhecimentos adquiridos durante a parte escolar do curso (domnio da literatura e da cultura na rea que desenvolveu, bem como, conhecimento das tcnicas e realidades na rea).

No caso de um Mestrando, deve ter capacidade para desenvolver investigao ao nvel de ps-graduao (desenvolver investigao ao nvel de ps-graduao mais exigente que ao nvel de licenciatura).

O tema deve ser adequado em escala

Isto significa que o tema deve ser realstico e manejvel. muito natural desenvolver um projecto ou uma tese de mestrado demasiado ambiciosos e complicados. Para fazer um projecto ou uma tese de mestrado adequados em termos de escala numa dada rea muito importante no esquecer que tem de enfrentar vrios constrangimentos prticos, tais como:

Tempo (o trabalho de investigao precisa sempre de mais tempo do que o previsto) Acesso literatura relevante Acesso aos dados seu conhecimento prvio sobre o tema

Um trabalho de investigao ideal aquele que apresenta uma investigao relativamente curta em escala, mas com hipteses simples, claras e interessantes.

Deve escolher um tema sobre o qual tem particular interesse



Vai gastar muito tempo e muita energia com o trabalho de investigao que vai desenvolver. por isso natural que, no curso da investigao, haja perodos em que tudo ande mal - vai ter frustraes e encontrar problemas. Se no tiver muito interesse no tema que escolheu, durante estes perodos difceis, a sua motivao pode baixar ao ponto de pr em causa a qualidade do seu trabalho.

3. PASSOS PARA ESCOLHER UM TEMA

Para escolher um tema til comear por escolher uma rea de interesse antes de passar para o tema propriamente dito. Assim, sugerem-se os seguintes passos: PASSO 1. Objectivo: Encontrar uma rea geral que o interesse

Mtodo:Ler em diagonal alguns livros gerais Se j decidiu qual a rea geral sobre a qual est interessado em desenvolver a sua investigao, boa ideia comear mesmo assim por ler em diagonal alguns livros e artigos gerais porque possvel que encontre uma rea que o venha a interessar mais. Se ainda no encontrou uma rea interessante para a sua investigao, e no tem nenhuma ideia sobre o que que gostaria de investigar, os livros gerais so teis porque, normalmente, apresentam teorias e resumos de resultados de investigaes empricas. Neste passo s importante encontrar uma rea geral e no vale a pena entrar nos pormenores dos estudos empricos que aparecem na literatura. Encontrada uma rea geral que o interesse, passe ao passo seguinte: PASSO 2. Objectivo: Mtodo: Encontrar um tema dentro da rea geral escolhida Comear a ler artigos nas revistas acadmicas da especialidade

Paradoxalmente, na busca de um tema, muitas vezes mais til usar uma estratgia do fim para o princpio, ou seja, comear por ler (em diagonal) os artigos mais recentes na rea geral escolhida. Estes artigos podem dar informao sobre os tpicos actualmente considerados importantes e interessantes. Provavelmente no vai compreender tudo nestes artigos, mas os artigos que aparecem nas revistas acadmicas contm referncias sobre as teorias relevantes, livros especializados e outros trabalhos empricos constantes da literatura, que ajudam compreenso. Convm lembrar que a investigao em Cincias Sociais, pode ser ligada com vrias disciplinas; por exemplo, a Economia, a Sociologia, a Psicologia, e at a Medicina, pelo que pode ser til consultar tambm os Anurios e os Abstracts nestas disciplinas. Por exemplo: Annual Review of Sociology Annual Review of Psychology Sociological Abstracts Psychological Abstracts Index Medicus Paralelamente pode usar vrias fontes de informao disponveis em CD-ROM tais como a Sociofile. (E sempre h as consultas Internet)5 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Como resultado do Passo 2 deve ficar com um conjunto de informaes, preferivelmente na forma de fotocpias de artigos seleccionados. Esta informao constituir a literatura relevante para o seu tema. A partir daqui passar para uma nova fase da sua investigao - fazer uma reviso desta literatura em busca de um hiptese (ou hipteses) para investigar na parte emprica do seu trabalho. CONSELHO PRTICO mais fcil e adequado trabalhar primeiro a literatura sobre o tema, e deduzir a partir da as hipteses da investigao, do que partir de hipteses definidas a priori, e ir procura de literatura que as suporte.

4. A REVISO DA LITERATURA

OBJECTIVO:

Encontrar uma (ou mais) Hipteses Gerais.

Para j vamos usar a palavra simples Hiptese para designar Hiptese Geral, mas mais tarde vamos fazer uma distino entre Hipteses Gerais e Hipteses Operacionais. MTODO: A reviso da literatura envolve trs partes:

Descrio das teorias e trabalhos empricos Avaliao das teorias e trabalhos empricos Comparao das teorias e trabalhos empricos

As Hipteses representam concluses tiradas a partir da avaliao e comparao dos trabalhos apresentados na literatura, e, portanto, estas duas partes da reviso so muito importantes.

A descrio dos trabalhos empricos

conveniente fazer anotaes e pequenos resumos de cada um dos trabalhos empricos que seleccionou. Essas anotaes devero incluir, para alm dos resultados e concluses:

A situao em que o trabalho foi feito; (Pas, local, sector de actividade, tipo de empresa, instituio, organizao, etc.) A natureza dos casos famlias, grupos sociais, empresas, sectores de actividade, trabalhadores, etc.; (Se forem empresas -- dimenso, nmero de trabalhadores, regime jurdico, etc..) (Se forem trabalhadores idade, sexo, profisso, natureza do emprego, etc.)

A amostra de casos; (Dimenso da amostra, natureza da amostra - por exemplo, amostra por convenincia, amostra aleatria simples, amostra estratificada representatividade)

As hipteses do trabalho;6 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Os mtodos usados no trabalho; (entrevistas, questionrios, estudos de casos, etc.) (Se questionrios a fiabilidade e a validade (se disponveis))

Os mtodos utilizados na analise dos dados.

A avaliao dos trabalhos empricos

Efectuada uma descrio conveniente dos textos recolhidos durante a pesquisa bibliogrfica, torna-se importante proceder em seguida a uma avaliao sobre os ltimos quatro pontos acima referidos (amostra, hipteses de trabalho e mtodos utilizados). A avaliao no difcil, s precisa de tentar responder s seguintes perguntas:

A amostra do estudo era adequada? Era representativa do Universo? (Se no, os resultados s tm valores limitados) As hipteses eram claras e estavam justificadas pela teoria ou pela reviso da literatura? (Se no, os resultados podem no ser significativos e as concluses no ser vlidas) Os mtodos usados no trabalho eram adequados? (Se no, os resultados no so credveis) Os mtodos utilizados para analisar os dados foram os mais apropriados? Permitiram testar as hipteses adequadamente ? (Se no, os resultados e concluses no so credveis)

A comparao dos trabalhos empricos

Esta a parte mais difcil da reviso da literatura mas essencial se pretender encontrar uma Hiptese interessante e bem justificada para a parte emprica do seu trabalho. Uma estratgia que o poder ajudar a efectuar esta comparao a seguinte: 1 - Tente agrupar os trabalhos empricos em dois conjuntos. Um a que chamaremos GRUPO onde as hipteses testadas so idnticas ou bastante semelhantes entre si, e outro designado por ISOLADOS, formado por trabalhos em que cada trabalho/autor testou uma hiptese diferente. Assim tem-se: GRUPO ISOLADOS

2 - Tente agora dividir o GRUPO em dois subgrupos de trabalhos: num deles, as concluses dos trabalhos so concordantes, e no outro, as concluses so discordantes. Assim:

GRUPO

ISOLADOS

Concordantes Discordantes

3 - Tente ainda, dentro de cada subgrupo, formar mais dois subgrupos: um em que o trabalho foi tecnicamente bem feito, segundo a avaliao que efectuou anteriormente, e outro em que achou que o trabalho foi mal feito. Faa o mesmo para os trabalhos ISOLADOS. Tem-se assim:7 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


GRUPO

ISOLADOS

Concordantes

Discordantes

Bem

Mal

Bem

Mal

Bem

Mal

4 - Finalmente, tente formar mais dois subgrupos dentro de cada um dos subgrupos existentes: um grupo em que os trabalhos usaram mtodos semelhantes (S), e outro grupo em que os trabalhos usaram mtodos muito diferentes (D). Nota: no possvel fazer isto para os trabalhos isolados Assim:

GRUPO

ISOLADOS

Concordantes Discordantes

Bem

Mal

Bem

Mal

Bem

Mal

S1

D1

S2

D2

S3

D3

S4

D4

Porque que se torna til classificar os trabalhos empricos desta maneira? A resposta simples. Basicamente, podemos definir quatro tipos diferentes de trabalho emprico que pode desenvolver na sua tese, e os vrios subgrupos S e D indicam que tipo(s) de trabalho(s) ser razovel efectuar com base na literatura associada ao subgrupo. Os quatro tipos de trabalho emprico so os seguintes: - RPLICA DE UM TRABALHO ENCONTRADO NA LITERATURA A rplica utiliza hipteses, mtodos, situao e tipo de amostra iguais aos utilizados no trabalho apresentado na literatura) REPLICAR um trabalho apresentado na literatura muito til quando encontramos um estudo isolado bem feito. Isto porque um tal estudo precisa de ser replicado especialmente, quando os resultados e concluses parecem potencialmente importantes. - CONFIRMAO DE UM TRABALHO APRESENTADO NA LITERATURA



Neste tipo do trabalho a hiptese, a situao e o tipo de amostra so iguais s do trabalho encontrado na literatura mas os mtodos de investigao, e talvez os mtodos para analisar dados so diferentes. A CONFIRMAO til para S1 e S3 porque estes trabalhos utilizaram mtodos semelhantes e portanto importante confirmar as concluses usando mtodos diferentes. A CONFIRMAO pode tambm ser til no caso de um trabalho isolado bem feito. MELHORIA DE UM TRABALHO PUBLICADO NA LITERATURA Neste tipo de trabalho emprico, as hipteses gerais dum trabalho publicado na literatura so retidas mas as hipteses operacionais, os mtodos de investigao, a amostragem e os mtodos para analisar os dados, so mais adequados. A MELHORIA til para S2, D2, S4, D4 bem como para os trabalhos isolados mal feitos porque estes trabalhos precisam de ser feitos novamente utilizando processos e tcnicas mais correctas. - EXTENSO DE UM TRABALHO APRESENTADO NA LITERATURA Este o tipo de trabalho emprico mais criativo. possvel estender um trabalho apresentado na literatura de vrias maneiras, por exemplo:

Inventando uma hiptese alternativa para explicar os resultados de um trabalho na literatura; Deduzindo uma hiptese nova, interessante e importante, a partir das concluses do trabalho apresentado na literatura, se este estiver bem feito.

A EXTENSO til para S1, D1 e trabalhos isolados bem feitos.

5. O PLANEAMENTO DA INVESTIGAO EMPRICA

5.1. As relaes entre as hipteses, os mtodos de investigao e os mtodos para analisar dadosComo j referimos no incio deste texto, a investigao emprica uma viagem de ida e volta que comea e termina na literatura. Comea no Pas Terico, chega ao Pas Prtico e volta novamente ao Pas Terico. As etapas desta viagem podem ser visualizadas esquematicamente na Figura 1.

Figura 1

A LITERATURA 9 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


HPOTESE GERAL

CONCLUSES

HIPTESE OPERACIONAL

MTODOS DE INVESTIGAO

ANLISE DE DADOS

RECOLHA DE DADOS

RESULTADOS

Planeamento Aco Inferncia

Feita a reviso da literatura e estabelecida a hiptese geral do seu trabalho, torna-se necessrio operacionalizar a hiptese geral e seleccionar os mtodos de investigao. S depois que se poder passar recolha e anlise de dados e apresentao dos resultados. Estes, vo confirmar ou negar a hiptese operacional estabelecida e esta confirmao ou negao que vai fornecer as concluses do seu trabalho emprico. Estas concluses do evidncia para comentar a literatura (o que o objectivo principal da investigao). Suponhamos agora que j efectuou a reviso da literatura e estabeleceu a Hiptese para o trabalho emprico (note que s tem de inventar a sua prpria Hiptese se usar o tipo de investigao EXTENSO. Se fizer investigaes dos tipos RPLICA, CONFIRMAO ou MELHORIA, a sua Hiptese j existe na literatura). A prxima fase do planeamento do trabalho emprico comea na traduo da Hiptese Geral em Hiptese Operacional. A Hiptese Geral exactamente isso -- geral. A Hiptese Operacional mais especfica e, no caso de os dados serem analisados usando mtodos estatsticos, a Hiptese Operacional dever ser escrita de modo a indicar a natureza das operaes estatsticas necessrias para a anlise. Por exemplo: HIPTESE GERAL: Na empresa X, o absentismo est relacionado com a idade dos trabalhadores. HIPTESE OPERACIONAL: O nmero de dias de absentismo observado no ano 1998 na empresa X est significativamente correlacionado com a idade dos trabalhadores.10 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Quando estamos a planear o trabalho emprico essencial pensar na Hiptese Operacional, nos mtodos da investigao e nas anlises de dados, em conjunto. essencial pensar nestes trs aspectos em conjunto porque, como a Figura 1 mostra, h interligaes entre estas trs fases do trabalho, e em cada uma delas, h tipos de constrangimentos ou limitaes que automaticamente tm repercusses nas outras. So muitos os investigadores inexperientes que no pensam nas anlises de dados aquando do planeamento do trabalho e, no fim, tm grandes dificuldades em encontrar mtodos adequados para analisar os dados. Pensar nos mtodos para analisar dados to importante na fase do planeamento que vamos dar um exemplo para ilustrar a natureza dos problemas: Imagine uma empresa em que a Directora de Recursos Humanos se apercebe de que muitos dos operrios numa dada seco andam insatisfeitos. Como a empresa tem um Consultor na rea de Recursos Humanos, a Directora falou com ele sobre este assunto e disse que , em sua opinio, a insatisfao provocada por falta da variedade no trabalho na seco. Pede ento ao Consultor que proceda a uma investigao emprica e diz que a Hiptese Geral do trabalho deve ser: HIPTESE GERAL: A variedade no trabalho est relacionada com a satisfao global no emprego O Consultor traduz esta hiptese na seguinte Hiptese Operacional: HIPTESE OPERACIONAL: Os operrios que tm variedade no trabalho tm um valor mdio de satisfao global superior ao dos operrios que no tm variedade. Para medir a satisfao global e a variedade no trabalho, o Consultor elaborou um pequeno questionrio com apenas duas perguntas.

Pergunta 1. SATISFAO GLOBAL Em que medida est satisfeito com o seu emprego?NEM SATISFEITO NEM INSATISEITO 3

MUITO INSATISFEITO 1

INSATISFEITO 2

SATISFEITO 4

MUITO SATISFEITO 5

Pergunta 2. VARIEDADE (Var 1) Tem variedade no seu trabalho?NO 0 SIM 1



O Consultor aplicou o questionrio aos 20 operrios da seco. O Quadro 1 mostra as respostas obtidas, onde a varivel Var 1 representa a medida da variedade e Sat representa a medida da satisfao global. (Para j ignore a varivel Var 2 que explicaremos mais adiante). Quadro 1. Respostas ao questionrio aplicado

OPERRIO

VARIEDADE VAR 1

SATISFAO GLOBAL SAT 1 2 2 2 3 3 3 4 5 3 2 2 1 1 1 1 1 1 1 1

VARIEDADE VAR 2 0 0 0 0 0 1 1 1 2 3 3 3 3 4 4 4 4 4 4 4

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Do Quadro 1 ressalta que 5 operrios (nmeros 1, 2, 3, 4 e 5) consideram que no tm variedade no trabalho. O Consultor designou este grupo de operrios por Grupo 1. Os outros 15 operrios (nmeros 6 20) que consideram ter variedade no trabalho foram designados por Grupo 2. Para testar a Hiptese Operacional o Consultor calculou a valor mdio da satisfao global (varivel Sat) para cada um dos dois grupos. Estes valores esto apresentados no Quadro 2 . Quadro 2. satisfao global mdia por grupos de variedade no trabalho

VARIEDADE (VAR 1) GRUPO (1) (n = 5) (NO) GRUPO (2) (n = 15) (SIM)

Valor mdio de SATISFAO

2,00

2,00

Os valores mdios dos dois grupos so iguais e portanto o Consultor tirou a seguinte concluso:12 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


CONCLUSO: A Hiptese deve ser rejeitada. No h relao entre variedade no trabalho e satisfao no emprego. Mas a Directora de Recursos Humanos no confiou nesta concluso. Ela apercebeu-se que o Consultor cometeu duas faltas: Falta 1 a Hiptese Geral estabelecida pela Directora referia existir uma relao entre variedade no trabalho e satisfao global. O Consultor foi testar uma hiptese que refere existir diferena entre os valores mdios da satisfao. A Hiptese Operacional no foi adequada. Falta 2 a pergunta feita para medir variedade no trabalho usou uma escala de respostas muito restrita (apenas duas respostas alternativas SIM e NO). Para avaliar a relao entre duas variveis mais adequado usar uma escala de resposta mais larga porque a avaliao deve ser feita usando um coeficiente de correlao. A Directora decidiu ento fazer ela o seu prprio questionrio reescrevendo a Hiptese Operacional da seguinte forma: HIPTESE OPERACIONAL 2: A variedade no trabalho est correlacionada com a satisfao global Ela substituiu a pergunta 2 por uma nova: Pergunta 3 . VARIEDADE (Var2)

Existe variedade no seu trabalho?NENHUMA 0 POUCA 1 MDIA 2 BASTANTE 3 MUITA 4

Esta pergunta foi igualmente aplicada aos 20 trabalhadores da investigao do Consultor e os resultados encontram-se na ltima coluna do Quadro 1. Antes de testar a sua Hiptese Operacional a Directora resolveu, por curiosidade, calcular os valores mdios da satisfao global para a sua investigao. Separou ento o grupo de trabalhadores que disseram que no tiveram NENHUMA variedade no trabalho (valor 0 na nova medida de Variedade Var2) do grupo de trabalhadores que disseram ter ALGUM GRAU DE VARIEDADE no trabalho (valores 1, 2, 3 ou 4 na nova medida da Variedade Var2). O Quadro 3 apresenta estes valores mdios.

Quadro 3. Satisfao global mdia por grupos de variedade no trabalho13 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


VARIEDADE (VAR 1) GRUPO (1) (n = 5) (Nenhuma) GRUPO (2) (n = 15) (Alguma)

Valor mdio de SATISFAO

2,00

2,00

Mais uma vez os valores mdios so iguais (obviamente !!). Ento, para testar a Hiptese Operacional 2, a Directora calculou o coeficiente de correlao de Pearson entre a satisfao global (Sat) e a variedade (VAR 2). O valor encontrado foi -0.482, que um valor significativo (p < 0,05). Este valor suporta a concluso de que os trabalhadores mais satisfeitos pensam que tm menos variedade no trabalho uma concluso exactamente ao contrrio do que a Directora esperava!! (lembrese que ela disse ao Consultor que na sua opinio a insatisfao era provocada por falta de variedade no trabalho). Para verificar este resultado inesperado, a Directora calculou ainda o coeficiente de correlao no paramtrica de Spearman. O valor deste coeficiente foi -0,467 (tambm um valor significativo). Ento ela lembrouse que quando estudou Mtodos Quantitativos lhe foi ensinado que sempre til fazer um grfico dos dados quando se est interessado na relao entre variveis. E portanto, a Directora resolveu fazer o seguinte grfico

Figura 2 5,5

4,5

Satisfao global

3,5

2,5

1,5 1 2 3 7 case cases cases cases

0,5 -0,5

0,5

1,5

2,5

3,5

4,5

Variedade (VAR2)



O grfico mostra que existe uma relao nolinear entre Satisfao e Variedade (Var 2). A Directora calculou ento o coeficiente de correlao no-linear entre Satisfao e Variedade (Var 2) ajustando uma funo quadrtica aos dados. O valor encontrado foi 0.810 (p < 0,0001) e portanto ela tirou a seguinte concluso: CONCLUSO A Hiptese 2 aceitvel. H correlao significativa, mas nolinear, entre satisfao e variedade. Os operrios mais satisfeitos tm um grau de variedade intermdio e os operrios mais insatisfeitos no tm nenhuma ou tm muita variedade no trabalho. QUE RESULTADOS DEVEMOS TIRAR DESTE EXEMPLO? CONSELHO PRTICO Cuidado com os Consultores !! Na fase do planeamento do trabalho devemos verificar sempre se a Hiptese Operacional uma boa traduo da Hiptese Geral. (a Directora traduziu bem, mas o Consultor no!). Depois de estabelecer a Hiptese Operacional necessrio seleccionar mtodos adequados para recolher os dados (medir as variveis). Aqui devemos pensar adiante para verificar se, em princpio, as medidas das variveis sero capazes de testar a Hiptese Operacional duma maneira justa e adequada. Caso contrrio, temos que mudar ou a Hiptese ou os mtodos para medir as variveis (a Directora mudou os dois). Paralelamente, preciso escolher os mtodos para analisar os dados e necessrio verificar se, na prtica, estes mtodos so adequados para testar a Hiptese Operacional. Se pretendermos usar mtodos estatsticos que assumem pressupostos fortes sobre a natureza dos dados (por exemplo, linearidade, normalidade, homogeneidade), conveniente pensar em mtodos alternativas porque muitas vezes os dados no verificam os pressupostos. Note que, na investigao do Consultor, por causa da natureza da medida de variedade que s tinha duas respostas pergunta SIM / NO, era impossvel encontrar uma relao no-linear entre satisfao global e variedade no trabalho. Portanto, era impossvel calcular uma correlao no-linear, pelo que o trabalho do Consultor no encontrou a concluso certa.

5.2. A recolha dos dados

Os trs mtodos mais vulgarmente utilizados para efectuar a recolha dos dados, ou seja, para medir as variveis so:

Consulta a estatsticas ou a uma base de dados scioeconomicos j existente. Entrevista. Questionrio.

Destes mtodos, o mais vulgar o do questionrio provavelmente porque mais fcil de aplicar e mais fcil de analisar numa maneira quantitativa. Por causa da popularidade do questionrio vamos tratar principalmente deste mtodo embora nos devamos lembrar que entrevistas (bem preparadas) tm algumas vantagens. A construo de um questionrio e a comparao entre questionrios e entrevistas em termos de vantagens e desvantagens um assunto longo demais para tratar neste working paper, e portanto ser tratado separadamente . Aqui vamos apenas tratar dois aspectos tcnicos das medidas feitas por questionrio: A fiabilidade das medidas e a validade das medidas.1

1

Ver Hill, Manuela e Hill, Andrew (1998), A construo de um Questionrio, DINMIA, ISCTE 15 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


5.2.1.A fiabilidade das medidas feitas por questionrioUm questionrio pode ser utilizado tanto para obter factos como para medir opinies, atitudes, satisfaes, etc.. Quando aplicamos um questionrio, as respostas obtidas formam um amostra tirada do universo das respostas possveis. Quando usamos um questionrio que tem perguntas fechadas (perguntas que tm um conjunto de respostas alternativas escritas pelo investigador) o universo das respostas alternativas definido pelo conjunto das respostas alternativas. Por exemplo, considere a seguinte pergunta: Em que medida est satisfeito com o seu chefe de seco?Muito pouco 1 Pouco 2 Razoavelmente 3 Bastante 4 Muito 5

Nesta pergunta, o universo de respostas possveis definido por cinco respostas e o universo dos valores da satisfao tem cinco valores possveis (1,2,3,4,5). Como qualquer outra amostra, a amostra de respostas que obtemos de um questionrio contm provavelmente erros. Para entender melhor este ponto imagine que aplicmos esta pergunta 50 vezes (uma vez por semana) ao respondente Jos. Os resultados so apresentados no Quadro 4. Quadro 4. frequncia das respostasRESPOSTAS Muito pouco 1 Frequncia 1 Pouco 2 3 Razoavel mente 3 41 Bastante 4 4 Muito 5 1

evidente que a resposta tpica Razoavelmente, e o valor mais representativo do grau da satisfao o valor 3 (o valor mdio do grau de satisfao = 3,02). Mas evidente tambm que h variao nas respostas de tempo em tempo. Esta variao indica a falta de estabilidade temporal na medida da satisfao com o chefe. Os valores 1,2,4 e 5 da satisfao no so representativos do valor tpico (valor 3) e, em termos estatsticos, estes valores so erros. Mas de onde vm estes erros? Principalmente so as variaes no estado fsico ou mental do Jos que produzem os erros. Por exemplo, o valor 1 (muito pouco satisfeito) podia ter acontecido quando o Jos estava deprimido, ou muito cansado, ou zangado depois de uma discusso com o Chefe. O valor 5 pode ter acontecido quando o Chefe o recomendou para promoo. Uma outra fonte de erros est ligada com a natureza das perguntas e as escalas de resposta usadas no questionrio. Por exemplo, perguntas complicados, perguntas mltiplas e escalas de resposta inadequadas ou ilgicas trazem dificuldades de interpretao por parte dos respondentes e podem produzir erros. Normalmente, s se aplica o questionrio uma vez e, portanto, s obtemos uma amostra de um s valor (uma resposta) para cada um das perguntas. Deste modo, no sabemos se o valor observado (a resposta pergunta) ou no representativo do verdadeiro valor no universo. Por outras palavras, no sabemos se a resposta tpica ou um erro causado por um estado no tpico do respondente, por uma pergunta mal escrita, ou por outra razo qualquer por exemplo, o respondente mentiu. Normalmente, aplicamos um questionrio a um conjunto de respondentes e, portanto, para cada um das perguntas obtemos um conjunto de valores observados. Naturalmente, h variao nos2

2

estes aspectos so discutidos em Hill, Manuela e Hill, Andrew (1998), A construo de um Questionrio, DINMIA, ISCTE 16 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


valores observados porque os respondentes so pessoas diferentes, mas cada um dos valores observados potencialmente contm erro. A teoria da fiabilidade baseada no pressuposto de que VALOR OBSERVADO = VERDADEIRO VALOR + ERRO E a fiabilidade de uma medida definida como (2) (1)

Note que a Fiabilidade essencialmente uma medida do erro. No caso ideal, quando no h erro, o verdadeiro valor e o valor observado so iguais, como se pode ver pela equao (1), e a Fiabilidade igual a 1 (o que indica fiabilidade perfeita da medida). Estimativa da fiabilidade (tipo estabilidade temporal)

Como j dissemos anteriormente, uma fonte de erro a falta de estabilidade temporal. possvel estimar este erro aplicando duas vezes o questionrio ao mesmo grupo de respondentes. Normalmente, o intervalo de tempo entre as aplicaes deve ser de, pelo menos, uma semana. A correlao entre os valores resultantes da aplicao 1 e da aplicao 2 do questionrio d uma estimativa do rcio na equao (2) e portanto d uma estimativa da Fiabilidade do tipo estabilidade temporal. Estimativas da fiabilidade de um conjunto da perguntas (fiabilidade interna)

Podemos estar interessados em usar um conjunto de perguntas para criar uma varivel nova. Por exemplo, suponha que queramos criar uma medida da Satisfao Global com o emprego, e suponha que a literatura sobre satisfao no emprego indica que h quatro componentes da Satisfao Global: Satisfao com o Chefe , Satisfao com o Ordenado, Satisfao com o Trabalho e Satisfao com os Colegas. Escrevemos as quatro perguntas seguintes para medir estas componentes, e vamos designar as perguntas por itens no Questionrio. (note que a varivel Satisfao Global definida por quatro itens) Pergunta: Em que medida est satisfeito com:Muito pouco Pouco Razoavel mente Bastante Muito

1O seu ordenado O seu chefe O seu trabalho Os seus colegas

2

3 X X

4

5

X

X

(As respostas apresentadas com um X so as respostas de um s respondente, por exemplo, o Jos) Neste caso, a nova varivel Satisfao Global, definida por quatro componentes e o valor da Satisfao Global pode ser calculado como a soma dos valores das respostas aos quatro itens. Para o Jos, o valor da Satisfao Global (1 + 3 + 3 + 5) = 12.



Para estimar a Fiabilidade do tipo estabilidade temporal para esta nova varivel Satisfao Global, tnhamos de aplicar o questionrio pelo menos duas vezes. Mas, quando uma varivel definida por um conjunto de componentes h uma fonte de erro no ligada com a estabilidade temporal. Cada um dos itens escritos para medir as componentes uma parte da nova varivel (Satisfao Global), e os quatro itens devem contribuir igualmente para a Satisfao Global. Mais especificamente, a varincia da cada um deles deve contribuir igualmente para a varincia dos valores da Satisfao Global e a soma das varincias dos quatro itens deve ser, no caso ideal, um quarto da varincia da Satisfao Global. Qualquer diferena nas contribuies pode ser considerada como um erro produzido por falta de consistncia entre os itens. H vrios mtodos para estimar a fiabilidade ligada com esta fonte de erro e este tipo de fiabilidade chamase Fiabilidade interna. O mtodo mais vulgar para estimar a Fiabilidade interna o coeficiente alpha () devido ao americano Lee Cronbach. Este coeficiente pode ser interpretado como um coeficiente de correlao. Para uma medida baseada em k itens o valor de alpha tem a seguinte expresso:=k soma das varincias de cada item 1 k 1 varincia total dos k itens

Note que h outros mtodos para estimar a fiabilidade interna. Destes, o mais vulgar o chamado mtodo split half em que os itens so divididos em dois grupos por exemplo, no nosso exemplo, o Grupo 1 pode conter satisfao com Ordenado e satisfao com o Trabalho e o Grupo 2 conter satisfao com Chefe e satisfao com os Colegas. Para cada um dos respondentes o valor total (soma dos valores) dos dois itens em cada um dos grupos calculado e o coeficiente de correlao entre estes totais d uma estimativa da fiabilidade interna. Mas este mtodo, embora simples, tem um problema: que h vrias maneiras de dividir os itens (trs maneiras no caso de quatro itens) e os coeficientes nem sempre concordam entre si. Qual o mtodo certo para agrupar os itens? Tradicionalmente, o mtodo par/mpar era o utilizado (Grupo 1 = itens 1 e 3; Grupo 2 = itens 2 e 4) mas um mtodo arbitrrio e portanto, um mtodo muito fraco. Note-se, contudo, que o mtodo split-half um caso especial do mtodo alpha, sendo o valor do alpha igual ao valor mdio de todos os coeficientes possveis split half (no nosso exemplo, trs coeficientes). Portanto o coeficiente alpha prefervel. A fiabilidade da uma pergunta aberta (Fiabilidade de concordncia)

Por vezes os investigadores querem usar perguntas abertas, ou seja, perguntas para as quais o respondente tem de construir e escrever as respostas. Quase sempre as respostas dadas s perguntas abertas tm de ser interpretadas. Considere este exemplo em que o investigador quer classificar a resposta de cada um dos respondentes em termos de uma ou outra de duas categorias Opinio geralmente favorvel e Opinio geralmente desfavorvel.

Pergunta: Qual a sua opinio sobre o seu Chefe? Uma possvel resposta pode ser: Geralmente simptico mas tem favoritos na seco e s vezes no justo. Tem vontade de ouvir os nossos problemas e de vez em quando luta por ns contra a gerncia mas s de vez em quando.18 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


A opinio deste respondente sobre o Chefe favorvel ou desfavorvel? Obviamente, a resposta uma mistura de opinies favorveis e desfavorveis, mas o investigador quer classificar a resposta total como Geralmente Favorvel ou Geralmente Desfavorvel. A deciso precisa de um julgamento subjectivo porque depende da interpretao do investigador. Mais especificamente, depende do peso(importncia) que o investigador der s opinies positivas e s opinies negativas na resposta. Dois investigadores podem discordar na classificao porque do pesos diferentes (por causa dos seus valores e das suas personalidades) e a possibilidade de variao nas classificaes interpretao das respostas. A este tipo de fiabilidade ligado com o investigador como fonte do erro d-se o nome de Fiabilidade da concordncia. Um grau elevado de concordncia entre dois ou mais avaliadores indica um grau elevado de fiabilidade. Quando estamos perante dois avaliadores possvel estimar a fiabilidade da concordncia usando vrias estatsticas. Por exemplo, imagine que dois avaliadores avaliaram as respostas pergunta acima para 20 respondentes. O Quadro 5 apresenta os resultados. da mesma resposta indica que o prprio investigador uma fonte de erro na

Quadro 5. cruzamento das avaliaes feitas s respostas pergunta aberta AVALIADOR 2 Geralmente Geralmente favorvel desfavorvel Geralmente 6 2 Favorvel AVALIADOR 1 Geralmente 5 7 Desfavorvel TOTAL 11 9 H dois tipos de mtodos para avaliar a fiabilidade da concordncia: Mtodo 1

TOTAL 8 12 20

Utiliza correlaes (Coeficiente ou Cramrs V no caso em que os avaliadores usam mais do que duas categorias). Estas correlaes so relacionadas com Qui quadrado ( ).2 = 2 Cramer ' s V = 2

n

e

n(k 1)

Onde n o nmero total de respostas e k o nmero de categorias usadas pelos avaliadores Mtodo 2 Utiliza as percentagens dos casos em que os dois avaliadores concordam na classificao. (p > 0,05) e a percentagem dos

No nosso exemplo, o valor do coeficiente 0,328, pelo que no significativo casos em que os avaliadores concordam dada por [(6 + 7)/20 ] 100 = 65 %.

Temos aqui um problema porque o valor 65% revela um grau de concordncia razovel (ou pelo menos no mau), mas o valor do coeficiente no significativo, o que indica que as classificaes dos avaliadores no so significativamente concordantes. A razo deste problema que a percentagem (Mtodo 2) no corrige as concordncias que podem acontecer por acaso. No exemplo, o avaliador 1 classificou 8 respostas como Geralmente Favorvel e o avaliador 2 classificou 11 respostas como Geralmente Favorvel. Portanto, nesta situao, em mdia, [(8 11) / 20] = 4.4 respostas seriam classificadas como Geralmente Favorvel s por acaso. Analogamente, em mdia, [(12 9) / 20] = 5,4 respostas19 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


seriam classificadas como Geralmente Desfavorvel s por acaso. Portanto, o nmero de respostas onde os avaliadores concordaram, (6 + 7) = 13, inclui (4,4 + 5,4) = 9,8 casos onde a concordncia pode ter acontecido s por acaso. luz deste facto, obvio que a percentagem de concordncia deve ser corrigida. Uma estatstica que faz esta correco o coeficiente Kappa. O valor de Kappa indica a proporo dos casos em que os avaliadores concordam nas suas classificaes depois de fazer a correco para a concordncia que acontece por acaso. Se esse valor for igual a 1,00 existe concordncia perfeita entre os avaliadores. normal multiplicar o valor de Kappa por 100 para dar a percentagem de concordncia entre os avaliadores e este valor apresenta a melhor medida de Fiabilidade da concordncia. Para o exemplo dos dados do Quadro 5 o valor de Kappa dado por

Kappa =

(13 9,8) = 0,314 (20 9,8)

Portanto, os avaliadores concordaram em 31,4% das suas classificaes (depois da correco) -- o que um valor fraco. luz deste valor, no h grande surpresa que o valor calculado para o coeficiente no seja significativo. possvel calcular o valor Kappa quando os avaliadores classificam as respostas em mais de duas categorias. Notese, contudo, que os avaliadores tm de usar o mesmo conjunto de categorias (i.e., no exemplo, os dois avaliadores tm de usar as categorias Geralmente Favorvel e Geralmente Desfavorvel. No possvel um avaliador usar Favorvel/Desfavorvel e o outro usar Agressivo/Passivo ou qualquer outro conjunto de categorias). CONSELHO PRTICO SOBRE FIABILIDADE 1. muito importante dar ateno fiabilidade das medidas feitas por questionrio porque no vale a pena tirar concluses a partir de medidas que no tenham fiabilidade adequada. 2. A escala seguinte d uma indicao aproximada dos para avaliar o valor da uma medida de fiabilidade. Maior que 0,9 Entre 0,8 e 0,9 Entre 0,7 e 0,8 Entre 0,6 e 0,7 Abaixo de 0,6 .... . . . . Excelente Bom Razovel Fraco Inaceitvel

3. O valor de alpha aumenta com: (a) nmero de itens (perguntas) no questionrio; (b) correlaes mais elevadas entre os itens (perguntas); Portanto, se quiser criar uma nova varivel a partir dum conjunto de perguntas dum questionrio, vale a pena usar mais perguntas do que as necessrias e seleccionar depois um conjunto suficientemente grande delas que estejam bem correlacionadas entre si. 4. Para calcular o valor do coeficiente alpha use a opo SCALE e a sub-opo RELIABILITY ANALYSIS no SPSS (note que possvel usar esta opo para seleccionar um conjunto de componentes ptimas). Use a sub-opo SCALE IF ITEM IS DELETED para avaliar rapidamente o valor do coeficiente alpha para vrias combinaes de componentes. 5. O coeficiente da fiabilidade interna split half pode ser calculado usando a opo SCALE no SPSS, mas como j dissemos o coeficiente alpha prefervel.



6. Como medida da fiabilidade da concordncia, o coeficiente Kappa tem a vantagem de ser mais claro e mais simples de interpretar do que o coeficiente Phi (). A vantagem do coeficiente de, por ser um coeficiente de correlao, o SPSS dar a sua significncia. Sugere-se pois o clculo dos dois coeficientes porque o SPSS no permite a avaliao da significncia de Kappa. 7 Para calcular o valor das estatsticas Phi () e Kappa como estimativas da fiabilidade da concordncia use a sequncia de opes SUMMARIZE, CROSSTABS e STATISTICS (dentro da opo CROSSTABS). Para aumentar a fiabilidade da concordncia na classificao das respostas de perguntas abertas, ou em entrevistas, muito til elaborar uma sistema para classificar as respostas. Por outras palavras, conveniente elaborar uma grelha de respostas, ou tipos de respostas, que pertenam a cada uma das categorias usadas para fazer a classificao. Quando os avaliadores usam o mesmo sistema para classificar as respostas a fiabilidade da concordncia (normalmente!) aumenta.

8.

5.2.2. A validade das medidas feitas por questionrioFiabilidade e validade de uma medida no so a mesma coisa, e tm uma relao estranha. Uma medida pode ter boa fiabilidade mas ter pouca validade e, sem fiabilidade adequada, a medida no pode ter validade adequada. Em termos lgicos, podemos afirmar: A existncia de fiabilidade adequada necessria, mas no suficiente, para garantir validade adequada Uma medida tem validade se for uma medida da varivel que o investigador pretende medir. Mas no verdade dizer que uma medida vlida ou no vlida -- h graus da validade. Vejamos isto com o seguinte exemplo: suponha que um investigador pretende medir a caracterstica pessoal generosidade das pessoas. Para isso, elaborou a seguinte pergunta:SIM NO

uma pessoa generosa? Acha que as respostas a esta pergunta vo ser sempre verdadeiras? Provavelmente no! Na nossa sociedade a generosidade uma caracterstica admirada -- tem grande valor social ( ao contrrio da avareza). Quase todas as pessoas gostam de ser consideradas generosas e portanto muitas pessoas que, na realidade, so pouco generosas, vo mentir nas suas respostas pergunta. pois pouco provvel que a pergunta d uma medida razoavelmente vlida da generosidade porque a pergunta vai medir, em parte, a tendncia em responder duma maneira socialmente aceitvel. Falaremos mais sobre esta tendncia mais adiante porque isto um factor que muitas vezes influncia a validade das medidas feitas por questionrio.

Tipos de validade

H trs tipos principais de validade: Validade de contedo Validade terica Validade prtica

O exemplo acima apresentado, focou a validade terica de uma s pergunta, mas normalmente s possvel estimar a validade de uma medida obtida atravs de um conjunto de perguntas (i.e. um conjunto de itens). Por exemplo, suponha21 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


que um investigador quer medir a Satisfao Global no emprego usando perguntas do tipo do exemplo da seco 5.2.1. Estas perguntas so itens para medir componentes da Satisfao Global (satisfao com o Chefe, satisfao com o Trabalho, satisfao com o Ordenado e satisfao com os Colegas). Uma maneira de obter a medida de Satisfao Global somar os valores numricos das respostas aos quatro itens. Neste caso o investigador tem de examinar a validade dessa medida de Satisfao Global. No possvel examinar a validade dos itens (perguntas individuais) porque impossvel distinguir entre respostas genunas e respostas falsas. 1. VALIDADE DE CONTEDO No caso de uma varivel ser construda a partir de um conjunto de componentes h uma hierarquia como a apresentada na Figura 3. A varivel formada por vrias componentes. Normalmente, cada uma das componentes tem, por sua vez, vrios aspectos (C1, C2, CL1, CL2 ) e sobre cada aspecto sero feitas uma ou vrias perguntas (PC1,, PCL2). Figura 3 Varivel construda Componentes Chefe (C) Satisfao Global Trabalho (T) Ordenado (O) Colegas (CL)

Aspectos

C1

C2

T1

T2

O1

O2

CL1

CL2

Itens(Conjuntos de Perguntas)

(PC1)

(PC2 )

(PT1)

(PT2)

(PO1)

(PO2 )

(PCL1)

(PCL2)

A validade de contedo engloba os dois aspectos seguintes:

A representatividade das componentes

Teoricamente h um Universo de componentes a partir do qual a varivel Satisfao Global deve ser definida. Se a literatura sobre Satisfao Global referir que o Universo formado pelas quatro componentes satisfao com o Chefe, satisfao com o Trabalho, satisfao com Ordenado e satisfao com Colegas, ento a varivel Satisfao Global do nosso exemplo ter validade de contedo adequada em termos de representatividade das componentes. Suponha, contudo, que a literatura diz que o Universo de componentes para a varivel Satisfao Global deve incluir, para alm destas quatro, as componentes satisfao com a Gerncia e satisfao com Condies do Ambiente. Neste caso, as quatro componentes no so totalmente representativas do Universo, e a validade de contedo da medida de Satisfao Global ser mais baixa.

A representatividade dos itens como medidas das componentes

Tal como mostra a figura 3, cada uma das componentes tem normalmente um conjunto de aspectos. Para medir a componente por forma a que a medida de Satisfao Global tenha validade de contedo adequada, os itens devem ser representativos do Universo de Aspectos. Assim, para construir uma medida de Satisfao Global que tenha validade de contedo adequada, preciso encontrar o Universo de Aspectos para cada uma das componentes. Por exemplo, no caso da componente satisfao com o22 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Trabalho, h vrios Aspectos do trabalho com os quais um respondente pode estar satisfeito ou no, tais como: o grau de responsabilidade que possui, o grau de variedade do seu trabalho, o grau de interesse pelo trabalho que desempenha, o grau de controle sobre os mtodos usados, o grau de fadiga etc.. Usando a literatura sobre a rea (e bom senso!) possvel construir uma lista com todos os Aspectos importantes do trabalho com os quais o respondente pode estar ou no satisfeito. Estes Aspectos formam o Universo de Aspectos. Os itens (perguntas) escolhidos para medir a componente devem ser representativos deste universo. Normalmente, a pergunta associada a cada um dos Aspectos deve contribuir para que a medida (no exemplo, Satisfao Global) tenha validade de contedo adequada. Note que no possvel calcular um valor numrico para a validade de contedo 2. A VALIDADE TERICA Uma medida tem uma boa validade terica se for uma medida da varivel que o investigador pretender medir. H trs tipos de validade terica que tratam de aspectos ligeiramente diferente do conceito.

Validade convergente Validade discriminante Validade factorial

Validade convergente

Uma medida ( M1X ) da varivel X tem validade convergente se a medida concordar bem com outras medidas da mesma varivel, por exemplo, M2X, M3X, M4X que j sejam aceites como medidas adequadas da varivel X. O grau da concordncia estimado por meio do coeficiente de correlao. Para ter validade convergente adequada as correlaes entre M1X e M2X, entre M1X e M3X e entre M1X e M4X devem ser significativas. (nota: normal usar duas ou trs outras medidas para avaliar a validade convergente de uma medida M1X).

Validade discriminante

Uma medida da varivel X tem validade discriminante se no estiver correlacionada significativamente com medidas de variveis que teoricamente no esto relacionadas com a varivel X. Por exemplo M1X no deve ter correlaes significativas com as medidas M1Y e M1Z das variveis Y e Z . Campbell e Fiske (1959) propuseram uma tcnica sofisticada chamada multi mtodo multi trao para avaliar as validades convergente e discriminante simultaneamente. Mas esta tcnica complicada e principalmente usada no contexto de psicometria.

Validade factorial

Este tipo de validade terica til quando o investigador quer definir e medir uma nova varivel usando um conjunto de perguntas num questionrio. possvel definir a nova varivel aplicando a tcnica de Anlise Factorial tcnica semelhante tcnica de Anlise de Componentes Principais. O peso ou saturao de cada um dos itens (perguntas que, em conjunto, vo definir a nova varivel) no factor representa a validade factorial do item (pergunta). Voltemos ao exemplo apresentado para construir a varivel Satisfao Global. Suponha que a literatura refere que a varivel Satisfao Global tem seis componentes -- satisfao com o Trabalho, Ordenado, Chefe, Colegas,23 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Administrao e Ambiente de trabalho. Para cada uma destas seis componentes foi elaborada uma pergunta, o que no dar grande validade de contedo, mas permite um exemplo mais simples. (Normalmente, como evidente na Figura 3, cada uma das componentes tem vrios Aspectos e cada um deles est ligado com pelo menos um item pergunta no questionrio). O questionrio foi preenchido por 60 respondentes como parte de um inqurito sobre absentismo e os dados so apresentados no Anexo. Os resultados da Anlise Factorial encontram-se no Quadro 6.

Quadro 6. Resultados da Anlise Factorial

VARIVEL (PERGUNTA) TRABALHO ORDENADO CHEFE COLEGAS ADMINISTRAO AMBIENTE

FACTOR 1 0,712 0,595 0,688 0,651 0,782 0,440

O factor obtido uma combinao linear dos itens e representa a nova varivel Satisfao Global. importante notar duas coisas: primeiro, o peso de um item representa a correlao entre o item e o factor; segundo, os itens no tm pesos iguais. Por exemplo o item relacionado com o ambiente de trabalho tem menor peso (0,440) que o item relacionado com o prprio trabalho (0,712) . Este facto implica que a satisfao com o trabalho mais importante do que a satisfao com o ambiente de trabalho na definio e medida da Satisfao Global. O coeficiente de validade factorial de cada um dos itens o peso do item no factor. Por exemplo, a validade factorial do item Em que medida est satisfeito com o seu trabalho? 0,712.

3. A VALIDADE PRTICA So muitos os mtodos para avaliar a validade prtica de uma medida. Os dois mtodos clssicos so:

A validade preditiva (Predictive validity) A validade simultnea (Concurrent validity)

A validade preditiva A validade preditiva de uma medida a validade que essa medida tem para predizer valores noutra varivel. Por exemplo, suponha que o Director(a) de Recursos Humanos queria usar um teste para seleccionar empregados. Obviamente, no vale a pena usar o teste se o valor que um candidato obteve no teste no conseguir predizer bem o seu desempenho no emprego. O coeficiente de validade preditiva do teste a correlao entre os valores do teste e os valores de uma medida de desempenho no emprego. Para estimar este coeficiente preciso recolher valores do teste, num dado momento, para uma amostra de candidatos seleccionados sem utilizao do teste como parte do processo de seleco. Mais tarde, preciso recolher os valores de desempenho para os candidatos seleccionados. A correlao entre os valores do teste e os valores de desempenho representa o coeficiente de validade preditiva.24 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


A validade simultnea Neste tipo de validade, os valores da varivel a predizer so recolhidos ao mesmo tempo (aproximadamente) que os valores do teste. Por exemplo, o Director(a) de Recursos Humanos pode obter os valores do teste e os valores de desempenho no emprego para uma amostra dos empregados da empresa. A correlao entre os valores do teste e os valores de desempenho uma estimativa da validade simultnea do teste. A diferena entre os coeficientes de validade preditiva e simultnea parece no ser grande --- mas pode s-lo. Isto porque na validade simultnea o coeficente da validade calculado a partir dos dados dos empregados enquanto que no caso de validade preditiva o coeficiente de validade calculado a partir dos dados dos candidatos. natural que os valores de avaliao de desempenho dos empregados abranja uma gama restrita dos valores de desempenho, e portanto, a diferena entre a validade preditiva e a validade simultnea pode ser grande. , contudo, possvel corrigir o valor do coeficiente de validade simultnea, tornando mais fcil e mais barato calcular este coeficiente de validade prtica. (vide Murphy & Davidshofer: 1988).



CONSELHO PRTICO SOBRE VALIDADE

A influncia da tendncia em dar respostas socialmente desejveisSuponha que pretende usar perguntas dum questionrio para medir atitudes, opinies ou satisfaes, mas no quer usar as perguntas para criar uma nova varivel (como Satisfao Global no nosso exemplo). Por outras palavras, pretende analisar as respostas a cada pergunta individualmente. Neste caso, vale a pena ter em conta a natureza das perguntas. Se considerar que as respostas podem ser muito influenciadas por valores sociais (lembrese do exemplo da questo uma pessoa generosa?) essencial utilizar um questionrio annimo. Provavelmente o anonimato no vai eliminar totalmente o problema, mas ajuda. possvel aplicar uma medida da tendncia de usar respostas socialmente desejveis (por exemplo a medida do Edwards (1957) para corrigir as respostas do questionrio ou para eliminar da amostra os respondentes que mostram fortemente esta tendncia). possvel tambm construir a sua prpria medida desta tendncia (vide Hill: 1986), mas este processo complicado e requer muito tempo. Vale mais a pena tentar escrever as perguntas de modo mais neutro, se for possvel, e test-las numa amostra pequena.

A validade de contedoSe quiser usar um conjunto de perguntas para definir e medir uma nova varivel (como Satisfao Global no exemplo), a validade de contedo importante. Portanto, antes de escrever as perguntas ,use a literatura para encontrar todas as componentes relevantes e todos os Aspectos das componentes da varivel que quer definir.

A validade factorialSe quiser criar uma varivel nova a partir de um conjunto de perguntas:

Use a tcnica de Anlise factorial. No use a tcnica de Componentes Principais (explicaremos a razo mais adiante na seco 6.5). A Anlise factorial no uma tcnica uma famlia de tcnicas. Para criar uma varivel nova melhor usar o tipo de Anlise factorial designada por Anlise factorial Alpha porque esta tcnica cria uma nova varivel (um factor) em que as medidas da varivel tm o valor do coeficiente alpha (a fiabilidade interna) mximo. Para fazer uma Anlise factorial (tipo alpha) use as seguintes opes do SPSS:DATA REDUCTION FACTOR EXTRACTION Dentro da opo Extraction use METHOD = ALPHA CORRELATION MATRIX EIGENVALUES GREATER THAN 1 MAXIMUM ITERATIONS = 50 Se a anlise conduzir a duas ou mais factores, e s quer um factor, deve repetir a anlise usando a opo Number of factors = 1 (em vez da opo Eigenvalues greater than 1)

Para calcular os valores dos casos da nova varivel (i.e. o factor) use as opes SCORES SAVE AS VARIABLES METHOD = REGRESSION

Estas opes criam uma nova varivel (FAC_1) no seu ficheiro de dados. No se esquea de o GRAVAR !!

Notas:26 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


1.

Os valores (scores) da nova varivel tomam em linha de conta os pesos dos itens no factor obtido atravs da anlise factorial, e no so simplesmente a soma dos valores das respostas aos itens (perguntas) do questionrio. melhor usar os scores do que a soma simples dos valores das respostas -- especialmente no caso em que os pesos das variveis no factor no so aproximadamente iguais.

2.

essencial verificar se o valor do coeficiente KaiserMayerOlkin (KMO) adequado para fazer a anlise factorial. Este valor deve ser, pelo menos, igual a 0,6 e preferivelmente igual a 0,8 ou mais. Use a opo DESCRIPTIVES dentro da opo FACTOR no SPSS para verificar o valor de KMO.

5.3. Amostragem

5.3.1. Definies: o universo de casos e a amostra de casosUma investigao lida normalmente com um conjunto de casos. Os casos podem ser pessoas, empresas, sectores da indstria, pases ou qualquer outra entidade que o investigador queira considerar. Ao conjunto total dos casos d-se o nome de Populao ou Universo de casos. [Vamos usar a palavra Universo porque muitas pessoas pensam (incorrectamente) que, neste contexto, a palavra Populao s se refere situao em que os casos so pessoas]. Suponha ento que um investigador quer estudar as polticas dos hotis Portugueses, e suponha que h um total de 8500 hotis no pas. Neste caso o Universo o conjunto dos 8500 hotis. Note que o investigador que define o Universo. Um investigador que s queira analisar a actividade hoteleira em Lisboa definiria o Universo como sendo o conjunto de todos os hotis em Lisboa. Acontece, porm, que muitas vezes o investigador no tem tempo, nem recursos suficientes, para analisar cada um dos casos do Universo, pelo que, nesta situao, s possvel considerar uma parte dos casos que constituem o Universo. Esta parte de casos uma amostra do Universo. Assim, o que o investigador pretende ou pode fazer, na maioria das situaes, analisar os dados da amostra, tirar concluses, e extrapolar as concluses para o Universo. Mas este processo de extrapolao das concluses pode correr bem ou pode correr mal. Se a amostra dos casos for retirada do Universo de modo que seja representativa desse Universo, possvel aceitar, com razovel confiana, que as concluses obtidas utilizando a amostra possam ser extrapoladas para o Universo. Mas, se a amostra for retirada sem ter sido tida em considerao a sua representatividade, no possvel extrapolar as concluses para o Universo com confiana. Da que se torna importante escolher uma amostra representativa.

5.3.2. A escolha de uma amostra

H duas famlias de mtodos para escolher uma amostra:

Os mtodos de amostragem casual Os mtodos de amostragem no casual (tambm chamada dirigida)

OS MTODOS DE AMOSTRAGEM CASUAL



Os mtodos de amostragem casual so preferveis quando pretendemos extrapolar para o Universo os resultados obtidos a partir da amostra porque tm duas grandes vantagens:n n

possvel demonstrar a representatividade da amostra; possvel estimar (estatisticamente) o grau de confiana com o qual as concluses tiradas da amostra se aplicam ao Universo.

Os mtodos mais vulgares de amostragem casual podem ser de vrios tipos:n n n n n n

Amostragem aleatria simples Amostragem sistemtica Amostragem estratificada Amostragem por clusters Amostragem multi-etapas Amostragem multi-fsica

Explicaes claras e simples destes mtodos (e dos mtodos de amostragem no casual) podem ser encontradas em Reis, Melo, Andrade e Calapez (1996) e portanto no vamos aqui explicar todos eles. De entre os mtodos de amostragem casual, o mtodo de amostragem estratificada e o mtodo de amostragem por clusters so talvez os mais teis e utilizados em Cincias Sociais.

Mtodo de amostragem estratificada

Este mtodo especialmente til quando se pretende obter uma amostra representativa de um Universo grande segundo vrias variveis pr-identificadas. Por exemplo, suponha que pretendamos estudar as polticas dos hotis nacionais e queramos analisar os resultados em termos de dimenso e local geogrfico dos hotis. Para isso devemos seleccionar uma amostra de hotis a partir do conjunto de hotis nacionais que seja representativa em termos de dimenso (nmero de trabalhadores) e local. Para termos uma amostra estratificada precisamos de efectuar os seguintes passos: Decidir quanto ao nmero e natureza dos estratos. Por exemplo: Dimenso: Local: 3 estratos --- (menos de 50 trabalhadores, 51 100, mais de 100) 3 estratos --- (Norte, Centro, Sul)

Encontrar uma lista de todos os hotis em Portugal que inclua; nome, local e dimenso) A partir desta lista construir um Quadro para caracterizar o Universo. (Quadro 7 em baixo) Decidir qual o tamanho da amostra -- qual a fraco de amostragem (por exemplo, 10% do Universo) Seleccionar uma amostra aleatria de 10% dos hotis em cada um dos estratos (Quadro 8)



Quadro 7. Caracterizao do Universo

DIMENSO Menos de 50 REGIO NORTE CENTRO SUL TOTAL 1100 900 3500 5500 51 - 100 740 500 1200 2440 Mais de 100 160 100 300 560 TOTAL 2000 1500 5000 8500

Quadro 8. Caracterizao da amostra = 10% do Universo

DIMENSO Menos de 50 REGIO NORTE CENTRO SUL TOTAL 110 90 350 550 51 - 100 74 50 120 244 Mais de 100 16 10 30 56 TOTAL 200 150 500 850

Note que em cada uma das clulas do Quadro 8 o nmero de casos (hotis) igual a 10% do nmero de casos na clula correspondente no Universo. A amostra representativa do Universo se a amostra de casos em cada um das clulas for escolhida por amostragem aleatria.

Mtodo de amostragem por clusters

Este mtodo til quando temos um Universo grande mas os casos so agrupados em unidades. Por exemplo, suponha que queramos estudar a relao entre o absentismo voluntrio no emprego e a satisfao dos empregados dos hotis de Lisboa. Neste caso o Universo o conjunto de todos os empregados dos hotis de Lisboa. Mas neste Universo h grupos ou clusters de casos -- o conjunto de empregados em cada um dos hotis forma um cluster. Para escolher uma amostra por clusters devemos seguir os seguintes passos: Encontrar uma lista dos hotis de Lisboa; Decidir qual o nmero de hotis sobre os quais a investigao vai ser aplicada (Por exemplo 10%); Escolher 10% dos hotis por amostragem aleatria; Efectuar a investigao sobre todos os empregados dos hotis que constituem a amostra de 10% .

OS MTODOS DE AMOSTRAGEM NO CASUALEstes mtodos no so aconselhveis quando se pretende extrapolar para o Universo os resultados ou concluses obtidos com a amostra, mas podem ser teis no incio de um investigao por exemplo, para testar as primeiras verses dos questionrios.29 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Dentro deste tipo de mtodos os mais vulgares so:

Amostragem por convenincia Amostragem por quotas

mtodo de amostragem por convenincia Neste mtodo os casos escolhidos so os casos que so facilmente disponveis (muitas vezes, os amigos dos amigos!). O mtodo tem vantagens por ser rpido, barato e fcil. As desvantagens so que os resultados e concluses s se aplicam amostra, no podendo ser extrapolados para o Universo. Isto porque no h garantia de que a amostra seja razoavelmente representativa do Universo (muitas vezes no bvio o que o Universo!).

mtodo de amostragem por quotas Este mtodo anlogo ao mtodo de amostragem estratificada mas com uma diferena importante. Em vez de se escolher uma amostra aleatria dentro de cada uma dos estratos na etapa final (Passo 5 no exemplo acima), escolhe-se uma amostra no-aleatria (de tamanho determinado pela fraco de amostragem). s vezes, as amostras dentro dos estratos so pouco diferentes das amostras por convenincia, e quase sempre h um enviesamento na seleco dos casos. Portanto no necessariamente razovel extrapolar para o Universo os resultados e concluses tirados da amostra. Contudo, e em geral, este mtodo melhor do que o da amostragem simplesmente por convenincia.

CONSELHO PRTICO SOBRE AMOSTRAGEM 1. Restrio da investigao No contexto de um projecto de licenciatura ou de uma tese de Mestrado o tempo para fazer investigao limitado. Portanto de bom senso restringir a natureza e tamanho da investigao. possvel fazer isto por meio da escolha de um tema em que a investigao pode ser feita num Universo pequeno de casos -- por exemplo, todos os empregados de uma empresa. Neste caso no preciso escolher uma amostra, e portanto no h problemas de amostragem. verdade que num tal estudo no possvel extrapolar as concluses a outras empresas no mesmo sector, mas isto no importa; o que importa que o trabalho seja bem feito.

2. A estruturao de uma amostra estratificada Numa investigao relativamente simples provavelmente melhor usar uma amostra por clusters ou uma amostra estratificada. Mas como decidir quanto aos estratos de uma amostra estratificada? No difcil. S precisa de pensar nos objectivos da investigao. No exemplo do estudo sobre as polticas dos hotis nacionais o objectivo identificar as polticas. razovel pensar que os hotis de maior dimenso tenham talvez polticas diferentes dos hotis de menor dimenso (muitas vezes os grandes hotis fazem parte de uma grande empresa multinacional e os pequenos hotis pertencem a uma famlia) e, portanto, dimenso deva ser utilizada para estratificar a amostra. tambm razovel considerar que os hotis tm vrios tipos de clientes, por exemplo, turistas, pessoas de negcio, viajantes comerciais etc.. Provavelmente, a grande maioria dos turistas vo para os hotis do Algarve e uma parte menor para os hotis de Lisboa. A maioria dos clientes dos hotis de Lisboa e do Porto so provavelmente pessoas de negcios. assim provvel que os hotis que tm tipos de clientes diferentes tenham polticas diferentes, portanto pode ser til utilizar tambm Local para estratificar a amostra. Convm notar que, em muitas das investigaes, a reviso da literatura que deu luz aos objectivos do estudo muito til na escolha das variveis para estratificar a amostra.30 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


3. O problema da representatividade de uma amostra reduzida Na maioria das situaes, o nmero de questionrios recebidos no coincide com o nmero de casos da amostra h sempre um conjunto de pessoas ou instituies que no respondem ao questionrio ou no do a informao solicitada. Vamos usar o termo amostra reduzida quando a amostra obtida apenas uma parte da amostra alvo (a amostra completa), ou seja, da amostra inicialmente planeada. Isto um problema muito vulgar no caso de questionrios enviados por correio. Se a amostra alvo foi escolhida por meio de mtodos aleatrios, a existncia de uma amostra reduzida traz problemas relativos sua representatividade. Se a amostra alvo for bem planeada, ela representativa do Universo, mas no h garantia de que a amostra reduzida tambm o seja. Se, por exemplo, a amostra alvo foi escolhido utilizando o mtodo por quotas o problema parece mais fcil de resolver pois relativamente fcil encontrar mais casos num estrato onde haja falta de casos quaisquer casos que tenham as caractersticas do estrato servem. (Mas lembrese que se utilizar o mtodo por quotas, a amostra alvo no necessariamente representativa do Universo). O problema mais difcil resolver no caso de uma amostra estratificada. Neste caso h quatro possibilidades:

Persuadir os inquiridos que no deram resposta a preencher o questionrio. ( muito provvel que este processo aumente o tamanho da amostra, mas menos provvel que resolva inteiramente o problema). Escolher casos alternativos para obter a amostra alvo (A vantagem obvia, mas as desvantagens so que precisa de tempo e no certo que seja possvel obter suficientes casos adicionais). Analisar as caractersticas dos norespondentes para decidir se ser provvel que a falta de informao destes casos tenha introduzido um enviesamento na amostra. (A desvantagem aqui que a deciso no totalmente objectiva, e um processo difcil. Mas h literatura nesta rea e, por vezes, possvel corrigir os dados (vide: Moser e Kalton:1986). Provavelmente a soluo mais prtica (mesmo que no seja a melhor soluo) comparar a amostra reduzida com uma amostra do mesmo tamanho retirada por quotas do Universo. Se a diferena for pequena em todos os estratos, a amostra reduzido pode ser tratada como sendo uma amostra por quotas. Se a diferena for grande em alguns dos estratos relativamente fcil aumentar o nmero de casos tal como se faz numa amostra por quotas (ou eliminar casos usando um mtodo aleatrio). Para ilustrar este processo usaremos o exemplo da investigao das polticas dos hotis nacionais. O quadro 7 mostra que o Universo tem 8500 casos no total. A amostra estratificada com a fraco amostral de 10% formada por 850 casos e apresentada no quadro 8. Imagine que s obtivemos os 600 casos do Quadro 9, o que representam uma fraco amostral do Universo igual a (600 100)/8500 = 7,059%. O quadro 10 apresenta o nmero de casos para cada um dos estratos para uma amostra de 7,059% dos casos do Universo. Para calcular o nmero de casos em cada estrato do Quadro 10 calcula-se a percentagem dos casos no estrato no Universo e multiplica-se esta percentagem por 600. Por exemplo, no estrato Dimenso (51 100) no Norte h 740 casos do Universo de 8500 casos. Portanto este estrato contm (740 100)/ 8500 = 8,7% dos casos no Universo. Numa amostra por quota que tem 600 casos, o estrato Dimenso (51 100) no Norte deve ter (8,7 600)/100 = 52 casos.

Quadro 9. A amostra reduzida de 600 casosDIMENSO Menos de 50 80 60 240 380 51 - 100 50 40 90 180 Mais de 100 10 10 20 40 TOTAL 140 110 350 600

REGIO

NORTE CENTRO SUL TOTAL



Quadro 10. A amostra por quotas de 600 casosDIMENSO Menos de 50 78 64 247 389 51 - 100 52 35 85 172 Mais 100 11 7 21 39 de TOTAL 141 106 354 600

REGIO

NORTE CENTRO SUL TOTAL

evidente que a amostra reduzida e a amostra por quotas de 600 casos so relativamente semelhantes. Para obter uma amostra por quotas perfeita s precisamos de eliminar 15 casos e obter mais 15 casos. Neste exemplo podemos dizer que a amostra reduzida razoavelmente representativa do Universo como amostra estratificada. Mas o exemplo no tpico, e geralmente mais razovel concluir que a amostra adequada como uma amostra por quotas. H outras maneiras de resolver o problema da representatividade da amostra, como sejam, utilizando ponderadores. Neste caso aconselhvel consultar um especialista em estatstica.

6. ALGUNS PROBLEMAS COM A ANLISE DE DADOS

Nesta seco discutiremos vrias questes prticas (problemas e solues) relacionadas com a anlise estatstica de dados. Para ilustrar alguns pontos vamos usar o conjunto de dados apresentado em Anexo. Estes dados representam os resultados de um inqurito realizado numa fbrica onde a ausncia ao emprego era um problema preocupante. Antes de ler esta seco convm ler a descrio (em Anexo) da natureza e objectivos deste inqurito.

6.1. O agrupamento de casosPor vezes torna-se til (ou necessrio) usar uma varivel contnua para agrupar os casos em dois grupos. Por exemplo, suponha que queramos usar os dados do Anexo para comparar os casos que tm um nvel elevado de absentismo (AUSNCIA) com os casos que tm um nvel baixo de absentismo . Para fazer isto temos de recodificar a varivel AUSNCIA noutra varivel (por exemplo, AUSEN_2) que s vai ter dois valores (Baixa Ausncia = 1 e Alta Ausncia = 2). Os casos que tm valor 1 na varivel AUSEN_2 constituem o Grupo 1 (Baixa Ausncia) e os casos que tm valor 2 constituem o Grupo 2 (Alta Ausncia). Os trs mtodos mais vulgares para fazer este tipo de recodificao so: Partio pelo valor mdio da varivel que se pretende agrupar Partio pela mediana. O mtodo de Grupos Extremos

.

Partio pelo valor mdio da varivel que se pretende agrupar

O valor mdio da varivel AUSNCIA 10,43. Portanto, os casos com valores de AUSNCIA inferior a 10,43 tm o valor 1 na varivel AUSEN_2 e formam o Grupo 1. Os casos com valores iguais ou superiores a 10,43 vo ter o valor 2 na varivel AUSEN_2 e formam Grupo 2.32 DINMIA - Centro de Estudos sobre a Mudana SocioeconmicaMAN UELA MAGALHES H ILL & AND REW HILL


Este mtodo s aceitvel se a distribuio da varivel contnua (AUSNCIA) for aparentemente simtrica. Para efectuar este tipo de agrupamento de casos use os seguintes comandos do SPSS: TRANSFORM RECODE INTO DIFFERENT VARIABLE input variable = (neste exemplo, AUSNCIA) output variable = (neste exemplo, AUSEN_2) OLD AND NEW VALUES

Partio pela mediana.

Este mtodo anlogo ao mtodo (a) mas utiliza a mediana em vez do valor mdio da varivel contnua. A mediana da varivel AUSNCIA 10,16. Portanto, os casos no Grupo 1 vo ter valores de AUSNCIA inferiores a 10,16 e os casos no Grupo 2 vo ter valores iguais ou superiores a 10,16. Este mtodo mais til do que o anterior porque pode ser utilizado quando a distribuio da varivel contnua (AUSNCIA) simtrica ou assimtrica. Infelizmente tanto o primeiro mtodo como o segundo trazem problema. Olhemos para a figura 4 que apresenta a distribuio da AUSNCIA, e recordemos que o valor da mediana igual a 10,16. A matriz de dados apresentada em Anexo revela que o caso 3, que pertence ao Grupo 1, tem o valor 10 na varivel AUSNCIA e que, por exemplo, o caso 14, que pertence ao Grupo 2, tem o valor 11 na varivel AUSNCIA. A diferena de AUSNCIA entre os dois casos pequena (11 10 ), ou seja, 1 dia de ausncia. Mas os dois casos pertencem a grupos diferentes!. Ainda pior, o valor mdio da varivel AUSNCIA para os casos do Grupo 1 5,96, e o valor mdio para os casos do Grupo 2 14,92, portanto a diferena entre o caso 3 e o caso tpico do Grupo 1 (o caso mdio do grupo1) (10 5,96) = 4,04 , e esta diferena maior que a diferena entre os casos 3 e 14 que pertencem a grupos diferentes!. O caso 3 pouco representativo dos casos do Grupo 1 em termos de AUSNCIA ( e o caso 14 pouco representativo dos casos do Grupo 2). Infelizmente casos como o 3 e 14 no so casos isolados, h vrios outros casos que mostram este problema da falta de representatividade.

Figura 4 AUSNCIA 10 9 8 7 Nmero de casos 6 5 4 3 2 1 0 -4 -2 0 2 4 6 8 10 12 14 16 18 20 ausncias Expected Normal



Para resolver esta problema possvel usar outro mtodo para efectuar a partio dos dados.

O mtodo de Grupos Extremos

Neste mtodo vamos retirar um conjunto de casos no meio de distribuio. Para isso preciso estabelecer dois valores da varivel contnua (AUSNCIA) como valores de cut-off. Isto pode ser feito de duas maneiras:

investigação por questionario

Documents