tecnica de pesquisa.pdf

30
INTRODUC ¸ ˜ AO AS TECNICAS DE PESQUISA RICARDO S. EHLERS Departamento de Estat´ ıstica Universidade Federal do Paran´ a c RICARDO SANDES EHLERS 2003

Upload: leila-weitzel

Post on 11-Jan-2016

31 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: tecnica de pesquisa.pdf

INTRODUCAO AS TECNICAS DEPESQUISA

RICARDO S. EHLERS

Departamento de EstatısticaUniversidade Federal do Parana

c© RICARDO SANDES EHLERS 2003

Page 2: tecnica de pesquisa.pdf

Sumario

1 Introducao 1

1.1 A Natureza da Ciencia . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 O Estudo Cientıfico . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 A Pesquisa Cientıfica 3

2.1 Preparacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2 O Projeto de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . 3

2.3 Execucao da Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . 4

2.4 Comunicacao/Divulgacao dos Resultados . . . . . . . . . . . . . 4

3 Referencias Bibliograficas 5

3.1 Livro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.2 Periodicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3.3 Documentos de Eventos . . . . . . . . . . . . . . . . . . . . . . . 6

3.4 Glossario de termos e abreviaturas . . . . . . . . . . . . . . . . . 6

4 Divulgacao dos Resultados 9

4.1 Comunicacao Escrita . . . . . . . . . . . . . . . . . . . . . . . . . 9

4.2 Comunicacao Oral . . . . . . . . . . . . . . . . . . . . . . . . . . 9

5 Consideracoes sobre Assessoria Estatıstica 13

5.1 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

5.2 Expectativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

5.3 Atitudes do Estatıstico . . . . . . . . . . . . . . . . . . . . . . . . 14

5.4 Sobre co-autorias . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

5.5 Sobre teses e dissertacoes . . . . . . . . . . . . . . . . . . . . . . 16

6 Erros em Estatıstica 17

6.1 Paradoxo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . 17

6.2 Comparando abacaxi com banana . . . . . . . . . . . . . . . . . . 18

6.3 Testando hipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . 19

6.4 Correlacao nao significa causalidade . . . . . . . . . . . . . . . . 19

6.5 Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

7 Variaveis 23

7.1 Classificacao de Variaveis . . . . . . . . . . . . . . . . . . . . . . 23

7.2 Relacoes entre Variaveis . . . . . . . . . . . . . . . . . . . . . . . 24

i

Page 3: tecnica de pesquisa.pdf

ii SUMARIO

7.2.1 Relacao Simetrica . . . . . . . . . . . . . . . . . . . . . . 247.2.2 Relacao Recıproca . . . . . . . . . . . . . . . . . . . . . . 247.2.3 Relacao Assimetrica . . . . . . . . . . . . . . . . . . . . . 25

7.3 Variaveis Moderadoras . . . . . . . . . . . . . . . . . . . . . . . . 257.4 Variaveis de Controle . . . . . . . . . . . . . . . . . . . . . . . . . 25

References 27

Page 4: tecnica de pesquisa.pdf

Capıtulo 1

Introducao

1.1 A Natureza da Ciencia

O metodo cientıfico e uma forma de producao de conhecimento que se caracte-riza pela combinacao entre especulacoes logicas abstratas e verificacoes praticasconcretas. Podemos enumerar as seguintes caracterısticas.

1. E um conjunto de paradigmas para a observacao, identificacao, descricao,investigacao experimental e explanacao teorica de fenomenos;

2. Envolve tecnicas exatas, objetivas e sistematicas, implementadas atravesde regras fixas para a formacao de conceitos, para a conducao de ob-servacoes e de experimentos, e para a validacao de hipoteses explicativas;

3. O objetivo maior nao e o de saber como as coisas realmente sao, mas simo de desenvolver explicacoes que auxiliem na interacao com o mundo, ouseja: previsao (o que vai acontecer) e controle (como se pode intervir).

A Ciencia requer obrigatoriamente o uso da Matematica, a sua linguagemfundamental. Como consequencia, o saber cientıfico e caracterizado pela sualogica, objetividade e verificabilidade logica.

1.2 O Estudo Cientıfico

Em um estudo cientıfico podemos identificar tres tipos de variaveis que estaoinvariavelmente presentes.

• Variaveis preditivas (ou independentes ou explicativas). Sao aqueles quese observa ou manipula para se verificar a relacao entre suas variacoes eo comportamento de outras variaveis.

• Variaveis resposta (ou dependentes). Sao as variaveis de interesse, cujocomportamento se deseja verificar em funcao de variacoes nas variaveispreditivas.

• Variaveis espurias (ou estranhas). Nao sao diretamente objeto de estudomas interferem na relacao entre as variaveis resposta e preditivas.

1

Page 5: tecnica de pesquisa.pdf

2 CAPITULO 1. INTRODUCAO

Page 6: tecnica de pesquisa.pdf

Capıtulo 2

A Pesquisa Cientıfica

De um modo geral podemos identificar as fases de uma pesquisa cientifica como:preparacao, projeto, execucao e divulgacao dos resultados. A seguir estas fasessao detalhadas em suas principais caracteristicas.

2.1 Preparacao

1. Escolha do tema. Qual sera o objeto de estudo?

2. Delimitacao do problema. Que problemas existem no objeto de estudo?

3. Revisao bibliografica. O que ja foi estudado sobre o tema? Quais osachados cientıficos? Que questoes permanecem em aberto? Qual o estadoda arte?

2.2 O Projeto de Pesquisa

1. Descricao do problema.

(a) Introducao e formulacao da situacao-problema.

(b) Justificativa. Por que estudar este problema? qual a sua relevancia?quais sao os benefıcios esperados?

(c) Objetivos. O que se espera obter?

(d) Formulacao das hipoteses de interesse (geralmente embasadas emteorias) e descricao das variaveis envolvidas.

(e) Delimitacao do estudo. Limites de tempo, recursos, acesso, etc.

(f) Definir os termos e abreviaturas.

2. Metodologia.

(a) Identificar o tipo de pesquisa.

(b) Populacao alvo, plano de amostragem.

(c) Instrumentacao a ser utilizada.

3

Page 7: tecnica de pesquisa.pdf

4 CAPITULO 2. A PESQUISA CIENTIFICA

(d) Plano de coleta de dados, metodos estatısticos para analise dos da-dos.

3. Cronograma. Estabelecer um cronograma de execucao com datas limitespara a finalizacao de cada etapa.

4. Referencias bibliograficas.

2.3 Execucao da Pesquisa

1. Elaboracao dos instrumentos. Estamos medindo o que realmente quere-mos medir?

2. Estudo piloto.

3. Coleta de dados.

4. Analise estatıstica.

5. Avaliacao das hipoteses de interesse. Aceitacao ou modificacao destashipoteses a luz dos conhecimentos existentes e das analises feitas.

2.4 Comunicacao/Divulgacao dos Resultados

1. Relatorio de pesquisa.

2. Comunicacao oral.

3. Artigo cientıfico, etc.

Page 8: tecnica de pesquisa.pdf

Capıtulo 3

Referencias Bibliograficas

A indicacao de todas as fontes de informacao efetivamente utilizadas e parteobrigatoria de qualquer trabalho de pesquisa. Alem disso, as referencias bibli-ograficas sao um importante indicador da qualidade do trabalho desenvolvido.Assim, referencias a autores consagrados e trabalhos inovadores naquela areade pesquisa sao uma indicacao de que o autor fez uma boa revisao bibliograficado assunto e esta atualizado quanto aos principais inovacoes. A seguir seraoapresentadas as normas para referencias bibliograficas segundo Associacao Bra-sileira de Normas Tecnicas (ABNT).

As referencias bibliograficas devem ser relacionadas em uma lista propria,numerada sequencialmente, em ordem alfabetica de sobrenome de autor e tıtulo.Esta lista aparece no final do trabalho com o tıtulo de Bibliografia. Geralmente,cada item da lista se inicia pelo ultimo sobrenome do autor seguido dos preno-mes (exceto para sobrenomes compostos) e quando nao houver autoria pessoalinicia-se pelo tıtulo. Pode-se utilizar negrito, italico ou sublinhado para o tıtulo.

3.1 Livro

Para citacao de um livro ou um capıtulo de livro podemos usar os seguintesmodelos,

(a) SOBRENOME DO AUTOR, nome. Tıtulo do livro: subtıtulo. Local depublicacao (cidade): Editora, data. Numero de paginas ou volumes.

(b) AUTOR DO CAPITULO. Tıtulo do capıtulo. In: AUTOR DO LIVRO.Tıtulo do livro: subtıtulo. Local de publicacao: Editora, ano. Volume,capıtulo. Paginas inicial e final.

Por exemplo,

1. BUSSAB, W.O. e MORETTIN, P.A. Estatıstica Basica. Sao Paulo:Atual, 1987.

2. JAMES, B.R. Probabilidade: um Curso em Nıvel Intermediario. Rio deJaneiro: Livro Tecnico, 1981.

5

Page 9: tecnica de pesquisa.pdf

6 CAPITULO 3. REFERENCIAS BIBLIOGRAFICAS

3. GAMERMAN, D. e SMITH, A.F.M. A Bayesian Analysis of LongitudinalData Studies. In: Bayesian Statistics 5, ed. J. Bernardo. Oxford: OxfordUniversity Press, 1996.

3.2 Periodicos

Podemos citar um periodico (ou revista) considerado como um todo, i.e. semuma referencia pessoal, ou artigos em um periodico. Os seguintes modelos decitacao podem ser usados,

(a) TITULO DO PERIODICO. Local de publicacao (cidade): Editor, volume,numero, mes e ano.

(b) AUTOR. Tıtulo do artigo. Tıtulo do periodico. Local de publicacao, nofascıculo, paginas inicial e final, mes e ano.

Por exemplo,

1. CIENCIA HOJE. Sao Paulo: Sociedade Brasileira para o Progresso daCiencia, v.27, no 160, jun. 2001.

2. CORDEIRO, G.M. e FERRARI, S.L.P. A Modified Score Test HavingChi-squared Distribution to Order n−1. Biometrika. London, v. 78, p.573-582, 1991.

3.3 Documentos de Eventos

Trabalhos apresentados em eventos como congressos, seminarios e encontros saocitados da seguinte forma,

(a) AUTOR. Tıtulo do trabalho. In: NOME DO EVENTO, no, data, local.Anais... ou Resumos... ou Procedings... Local: Editora, data. Paginasinicial e final do trabalho.

Por exemplo,

1. MIGON, H.S. e LOPES, H.F. Sensibilidade da funcao de resposta-impulsoa distribuicao a priori em modelos BVAR: um exercıcio usando integracaode Monte Carlo. In: ENCONTRO BRASILEIRO DE ECONOMETRIA,XVI, 1995, Recife. Proceedings, v. 2. Sao Paulo: Sociedade Brasileira deEconometria, 1995, p.753-774.

3.4 Glossario de termos e abreviaturas

Alguns termos e abreviaturas ocorrem com certa frequencia em publicacoescientıficas. A lista a seguir nao pretende ser exaustiva e certamente o leitor irase deparar com outros termos ao longo de sua experiencia.

Page 10: tecnica de pesquisa.pdf

3.4. GLOSSARIO DE TERMOS E ABREVIATURAS 7

• Anexo, apendice: material suplementar que acompanha o texto de umapublicacao como esclarecimento ou documentacao, mas que nao constituiparte essencial do trabalho. Considera-se apendice quando o materialfoi elaborado pelo autor, por exemplo a demonstracao de um teorema, eanexo quando o material se origina de outras fontes.

• c. ou cap.: capıtulo.

• cf.: conforme.

• ca. ou circa: em torno de.

• exempli gratia (e.g.): por exemplo.

• id est (i.e.): isto e.

• id (idem): do mesmo autor.

• inf. ou infra: abaixo.

• loc. cit. (loco citado): no lugar citado.

• opus citatum (op. cit.): obra ja citada anteriormente.

• p.: pagina(s)

• p. ex.: por exemplo

• palavras-chave: lista com ate seis palavras representativas do tema dotrabalho.

• referee (arbitro): avaliador de artigos submetidos a periodicos, congressos,etc.

• seq. (sequentia): que se segue.

• sine loco (s.l.): quando falta o local de publicacao da obra.

• sine nomine (s.n.): quando falta a editora da obra.

• v.: volume.

• vide (vid.): ver a citacao ja referenciada. E comum usar a traducao ver.

• videlicet (viz.): a saber.

Page 11: tecnica de pesquisa.pdf

8 CAPITULO 3. REFERENCIAS BIBLIOGRAFICAS

Page 12: tecnica de pesquisa.pdf

Capıtulo 4

Divulgacao dos Resultados

4.1 Comunicacao Escrita

Algumas recomendacoes gerais sao as seguintes.

1. Nao colocar excesso de paragrafos no texto. Lembre-se que um paragrafoem geral indica mudana de assunto.

2. Na primeira pagina deve constar o titulo do trabalho, seu nome e filiacao,o resumo e as palavras-chave.

3. As secoes nao podem ser grandes demais nem pequenas demais.

4. Os dados so podem ser divulgados com autorizacao do pesquisador e seunome deve ser citado (”...estes dados foram gentilmente cedidos por fulanode tal”). Eles devem aparecer no formato de uma tabela em anexo.

5. Substitua as saidas do pacote utilizado por tabelas adequadas e em por-tugues.

6. Todas as tabelas e figuras devem ser numeradas.

4.2 Comunicacao Oral

A ideia de falar em publico deixa qualquer pessoa nervosa. Inibicao, nervo-sismo, ansiedade, etc ocorrem em maior ou menor grau com qualquer pessoa aofalar em publico. Este quadro entretanto pode ser controlado, atraves de umacuidadosa preparacao.

A preparacao cuidadosa e com a devida antecedencia e o fator mais impor-tante para o sucesso de uma apresentacao oral. Mesmo quando o apresentadortem muita experiencia com o tema do trabalho. A seguir sao listadadas algu-mas sugestoes uteis na elaboracao de material e de comportamento durante aapresentacao.

9

Page 13: tecnica de pesquisa.pdf

10 CAPITULO 4. DIVULGACAO DOS RESULTADOS

Elaboracao de Transparencias

1. Calcule uma transparencia por minuto.

2. Evite excesso de informacao na transparecnia. Sugere-se utilizar 7 linhase 7 palavras por linha no maximo.

3. Refaca tabelas publicadas se julgar que sao inadequadas.

4. Nao use letras pequenas demais.

5. Nao inclua tabelas muito grandes. Sugere-se usar no maximo 4 linhas emtabelas de 2 colunas, e 3 linhas em tabelas de 3 colunas.

6. Use letras minusculas, exceto no tıtulo.

7. Evite abreviacoes.

8. Coloque referencia de dados de outros autores.

9. Nao exagere nas cores. Use cores para destacar informacoes relevantes.

10. Nao transforme a apresentacao em espetaculo pirotecnico! Pode distrairatencao da plateia.

11. Nao use figuras de fundo.

12. Ha outros meios de destacar informacao importante

Durante a Apresentacao

1. Fale devagar, olhando para plateia.

2. Nunca fique de costas para a platleia.

3. Nao exagere nos gestos e mudancas de posicao.

4. Aponte as transparencias para orientar a plateia.

5. Nao fique na frente da projecao e nem andando de um lado para outro.

6. Nao aponte erros nas transparencias.

7. Use as mesmas palavras que usou nas transparencias.

8. Nos graficos, indique sempre o que significam.

9. Faca um encerramento, agradeca.

Page 14: tecnica de pesquisa.pdf

4.2. COMUNICACAO ORAL 11

Respondendo as perguntas

1. Nao se desespere.

2. Tente responder as perguntas.

3. Algumas perguntas sao previsıveis, outras ja estao respondidas nas trans-parencias.

4. Tente responder as perguntas mas e impossıvel saber responder a toda equalquer pergunta.

5. Melhor dizer que nao sabe do que dar um ”tiro no escuro”. A plateiaaceita e compreende que nao sabemos tudo.

Recomendacoes Finais

1. Escreva a apresentacao

2. Prepare o material com antecedencia

3. Pratique, pratique, pratique.

4. Controle os nervos.

Page 15: tecnica de pesquisa.pdf

12 CAPITULO 4. DIVULGACAO DOS RESULTADOS

Page 16: tecnica de pesquisa.pdf

Capıtulo 5

Consideracoes sobreAssessoria Estatıstica

Segundo a minha experiencia, podemos comecar pensando em uma assessoria(ou consultoria) como a aplicacao de conhecimentos de Estatıstica em trabalhosaonde o pesquisador nao ve a Estatıstica como ciencia. A seguir serao apontadosalguns problemas e caracterısticas associadas a atividade de assessoria, bemcomo algumas recomendacoes uteis.

5.1 Problemas

Ao longo do processo alguns problemas ocorrem com certa frequencia e devemser esperados. Por exemplo,

1. A escolha do metodo de analise pode ser bastante complicada.

2. Erros de estatıstica sao relativamente comuns em algumas areas da ciencia.

3. Em geral o pesquisador tem interesse nas conclusoes e nao no metodoestatıstico.

4. Alguns encaram a Estatıstica com ma vontade.

5. Alguns so estao ali porque a revista ou o orientador exigiram uma analiseestatıstica.

Outros problemas mais serios podem ocorrer tambem, embora com menorfrequencia. Por exemplo,

1. Trabalho de baixa qualidade. Outros podem te associar a este trabalhoruim mas as vezes nao se pode recursar.

2. Nao reconhecimento pelo seu trabalho.

3. Mau uso do seu nome.

4. Fraudes, trabalhos nao eticos.

13

Page 17: tecnica de pesquisa.pdf

14CAPITULO 5. CONSIDERACOES SOBRE ASSESSORIA ESTATISTICA

5.2 Expectativas

E importante tambem termos uma ideia daquilo que o pesquisador espera ob-ter, i.e. qual a sua expectativa em relacao a assessoria estatıstica. Algumasexpectativas sao naturais e estao corretas, outras podem nao ser muito rea-listas e devemos estar preparados. Alem da assessoria propriamente dita, asexpectativas mais comuns na minha opiniao sao:

1. Um grande entusiasmo seu pelo trabalho.

2. Repeticao das explicacoes sempre que necessario.

3. Tempo de dedicacao ao trabalho.

4. Todos os calculos feitos.

5. Os resultados prontos para apresentacao.

6. Ajuda na discussao e conclusoes.

5.3 Atitudes do Estatıstico

Apos enumerar possıveis problemas e alguns fatos associados a atividade deassessoria podemos pensar em possıveis atitudes do estatıstico. Algumas dicassao as seguintes.

1. Estabeleca horarios para as reunioes. Como qualquer outro pesquisadorvoce deve programar e planejar o seu trabalho.

2. Nunca aceite fazer uma analise por telefone por mais que alguem diga quee uma coisa simples e so vai levar um minuto.

3. Discuta todos os procedimentos antes de comecar as analises.

4. Voce nao e um assistente de pesquisa.

5. Voce nao e um programador nem um digitador dos dados.

6. Voce nao pode dedicar todo o seu tempo a uma particular assessoria.

Finalmente, algumas recomendacoes mais gerais poderao ser uteis para queambos tenham algum ganho com esta atividade.

1. Seja coerente.

2. Se o trabalho e simples use tecnicas mais simples.

3. Negocie a relacao de trabalho desde o inıcio.

4. Interacao pessoal pode ser importante.

5. Nao esconda problemas que voce identificou so para agradar o pesquisa-dor.

Page 18: tecnica de pesquisa.pdf

5.3. ATITUDES DO ESTATISTICO 15

6. Quando necessario faca objecoes ou discuta a validade dos procedimentos.

7. Voce nao tem que saber tudo sobre todos os assuntos de todos os ramosda ciencia.

8. Procure participar de todas as etapas da pesquisa, ou de tantas quantasfor possıvel.

9. Se tiver intencao de usar os dados em outro projeto ou como ilustracaonegocie isto com o pesquisador. Nao use dados sem autorizacao.

E aqui estao tambem algumas recomendacoes quanto as reunioes de asses-soria. Como este pode ser o unico contato com o pesquisador deve-se procuraraproveita-lo ao maximo. Prepare-se para ouvir frases como ”o que eu quero esimples so vai levar dois minutos”. Isto pode ser profundamente decepcionante,criar um sentimento de inutilidade e mesmo uma atitude negativa em relacaoao trabalho. Nao desanime e tente mostrar que pode nao ser tao simples assim(e em geral nao e). Outros pontos importantes sao os seguintes.

1. Peca que o pesquisador traga o material ja consultado ou indicado sobreo assunto. Talvez a resposta esteja bem ali e com o seu treinamentoestatıstico voce podera identifica-la.

2. Voce pode ter tanta dificuldade de entender o problema quanto o pesqui-sador tem de entender estatıstica. Alguma dose de paciencia de ambas aspartes e necessario.

3. Entenda bem o problema e os objetivos antes de comecar a analise.

4. Pergunte por que o pesquisador mediu aquelas variaveis.

5. Se for necessario criticar faca-o com muito criterio.

6. Pare e pergunte se voce realmente entendeu o problema e os objetivos.

7. Em geral uma segunda reuniao sera necessaria.

Quanto a analise estatıstica propriamente dita, as seguintes recomendacoestambem podem ser uteis.

1. Nao sofisticar a analise desnecessariamente. Isto pode ser decepcionantemas em geral e necessario. Seja “sofisticadamente simples”.

2. O pesquisador precisa entender o que foi feito e saber interpretar corre-tamente os resultados.

3. Apresente uma solucao mesmo que aproximada para o problema.

Page 19: tecnica de pesquisa.pdf

16CAPITULO 5. CONSIDERACOES SOBRE ASSESSORIA ESTATISTICA

5.4 Sobre co-autorias

Como qualquer outro pesquisador, o estatıstico precisa ter os resultados de suaatividade de pesquisa publicados. Se um tempo consideravel foi investido e ograu de envolvimento com o trabalho foi grande o estatistico espera que seja aomenos oferecida co-autoria em caso de publicacao. E somente neste caso quevoce deve aceitar responsabilidade sobre o que foi publicado. Um agradecimentoem nota de rodape nao torna voce responsavel.

Na minha opiniao agradecimentos dizendo que voce fez a analise estatısticadevem ser evitados ja que neste caso voce deveria ser co-autor. Alem disso,voce nao tem controle sobre o que sera publicado ou apresentado. Por outrolado, nao se deve esperar co-autoria se houve apenas uma orientacao ou ajudacom estatıstica basica.

5.5 Sobre teses e dissertacoes

Se o trabalho envolve uma tese ou dissertacao, ou mesmo uma monografia, aminha opiniao e que o estatıstico deve dar apenas orientacao. Neste caso oaluno precisa entender completamente a analise para poder defende-la peranteuma banca. Em particular, e ideal que o orientador do trabalho participe dasreunioes iniciais da assessoria e no caso da analise estatıstica ser uma com-ponente fundamental da pesquisa entao o estatıstico deve ser indicado comoco-orientador.

Page 20: tecnica de pesquisa.pdf

Capıtulo 6

Erros em Estatıstica

Os metodos estatısticos, quando utilizados de maneira correta e apropriada,tem sido extremamente valiosos para a acumulacao de conhecimento cientıfico.No entanto, a correta interpretacao dos dados e resultados de uma analise, emuito importante para evitar confusoes. E importante ter em mente e deixarclaro as limitacoes do metodo, as hipoteses subjacentes, as simplificacoes eaproximacoes muitas vezes necessarias, etc.

Nesta secao serao apresentados alguns exemplos de erros em analises es-tatısticas e recomendacoes de como tentar evita-los. Naturalmente a lista naopretende ser exaustiva, mas apenas apontar os problemas mais comuns. Umaotima referencia sobre o assunto e Good and Hardin (2003).

6.1 Paradoxo de Simpson

Este exemplo foi extraıdo de DeGroot (1989). Suponha que foi feito um ex-perimento para comparar um novo tratamento para uma doenca com um tra-tamento padrao. Um grupo de 40 indivıduos recebeu o tratamento padraoenquanto outro grupo de 40 indivıduos recebeu o novo tratamento e apos umcerto perıodo de tempo foram observados quantos indivıduos em cada grupoapresentaram melhora. Os resultados para os 80 indivıduos estao na Tabela 6.1abaixo.

Tabela 6.1: Frequencias de melhora para indivıduos sob dois tratamentos dife-rentes.

situacao porcentagemmelhorou nao melhorou de melhora

novo tratamento 20 20 50tratamento padrao 24 16 60

Com base nesta tabela, o novo tratamento parece ser inferior ao tratamentopadrao. Suponha agora que os valores foram desagregados considerando-sehomens e mulheres separadamente e obteve-se a Tabela 6.2 abaixo.

17

Page 21: tecnica de pesquisa.pdf

18 CAPITULO 6. ERROS EM ESTATISTICA

Tabela 6.2: Frequencias de melhora para indivıduos sob dois tratamentos dife-rentes desagregados por sexo.

situacao porcentagemhomens melhorou nao melhorou de melhora

novo tratamento 12 18 40tratamento padrao 3 7 30

situacao porcentagemmulheres melhorou nao melhorou de melhora

novo tratamento 8 2 80tratamento padrao 21 9 70

Ou seja, esta tabela nos leva a conclusao oposta de que o novo tratamentoparece ser superior ao tratamento padrao. Este tipo de resultado e conhecidocomo paradoxo de Simpson e nao depende do tamanho amostral. O problemaaqui e que, independente do tratamento, a taxa de melhora e muito maior entreas mulheres do que entre os homens. Como muito mais mulheres receberamo tratamento padrao e muito mais homens receberam o novo tratamento, osdados agregados mostram o tratamento padrao com uma taxa de melhora globalmaior.

Para que este fenomeno nao ocorresse seria necessario que a proporcao deindivıduos recebendo os dois tratamentos fosse a mesma (ou aproximadamentea mesma) para homens e mulheres. Porem, nao e necessario que haja o mesmonumero de homens e mulheres. No entanto, mesmo apos tomar estes cuidadospode ser que existam outras variaveis, e.g. idade ou estagio da doenca, tais quea desagregacao levaria a conclusoes opostas.

6.2 Comparando abacaxi com banana

Outro problema consiste em tentar comparar coisas que nao sao realmentecomparaveis. Por exemplo, determinadas definicoes mudam ao longo do tempoe comparar coisas em instantes de tempo diferentes pode levar a conclusoes semvalor. O objeto de estudo precisa estar claramente definido e a definicao temque se manter constante para se fazer comparacoes.

Em alguns experimentos pode ser difıcil se fazer observacaes com variaveisadequadamente controladas. Suponha por exemplo que foi feito um estudo paramedir o efeito da poluicao urbana na reducao do tempo de vida das pessoas.A ideia era comparar o tempo de vida das pessoas vivendo em grandes centrosurbanos com o das que viviam em zonas rurais. No entanto, seria necessariogarantir que foram observados indivıduos destes dois grupos cuja unica diferencaem termos de ambiente e estilo de vida fosse a poluicao. Esta e uma tarefaquase impossıvel ja que teriamos que eliminar o efeito da violencia urbana,dos tipos de alimentacao, do stresse, etc. A conclusao do estudo, mesmo que

Page 22: tecnica de pesquisa.pdf

6.3. TESTANDO HIPOTESES 19

estatisticamente significativa, provavelmente nao teria nenhum valor.

6.3 Testando hipoteses

Da forma como a metodologia classica de testes de hipoteses foi desenvolvidapodemos ter a impressao de que estamos calculando probabilidades a respeitode uma hipotese. De fato, algumas vezes e incorretamente afirmado que rejeitarH0 ao nıvel α indica que a probabilidade de H0 ser verdadeira e menor do que α.Esta interpretacao nao e valida e o p-valor calculado em um teste nao fornecenenhuma indicacao sobre qualquer probabilidade a respeito de H0.

Para que esta interpretacao fosse valida teriamos que usar a abordagemBayesiana. Basicamente, terıamos que atribuir uma probabilidade a priori, i.e.antes de observar os dados, para a hipotese H0. Apos a observacao dos da-dos amostrais esta probabilidade seria atualizada, segundo regras da inferenciaBayesiana, e terıamos uma probabilidade a posteriori para a hipotese H0. Esteassunto nao sera tratado nestas notas, para maiores detalhes ver por exemploMigon e Gamerman (1999) ou DeGroot (1989).

6.4 Correlacao nao significa causalidade

Um dos erros de interpretacao mais comuns e assumir que correlacoes signifi-cativas necessariamente implicam em uma relacao de causa e efeito entre duasvariaveis. Esta interpretacao e incorreta.

Tambem e preciso ter cuidado ao assumir que existe correlacao somenteporque duas variaveis seguem o mesmo padrao de variabilidade. A correlacaopode ser devida a uma terceira variavel influenciando as duas primeiras.

6.5 Graficos

A maioria dos pacotes computacionais para analise estatıstica oferece facilidadespara construcao de varios tipos de graficos. Alguns cuidados devem ser tomadospara nao gerar dificuldades ou mesmo erros de interpretacao. Aqui veremosum exemplo de series temporais aonde a representacao grafica dos dados efundamental mesmo antes de comecar a analise. Outras referencias sobre oassunto sao Cleveland (1994) e Chatfield (1995).

Na Figura 6.1 temos a representacao grafica de uma serie temporal classicacom os totais mensais (em milhares) de passageiros em linhas aereas internaci-onais de 1949 a 1960. Os dados originais estao em Box and Jenkins (1976).

Note que o tıtulo descrevendo o grafico nao fornece detalhes suficientes eo leitor teria que recorrer ao texto para descobrir o que o grafico esta repre-sentando. O eixo vertical esta rotulado simplesmente como X, portanto naotemos informacao sobre a variavel nem sobre a escala de medida. Alem disso, aescala vertical comeca em 100 ao inves de zero, o que faz com que o crescimentopercentual da serie pareca maior. Outro problema e que o eixo horizontal estarotulado simplesmente como um ındice indicando apenas o aspecto temporaldos dados, mas nada informa sobre a periodicidade da serie. Para acessar a

Page 23: tecnica de pesquisa.pdf

20 CAPITULO 6. ERROS EM ESTATISTICA

variacao sazonal seria mais util ter uma escala horizontal representada em anosou em multiplos de 12, ja que os dados sao mensais.

Se o pacote que voce esta utilizando fornece tipo de representacao graficada Figura 6.1 como padrao nao se de por satisfeito. Verifique nos manuais sevoce pode alterar as opcoes graficas e nao tenha receio de adotar um metodode tentativa e erro. Tente diferentes opcoes de escala, sımbolos, etc. e verifiquequal grafico ficou melhor para os propositos do seu trabalho. Se o pacote naopermite esta facilidade entao a minha sugestao e que voce tente outro pacote.Uma representacao grafica pobre e incompleta pode levar as pessoas a naoperceber adequadamente o merito do seu trabalho.

A seguir estao listadas algumas recomendacoes gerais na construcao de umgrafico, seja para representar os dados originais, relacoes entre variaveis ouresultados da analise estatıstica.

1. O tıtulo deve ser claro e auto-explicativo.

2. As unidades de medida devem ser claramente especificadas.

3. As escalas devem ser bem escolhidas.

4. Os eixos devem estar rotulados indicando claramente as variaveis.

Figura 6.1: Dados de passageiros.

0 20 40 60 80 100 120 140

100200

300400

500600

x

Page 24: tecnica de pesquisa.pdf

6.5. GRAFICOS 21

Na Figura 6.2 a seguir esta representada a mesma serie temporal da Figura6.1 com as devidas alteracoes seguindo as recomendacoes acima. Note que ografico ficou bem mais informativo, praticamente nao sendo necessario recorrerao texto para entende-lo.

Figura 6.2: Totais mensais de passageiros (em milhares) em linhas aereas internacio-nais de janeiro de 1949 a dezembro de 1960.

Anos

Núme

ro de p

assage

iros (em

milha

res)

1950 1952 1954 1956 1958 1960

0100

200300

400500

600

Page 25: tecnica de pesquisa.pdf

22 CAPITULO 6. ERROS EM ESTATISTICA

Page 26: tecnica de pesquisa.pdf

Capıtulo 7

Variaveis

O Cambridge Dicionary of Statistics (Everitt, 1998), define uma variavel comoalguma caracterıstica que difere de indivıduo para indivıduo ou ao longo dotempo ou espaco. De um modo geral uma variavel pode ser vista como um elode ligacao entre conceitos em forma de hipoteses e observacoes dos fenomenosreais. A ideia e que as hipoteses possam ser testadas definindo estes conceitos emforma de variaveis. Por exemplo, para que se possa testar a hipotese “frustracaoproduz agressao” e preciso observar ou medir estes dois conceitos e isto so serapossıvel se “frustracao” e “agressao” forem variaveis cujos valores sao passıveisde mensuracao.

7.1 Classificacao de Variaveis

Variaveis sao classificadas segundo os possıveis valores que podem assumir.De um modo geral podemos distinguir dois tipos principais. Variaveis queapenas classificam uma determinada propriedade em tipos distintos em termosqualitativos sao denominadas variaveis qualitativas ou categoricas. Pode existirou nao alguma ordenacao natural entre as categorias de modo que ainda epossıvel uma subclassificacao em

• variaveis nominais, por exemplo sexo (masculino, feminino), classificacaode fosseis;

• variaveis ordinais, i.e. com categorias ordenadas, tais como salinidade(baixa, media, alta), abundancia (dominante, abundante, frequente, oca-sional, raro).

Variaveis quantitativas sao aquelas em que as possıveis realizacoes sao numerosresultantes de algum processo de contagem ou mensuracao. Podem ser aindasubdivididas em,

• discretas, i.e. contagens ou numero inteiros, por exemplo numero de ovospostos pela tartaruga marinha, numero de ataques de asma no ano pas-sado.

• contınuas, i.e. medidas numa escala contınua, tais como volume, area,peso ou massa.

23

Page 27: tecnica de pesquisa.pdf

24 CAPITULO 7. VARIAVEIS

Na pratica estas distincoes podem ser menos rıgidas, embora em geral sejarecomendado manter as variaveis em sua forma original. Por exemplo, nor-malmente a variavel idade seria tratada como contınua, mas se a idade forregistrada pelo ano mais proximo ela pode ser tratada como discreta. Por ou-tro lado, se os indivıduos forem classificados segundo sua idade em “criancas”,“adultos jovens”, “adultos” e “idosos” entao teremos faixa etaria como umavariavel qualitativa ordinal.

7.2 Relacoes entre Variaveis

Em investigacoes cientıficas de qualquer natureza e fundamental que o signifi-cado das relacoes entre variaveis seja bem entendido. Isto e importante paraque se possa dar prosseguimento as investigacoes de forma apropriada. Ba-sicamente, existem tres significados amplos descritos na literatura que seraoapresentados aqui.

7.2.1 Relacao Simetrica

Neste caso, embora se verifique uma relacao nenhuma das variaveis exerce acaosobre a outra. Alguns exemplos sao os seguintes,

1. Se alunos que obtem bons resultados em matematica tambem alcancambons resultados em provas orais nao podemos assumir que a capacidadematematica explica a capacidade verbal, ou vice-versa.

2. Encontrando-se uma relacao entre transpiracao palmar e batimentos cardıacosnao podemos considerar uma variavel como causa da outra, ambas sao in-terpretadas como sinal de ansiedade. Para determinar ansiedade podemosusar uma ou outra variavel.

3. Encontrando-se uma relacao entre frequentar colegio caro e obtencao debons empregos nao nos permiter inferir que o preco da escola influenciea qualidade do emprego. Na verdade ambas as variaveis tem a mesmacausa que e a classe social dos alunos.

Quando duas variaveis sao efeitos de uma causa comum diz-se que as relacoesentre elas sao espurias. Talvez fosse melhor dizer que houve uma interpretacaoespuria das relacoes. Seja como for, a identificacao destas relacoes simetricaspode ajudar no entendimento do fenomeno em questao. Finalmente, pode-seidentificar associacoes completamente fortuitas entre duas variaveis. Seria umerro metodologico tentar analisar tais associacoes.

7.2.2 Relacao Recıproca

Neste caso, embora seja claro que existem forcas causais nao e possıvel deter-minar de imediato quem causa quem. Na verdade cada uma das variaveis ealternadamente causa e efeito. Por exemplo,

Page 28: tecnica de pesquisa.pdf

7.3. VARIAVEIS MODERADORAS 25

1. o aumento da taxa de desemprego geralmente leva a uma reducao novolume de vendas, que por sua vez pode causar mais desemprego.

2. Um fenomeno conhecido em propaganda e que os indivıduos tendem aselecionar aquelas que estao de acordo com a sua ideologia (religiosa,polıtica, etc.), o que acaba reforcando a sua posicao ideologia.

7.2.3 Relacao Assimetrica

Neste caso, e possıvel postular que uma variavel (independente) essencialmenteafeta de algum modo a outra variavel (dependente). Este tipo de relacao e bemmais frequente nas ciencias sociais do que, por exemplo, em ciencias naturais.Alguns exemplos sao os seguintes,

1. crises economicas levam a opinioes polıticas extremadas;

2. o elogio leva a um melhor desempenho nas tarefas;

3. encontrando-se uma relacao entre o habito de fumar e o cancer do pulmaoe evidente que nao e a doenca que leva ao vıcio.

A determinacao de quem e variavel dependente ou independente em umestudo pode nao ser tao direta. Um dos criterios a ser utilizado se baseia na or-dem temporal dos acontecimentos que deram origem as variaveis, i.e. a variavelanterior no tempo e a independente. Por exemplo, se existe uma relacao entreduracao do noivado e posterior felicidade conjugal e evidente que a duracao donoivado ocorre antes na sequencia temporal e deve ser a variavel independente.

Em Estatıstica estaremos naturalmente lidando com relacoes probabilısticasou estocasticas. Assim, dada a ocorrencia de X entao provavelmente tambemocorrera Y . Mesmo em outros ramos da ciencia ha hoje uma tendencia emenunciar as proposicoes em forma probabilıstica.

7.3 Variaveis Moderadoras

Uma variavel moderadora pode influenciar ou modificar a relacao entre asvariaveis dependente e independente. Neste sentido sua identificacao pode sermuito importante em um estudo. Por exemplo, suponha que entre estudantesde mesma idade e inteligencia o desempenho de habilidades esta diretamenterelacionado com o numero de treinos praticos, porem esta relacao e mais forteentre meninos do que entre meninas. Neste caso a variavel sexo e claramenteuma variavel moderadora.

7.4 Variaveis de Controle

Basicamente uma variavel de controle e aquela cujo efeito o pesquisador neu-traliza propositadamente para que nao interfira na analise da relacao entre asoutras variaveis. Isto ocorre em situacoes complexas, quando se sabe que oefeito nao tem apenas uma causa mas pode sofrer influencia de varios fatores.

Page 29: tecnica de pesquisa.pdf

26 CAPITULO 7. VARIAVEIS

No entanto, se o pesquisador nao esta interessado ou se nao e possıvel analisartodos estes fatores no mesmo experimento entao e necessario neutraliza-los.

Voltando ao exemplo anterior, deseja-se estudar a relacao entre desempenhode habilidades e numero de treinos praticos. Sabe-se que a idade e o grau deinteligencia dos estudantes tem influencia no desempenho de habilidades masestas variaveis nao sao de interesse direto para o pesquisador e portanto elasforam neutralizadas quando foram analisados estudantes da mesma idade e graude inteligencia.

Page 30: tecnica de pesquisa.pdf

Referencias

Box, G. E. P. and G. M. Jenkins (1976). Time Series Analysis: Forecastingand Control (Revised ed.). Holden-Day, Oakland, California.

Chatfield, C. (1995). Problem-Solving: A Statistician’s Guide (2nd ed.). Lon-don: Chapman and Hall.

Cleveland, W. (1994). The Elements of Graphing Data (2nd ed.). Summit,NJ: Hobart Press.

DeGroot, M. H. (1989). Probability and Statistics (2nd ed.). Addison Wesley.

Good, P. I. and J. W. Hardin (2003). Common Errors in Statistics (and howto avlid them). Wiley: London.

Migon, H. S. and D. Gamerman (1999). Statistical Inference: An IntegratedApproach. Arnold.

27