estatística descritiva (tabelas e gráficos)

28
1 1 Aula 1 Introdução Estatística Descritiva (Tabelas e Gráficos) Prof. Cosme Marcelo Furtado Passos da Silva 2 O que é Estatística? Um estatístico é aquele que, tendo a cabeça a arder e os pés enterrados no gelo, ainda diz que na média está tudo bem!...

Upload: alessandro-leitao

Post on 30-Mar-2016

237 views

Category:

Documents


3 download

DESCRIPTION

Estatística Descritiva (Tabelas e Gráficos)

TRANSCRIPT

Page 1: Estatística Descritiva (Tabelas e Gráficos)

1

1

Aula 1

� Introdução� Estatística Descritiva (Tabelas e Gráficos)

Prof. Cosme Marcelo Furtado Passos da Silva

2

O que é Estatística?

Um estatístico é aquele que,

tendo a cabeça a arder e os pés

enterrados no gelo, ainda diz

que na média está tudo bem!...

Page 2: Estatística Descritiva (Tabelas e Gráficos)

2

3

O que é Estatística?

Usa-se por vezes a Estatística

como um bêbado usa um poste

de luz: Mais para suporte do

que para iluminação...

4

O que é Estatística?

Métodos estatísticos são essenciais no estudo de

situções em que as características de interesse estão

sujeitas, inerentemente, a flutuações aleatórias.

Mesmo em um grupo homogêneo de indivíduos,

observa-se grande variabilidade entre indivíduos, e no

mesmo indivíduo, em ocasiões diferentes.

Page 3: Estatística Descritiva (Tabelas e Gráficos)

3

5

O que é Estatística?

A qualidade das informações depende da qualidade dos dados!!!

Conjunto de métodos para a coleta e análise de dados, provenientes

de qualquer área do conhecimento, possibilitando a interpretação e

construção de inferências neles baseados.

6

Motivos para se estudar Estatística

• Saber fazer para fazer ou criticar o que está feito.

• Tornar-se mais crítico em sua análise de informações quantitativas;

• Tornar-se menos sujeito a afirmações enganosas baseadas em

números ou gráficos distorcidos.

• Aguçar sua capacidade de reconhecer dados estatísticos distorcidos

e de interpretar adequadamente dados não distorcidos.

• Validar as informações levantadas na dissertação/tese.

Page 4: Estatística Descritiva (Tabelas e Gráficos)

4

7

Pesquisa e Dados

• Planejamento de uma pesquisa (definir problema, objetivos, tipo de

pesquisa, população e amostra, coleta de dados);

• Dados e variáveis (definir e medir variáveis);

• Elaboração de questionário (definir forma de aplicação, fazer teste piloto);

8

Amostragem

Page 5: Estatística Descritiva (Tabelas e Gráficos)

5

9

Técnicas de Amostragem

10

Técnicas de Amostragem

Page 6: Estatística Descritiva (Tabelas e Gráficos)

6

11

Técnicas de Amostragem

12

Fases para Análise Estatística

Estatística

Planejamento InferencialDescritiva

Page 7: Estatística Descritiva (Tabelas e Gráficos)

7

13

Estatística Descritiva

� O que deve serfeito com os dadosdepois que elesforam coletados?

� O que pode serconcluído a partirda informaçãodisponível?

14

Folha de Dados

OBSERVAÇÕES

VARIÁVEIS

Identificação Sexo Idade Fuma Tratamento Raça1 1 35 0 1 negra2 2 27 1 2 branca3 2 32 0 3 negra4 1 45 0 1 pardo5 1 63 0 1 mulato6 1 54 0 2 branca7 2 78 1 18 2 36 1 39 1 42 0 3

10 2 39 1 211 1 51 1 112 1 63 0 313 2 32 0 114 2 41 0 115 2 54 0 216 1 56 0 217 2 65 0 318 1 48 1 219 1 37 0 120 2 46 0 321 1 51 0 222 2 48 0 123 2 53 0 124 1 62 1 125 1 39 0 326 2 47 1 327 1 58 0 228 2 62 0 229 1 34 0 3

Page 8: Estatística Descritiva (Tabelas e Gráficos)

8

15

Basicamente, a Análise Descritiva consiste na

organização e descrição dos dados, na identificação de

valores que represente o elemento típico e na

percepção, avaliação e quantificação da variabilidade do

conjunto de dados.

Descrição e Apresentação de Dados

Além de se familiarizar com os dados, possibilitaidentificar estruturas interessantes, como a de valoresatípicos.

16

• Em estudos pequenos podemos descrever cada

observação (este procedimento é tedioso).

Ex: Estudo de casos

• Na maioria das vezes é impossível analisar

observação por observação.

Ex: Pesquisas domiciliares

Descrição e Apresentação de Dados

Page 9: Estatística Descritiva (Tabelas e Gráficos)

9

17

Há várias formas de sumarizar os dados,

dependendo da natureza dos dados.

As mais utilizadas são:

●Tabelas

●Gráficos

●Medidas-resumo numéricas

Descrição dos Dados

18

Distribuição de Freqüências

Tabela de Dados Brutos: obtidos diretamente da

pesquisa. Sem tratamento ou síntese.

Exemplo: Teor de gordura fecal (g/24 horas) em 43crianças (Penna, 1984; Penna et al. 1987)

3,7 1,6 2,5 3,0 3,9 1,9 3,8 1,5 1,11,8 1,4 2,7 2,1 3,3 3,2 2,3 2,3 2,40,8 3,1 1,8 1,0 2,0 2,0 2,9 3,2 1,91,6 2,9 2,0 1,0 2,7 3,0 1,3 1,5 4,62,4 2,1 1,3 2,7 2,1 2,8 1,9

Page 10: Estatística Descritiva (Tabelas e Gráficos)

10

19

Distribuição de Freqüências

Consiste na construção de uma tabela a partir dos

dados brutos, em que se leva em consideração a

frequência com que cada observação ocorre.

A interpretação pode ser auxiliada pela análise de

gráficos.

20

Distribuição de Freqüênciascom intervalos de classe

Exemplo: Uma das tarefas rotineiras na prática médica éa comparação de um valor de uma medida de importânciaclínica, tal como parâmetros hematológicos com umpadrão. Uma vez que há uma grande variação dessasmedidas entre diferentes pacientes, o padrão não é umnúmero, mas uma faixa.

Para a construção desta faixa são obtidos dados

através da medição da característica de interesse em um

grupo representativo de pessoas supostamente sadias.

Page 11: Estatística Descritiva (Tabelas e Gráficos)

11

21

Tipos de Dados (Variáveis)

Variável

Qualitativa(categórica)

Quantitativa(numérica)

Nominal

Ordinal

Discreta

Contínua

Variável é a quantificação ou categorização dacaracterística de interesse do estudo.

Facilita o tratamento estatístico de variáveis,classificá-las em categóricas e quantitativas:

22

Tipos de Dados (Variáveis)

• Variável resposta: variável a ser explicada no estudo.

• Variável explicativa ou covariável: variável que serve de

suporte na explicação da variabilidade da variável reposta.

Conhecer o tipo da variável resposta é um ponto

de partida para determinar os métodos de análise mais

apropriados ou válidos.

Page 12: Estatística Descritiva (Tabelas e Gráficos)

12

23

Exemplo de Dados Coletados

� Qual é a sua idade?

� Qual o número de pessoas da sua

família?

� Qual é a renda total de sua família?

� Qual é o seu estado civil?

� Você tem emprego fixo?

Questionário de um Inquérito Epidemiológico:

� Idade

� Tamanho da família

� Renda familiar

� Estado Civil

� Emprego

24

Variáveis Nominais

• Estado Civil:1. Casada2. Solteira3. Separada / divorciada4. Viúva

• Sexo:1. Feminino2. Masculino

Variável binária ou

Dicotômica

Não há ordem entre as categorias:

• Tipo sanguíneo: A, B, AB, O ⇒ mais categorias

Page 13: Estatística Descritiva (Tabelas e Gráficos)

13

25

Variáveis Nominais

- Distribuição de Freqüências:

Sarcoma de Kaposi Número de casos

SimNão

2462314

Casos de Sarcoma de Kaposi para os primeiros

2560 casos de Aids registrados nos Centro de

Controle de Doença, Atlanta, Geórgia.

26

Variáveis Nominais

- Distribuição de melanomas por localização anatômica

Localização anatômica No de casos (Freqüência absoluta)

Percentual(Freqüência relativa)

Cabeça/pescoço 10 33,3

Tronco 7 23,3Membros superiores 6 20,0Membros inferiores 2 6,7

Acral 5 16,7Total 30 100

Page 14: Estatística Descritiva (Tabelas e Gráficos)

14

27

Variáveis Ordinais

• Auto-avaliação do estado de saúde:1. Muito boa2. Boa3. Regular4. Ruim5. Muito ruim

A ordem deve ser levada em consideração:

• Estadiamento de uma doença: leve, moderada, grade

28

Tabelas de Dupla Entrada (Tabelas de Contingência)

Lesão na cabeça

Uso de capacete

TotalSim Não

Sim 17 218 235

Não 130 428 558

Total 147 646 793

Estudo para avaliar a efetividade do uso decapacetes de segurança de acidentes de bicicleta.Amostra de 793 indivíduos envolvidos em acidentesciclísticos.

Page 15: Estatística Descritiva (Tabelas e Gráficos)

15

29

Comparação entre Grupos/Categorias

Comparações entre grupos/categorias devem ser feitas

através de freqüências relativas.

Qual cursinho pode ser considerado melhor em termos de

aprovação de seus alunos?

Cursinho Aprovados Candidatos % de Aprovação

Alpha 1600 4000 1600/4000 = 0,40 ou 40%

Beta 400 500 400/500 = 0,80 ou 80%

Gama 2400 6000 2400/6000 = 0,40 ou 40%

30

Gráficos – Variáveis Nominais e Ordinais

Page 16: Estatística Descritiva (Tabelas e Gráficos)

16

31

Gráficos – Variáveis Nominais e Ordinais

32

Variáveis Discretas

Ordem e magnitude são importantes. Os valores

diferem entre si por quantidades fixas. Nenhum valor

intermediário é possível. Geralmente são resultados de

contagens.

• Tamanho da família: (1, 2, 3, 4, ...18)

• Número de internações desde 1980 a 2004

• Número de óbitos

Page 17: Estatística Descritiva (Tabelas e Gráficos)

17

33

Variáveis Discretas

34

Variáveis Discretas

Page 18: Estatística Descritiva (Tabelas e Gráficos)

18

35

Variáveis Contínuas

Os valores possíveis pertencem a um intervalo de

números reais, que resultam de mensuração. A diferença

entre medidas pode ser arbitrariamente pequena e são

anotadas até a precisão da medida usada.

• Peso;

• Altura;

• Pressão Sanguínea.

Variáveis Contínuas - Tabela

Page 19: Estatística Descritiva (Tabelas e Gráficos)

19

37

Variáveis Contínuas - Histograma

38

Variáveis Contínuas - Histograma

Page 20: Estatística Descritiva (Tabelas e Gráficos)

20

39Freq. Simples

10

30

10

Freq. Relativa

0.2 0.2

0.6

Densidade

0.02 0.02

0.06

Área=11050

0.210

- Diferentes formas de construir um histograma sem alterar sua forma.

Variáveis Contínuas - Área

40

Variáveis Contínuas Polígono de Freqüências

Page 21: Estatística Descritiva (Tabelas e Gráficos)

21

41

Variáveis Contínuas Polígono de Freqüências

Vantagem: sobreposição

42

Variáveis Contínuas Polígono de Freqüência Acumulada

Page 22: Estatística Descritiva (Tabelas e Gráficos)

22

43

Variáveis Contínuas Diagrama de Pontos

Distribuição do Teor de gordura fecal (g/24 horas) em 43 crianças

1 2 3 4

44

Variáveis Contínuas Diagrama de Ramo-e-Folhas

The decimal point is 2 digit(s) to the right of the |

0 | 110 | 1 | 21 | 55567777788888888999992 | 0000000111111111222222333333334444442 | 55555666788888993 | 23 | 64 | 4 | 8

Taxa de colesterol (mg/dL)

em 80 indivíduos.

Page 23: Estatística Descritiva (Tabelas e Gráficos)

23

45

Diagrama de dispersão (Variável numérica X variável numérica)

46

Gráfico de Linhas (Variável numérica no tempo)

Page 24: Estatística Descritiva (Tabelas e Gráficos)

24

47

Aspectos Gerais – Distribuição de Freqüências -

• Tendência Central• Variabilidade• Forma

48

Aspectos Gerais – Distribuição de Freqüências -

Page 25: Estatística Descritiva (Tabelas e Gráficos)

25

49

Exercícios

Classifique as variáveis abaixo quanto ao tipo (qualitativanominal, qualitativa ordinal, quantitativa discreta, quantitativacontínua):

1) Número de crises depressivas sofridas por cinco pessoas: 3,1, 2, 3, 2;

2) Área (em metros quadrados - m2) ocupada de trêsconsultórios: 9, 12, 10;

50

3) Cor de olhos de quatro pacientes: verde, castanho, azul,

castanho;

4) Diâmetro (em cm) do pulso de cinco pessoas: 18, 17, 15, 17,

16;

5) Nível de depressão de quatro pacientes de um Psicólogo:

Baixo, Alto, Alto, Regular;

6) Número de internações de quatro pacientes de um Psicólogo:

2, 1, 3, 3;

Exercícios

Page 26: Estatística Descritiva (Tabelas e Gráficos)

26

51

7) Distância percorrida (em quilômetros - Km) por cinco atletas

em treinamento: 8, 6, 12, 8, 11;

8) Doenças manifestadas em quatro pacientes internados no setor

de pediatria: sarampo, catapora, sarampo, rubéola;

9) Estatura (em cm) de cinco pessoas: 178, 177, 176, 177, 176;

10) Número de dentes obturados por cinco dentistas em um dia

de trabalho: 13, 12, 14, 11, 12;

Exercícios

52

11) Fator Rh do sangue de três pacientes: negativo, positivo,

negativo;

12) Grau de instrução de cinco pessoas entrevistadas: superior,

superior, médio, fundamental, médio;

13) Número de filhos de quatro casais: 2, 1, 2, 0;

14) Grupo sangüíneo de seis pessoas: O, AB, O, A; O, B;

15) Nacionalidade de cinco estrangeiros: Portuguesa, Portuguesa,

Francesa, Americana, Japonesa;

Exercícios

Page 27: Estatística Descritiva (Tabelas e Gráficos)

27

53

16) Número de visitas feitas ao Brasil por cinco turistas

estrangeiros: 4, 3, 2, 4, 2;

17) Patente de quatro militares: soldado, sargento, soldado,

coronel;

18) Peso de cinco pacientes em kg: 45, 46, 45, 47, 47;

19) Número de sessões de Psicologia de cinco pacientes: 5, 6, 7,

6, 6;

20) Plantação de cinco fazendas: milho, café, soja, soja, café;

21) Pressão sangüínea de quatro pacientes: 10, 12, 11, 11;

Exercícios

54

22) Número de pacientes internados, em um ano, em cinco

clínicas: 44, 32, 34, 41, 29;

23) Profissão de cinco pessoas: Fisioterapeuta, Psicólogo,

Fisioterapeuta, Médico, Psicólogo;

24) Raça de quatro pessoas: negra, branca, amarela, negra;

25) Número de livros lidos por cinco pessoas, em um ano: 10,

10, 7, 9, 9.

Exercícios

Page 28: Estatística Descritiva (Tabelas e Gráficos)

28

55

1) Soares, J F; Siqueira, A L. Introdução à Estatística Médica. Coopmed Editora Médica, 2a

edição, 2002, Belo Horizonte, MG.

2) Magalhães, M. N.; Lima, A. C. P (2005). Noções de Probabilidade e Estatística. 6ª ed. Edusp.

São Paulo.

3) Silva, Nilsa Nunes (2004). Amostragem Probabilística: Um curso introdutório. Edusp. Brasil.

4) Mood, A. M. et al. 1974. Introduction to the Theory of Statistics. 3. ed. Tokyo, McGraw-Hill

Kogakusha.

5) Triola, M.F. Introdução à Estatística. Rio de Janeiro: LTC Editora, 1999

6) Pagano, M., e Gauvreau, K. Princípios de Bioestatística, Segunda Edição São Paulo: Thomson,

2004

7) Venables WN, Ripley, BD (2002). Moderns Applied Statistics with S. Fourth Edition. Springer.

8) Venables WN, Smith DM, et al. (2002). An introduction to R: notes on R: a programming

environment for data. Bristol, Network Theory

9) Dalgaard, P. (2002) Introductory Statistics with R. Springer.

Bibliografia