apresentação e distribuição de dados prof. dr. vinicius campos disciplina de bioestatística e...

47
Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Upload: internet

Post on 17-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Apresentação e distribuição de dados

Prof. Dr. Vinicius CamposDisciplina de Bioestatística e Delineamento Experimental

Graduação em Biotecnologia - UFPel

Page 2: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Abordagens da aula...

Page 3: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Divisão da estatística

Page 4: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Técnicas estatísticas que permitem uma primeira aproximação à realidade estudada, na procura de algum padrão

• As técnicas estatísticas diferem em função do tipo de variável que está sendo analisada

Estatística descritiva

Page 5: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Duas principais classes de variáveis• Desfecho – variável principal que estamos

interessados, cuja variação ou ocorrência estamos interessados em entender

• Ex: Bebês nascidos com baixo peso (s/n)• Ex: Expressão gênica do gene Bcl-2 em células

tumorais

• Exposição – fator que pode influenciar o tamanho ou a ocorrência do desfecho

• Ex: Mãe fumou durante a gestação (s/n)• Ex: Dif. conc. de droga usada para inibir o

crescimento da célula tumoral

Page 6: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Desfecho Exposição

Variável resposta Variável explanatória

Variável dependente Variável independente

Fator de risco

Outros termos usados

Page 7: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Tipos de variáveis

Page 8: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Dicotômica ou binária– sim / não– morreu / não morreu– doente / saudável– desnutrido / normal – masculino / feminino– maturo / imaturo– viável / não-viável

Qualitativa ou categórica

Page 9: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Politômica– Nominal (não existe uma ordem nas respostas)

• estado civil• tipo de acidente de trânsito• cor da pele• religião• genótipo

– Ordinal (existe uma ordem)• nível econômico• idade (em grupos)• grau de instrução• grau de progressão do tumor• grau de desenvolvimento embrionário

Qualitativa ou categórica

Page 10: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Discreta– Só números inteiros contagens

• idade (em anos)• número de filhos• número de blastômeros• tempo de resposta

• Contínua– Números com vírgula medidas

• nível de expressão gênica• altura• peso• toxicicidade celular

Quantitativa ou numérica

Page 11: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Idade – Coletada em anos completos

• numérica discreta

– Categorizada em grupos de idade • categórica ordinal (20 a 29; 30 a 39; 40 a 49 anos)

• Renda familiar– Coletada em reais

• numérica contínua

– Categorizada em quintis de renda• categórica ordinal (1º a 5º quintil)

Variáveis derivadas

Page 12: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• IMC (Índice de Massa Corporal- kg/m2)

– Altura em m– Peso em Kg

• numérica contínua (23,3; 25,1; 30,3; 31,0...)• categórica ordinal (normal / sobrepeso / obeso)• dicotômica: obeso (s/n)

Variáveis derivadas

Page 13: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Apresentação dos dados

• Tabelas• Gráficos

Page 14: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Os dados podem ser resumidos e organizados com o uso de estatísticas

– Em tabelas quando é importante a apresentação dos valores

– Em gráficos ou mapas apresentação de distribuições, tendências ou relacionamentos entre variáveis

Apresentação dos dados

Page 15: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Apresentação sumária dos resultados “mais importantes”

• Auto-explicativas– Idealmente não precisa recorrer ao texto– Abreviações explicadas

• Apresentação clara – Tabelas não têm linhas verticais (quadro sim)– Linhas horizontais

• entre título e cabeçalhos das colunas• entre cabeçalhos e dados• no final

Tabelas

Page 16: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Qual a freqüência de inatividade física nos indivíduos da amostra?

Inativos | Freq. Percent Cum.

------------+-----------------------------------

nao | 1837 58.90 58.90

sim | 1282 41.10 100.00

------------+-----------------------------------

Total | 3119 100.00

Variável categórica dicotômica

Page 17: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Variável categórica dicotômica

Tabela 1 - Frequência de inatividade física em indivíduos adultos e idosos residentes em Pelotas, RS.

Variável N Percentual

Inatividade física

Sim

Não

1282

1837

41,1%

58,9%

2 variáveis dicotômicas

Page 18: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Qual a frequência de inatividade física conforme o sexo?

Inativos | sexo | masculino feminino | Total-----------+----------------------+---------- não | 809 1028 | 1837 | 59.79 58.21 | 58.90 -----------+----------------------+---------- sim | 544 738 | 1282 | 40.21 41.79 | 41.10 -----------+----------------------+---------- Total | 1353 1766 | 3119 | 100.00 100.00 | 100.00

Pearson chi2(1) = 0.7924 Pr = 0.373

Duas variáveis dicotômicas

Page 19: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Tabela 2 - Frequência de inatividade física (IF) conforme o sexo em 3119 indivíduos adultos e idosos residentes em Pelotas, RS.

* Teste do qui-quadrado para heterogeneidade

Variável Percentual de IF Valor-p

Sexo

Masculino

Feminino

40,2%

41,8%

0,4*

Duas variáveis dicotômicas

Page 20: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Qual a distribuição dos indivíduos da amostra por nível econômico?

Nível econ.|| Freq. Percent Cum.

------------+----------------------------------- A | 147 4.64 4.64 B | 600 18.93 23.56 C | 1270 40.06 63.63 D | 1026 32.37 95.99 E | 127 4.01 100.00------------+----------------------------------- Total | 3170 100.00

Variável categórica ordinal

Page 21: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Tabela 3 - Distribuição da amostra de adultos e idosos conforme o nível econômico. Pelotas, RS, Brasil, 2002.

Variável N Percentual

Nível econômico

A

B

C

D

E

147

600

1270

1026

127

4,6%

18,9%

40,2%

32,4%

4,0%

Variável categórica ordinal

Page 22: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Estado civil N % solteiro 223 27,0 casado 438 52,9 viúvo 45 5,4 separado 109 13,2 outros 12 1,5 Total 827 100,0

Tabela 4 – Estado civil dos indivíduos.

Variável categórica ordinal

Page 23: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Estado civil Idade em anos No (%)

Total

15–20 21–29 30–39 solteiro 120 (75) 80 (25) 23 (7) 223 casado 27 (17) 185 (58) 226 (65) 438 viúvo 0 (0) 6 (2) 39 (11) 45 separado 12 (8) 43 (14) 54 (15) 109 outros 1 (0) 3 (1) 8 (2) 12 Total 160 (100) 317 (100) 350 (100) 827

Tabela 5 – Estado civil dos indivíduos por faixa etária.

2 variáveis categóricas: 1 ordinal x 1 nominal

Page 24: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Qual o nível de expressão gênica do NPY em peixes adultos e juvenis?

Descriptive Statistics for JUVENIS = 1

Variable N Mean SD Minimum MaximumJuvenis 4 1.0000 0.1225 0.8176 1.0714

Descriptive Statistics for ADULTOS = 2

Variable N Mean SD Minimum MaximumAdultos 4 1.8569 0.2445 1.5868 2.1727

Quantitativa ou numérica

Page 25: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Barbosa-Silva MC, Barros AJ, Post CL et al. Can Bioelectrical Impedance Analysis Identify Malnutrition in Preoperative Nutrition Assessment? Nutrition 2003;19:422– 426.

Exemplo: médias estratificadas por sexo

Page 26: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Distribuição de frequência de variáveis categóricas

• Barras separadas• No eixo X marcar as categorias• No eixo Y marcar a frequência absoluta ou

relativa (%)• Quando se tem um no. pequeno de

observações, marcar o no. absoluto em vez da %

• Escala do Y: SEMPRE iniciar do zero

Gráfico de barras

Page 27: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

8

8,1

8,2

8,3

8,4

8,5

8,6

8,7

Jan Fev Mar Abr

0

2

4

6

8

10

Jan Fev Mar Abr

Taxas de inflação (dados fictícios)

Por que iniciar o eixo Y do zero?

Page 28: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Tipo de parto

0

10

20

30

40

50

60

Normal Cesárea

Por

cent

agem

Classe social

0

10

20

30

40

50

B C D E

Porc

enta

gem

No. de pneumonias

0

10

20

30

40

50

60

70

0 1 2 3 4 5+

Por

cent

agem

No. de filhos

05

10152025303540

1 2 3 4 5+

Por

cent

agem

Gráfico de barras

Page 29: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).

05

1015202530354045

Fre

q. r

elat

iva

(%)

A B C D E

Nível social

Nacional

Estudo

Gráfico de barras - apresentação

Page 30: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Gráfico de barras – artigo científico

Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).

0

5

10

15

20

25

30

35

40

45

A B C D ENível social

Fre

q.

rela

tiva

(%

)

Nacional

Estudo

Gráfico de barras - artigo

Page 31: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Gráfico de barras - apresentação

Page 32: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Gráfico de barras - artigo

Page 33: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Expressão gênica do NPY e sbGnRH associada ao desenvolvimento gonadal em linguados juvenis e adultos

Page 34: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Exemplo de colunas empilhadas

0%

20%

40%

60%

80%

100%

q1 q2 q3 q4 q5

Quintis nível econômico

outros

particular / convênio

hospital

posto

Busca de serviços de saúde por quintis de nível econômico

Page 35: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Gráfico de pizza

4%

25%

14%

10%1%

25%

7%

7%

7%

Trabalho Vigorosas

Trabalho Moderadas

Trabalho Caminhada

Deslocamentos

Domésticas Vigorosas

Domésticas Moderadas

Lazer Vigorosas

Lazer Moderadas

Lazer Caminhadas

Outra forma de distribuição de freqüência de variáveis categóricas

Tipo de atividade física realizada pelos indivíduos da amostra

Page 36: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

• Distribuição de frequência de variáveis contínuas

• Divide os dados em classes de amplitudes iguais

• Área deve somar 100%• Barras encostam• O resto..., igual ao gráfico de barras

Histograma

Page 37: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Histograma – variável contínua, distribuição simétricaFr

act

ion

Distribuição de peso ao nascerPeso ao nascer (g)

1000 2000 2500 3000 3500 4000 5000 6000

0

.05

.1

Page 38: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Histograma – variável contínua, distribuição simétricaFr

act

ion

Distribuição de peso ao nascerPeso ao nascer (g)

1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 6000

0

.1

.2

.3

.4

Page 39: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Histograma – variável contínua, distribuição assimétrica

Freq

üênc

ia re

lativ

a (%

)

Renda familiar (R$)0 100 200 300 400 500

10

20

30

40

50

60

70

Figura 3 - Renda familiar (R$) de crianças freqüentando creches gratuitas em Fortaleza, CE, 1995.

Page 40: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Histograma – variável numérica discreta

0

5

10

15

20

25

0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–

Pontos da classif icação socioeconômica Abipeme

Pro

porç

ão d

e do

mic

ílios

(%

)

Classe E Classe CClasse D Classe B

Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças frequentando creches gratuitas em Campinas, 1994.

Page 41: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Gráfico de área

0

5

10

15

20

25

0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–

Pontos da classif icação socioeconômica Abipeme

Pro

porç

ão d

e do

mic

ílios

(%

)

Classe E Classe CClasse D Classe B

Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.

Page 42: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

A mesma variável agrupada em categorias

Nível social

0

10

20

30

40

50

B C D E

Por

cent

agem

Figura 5 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.

Page 43: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Outros gráficos: pizza de pizza

procurou no PSF

tomou

não procurou

Não tomou

3,7%

57%

43%

Figura 6 – Indivíduos que deixaram de tomar os medicamentos que necessitavam nos últimos 15 dias e procura ao PSF

Page 44: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Outros gráficos: Linha

0

2

4

6

8

10

0 1 to 4 5 to 8 9 to 11 >=12

Schooling (years of formal education)

% % Low BMI

Figure 8. Prevalence of low body mass index (BMI) in females according to schooling level.

Page 45: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Mudanças no perfil dos medicamentos mais utilizados aos três, 12 e 24 meses de idade. Coorte de nascimentos 2004, Pelotas – RS.

0

5

10

15

20

25

30

35

3 meses 12 meses 24 meses

%

Analgésicos (N02) Antibacterianos (J01)

Sistema respiratório ( R ) Antidiarréico (A07)

Dermatológicos (D01+D02+D08) Antianêmicos + Vitaminas (A11+B03)

Page 46: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Dados agrupados

Page 47: Apresentação e distribuição de dados Prof. Dr. Vinicius Campos Disciplina de Bioestatística e Delineamento Experimental Graduação em Biotecnologia - UFPel

Obrigado pela atenção!!!Vinicius Farias [email protected][email protected]