apresentação e distribuição de dados prof. dr. vinicius campos disciplina de bioestatística e...

Post on 17-Apr-2015

104 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Apresentação e distribuição de dados

Prof. Dr. Vinicius CamposDisciplina de Bioestatística e Delineamento Experimental

Graduação em Biotecnologia - UFPel

Abordagens da aula...

Divisão da estatística

• Técnicas estatísticas que permitem uma primeira aproximação à realidade estudada, na procura de algum padrão

• As técnicas estatísticas diferem em função do tipo de variável que está sendo analisada

Estatística descritiva

Duas principais classes de variáveis• Desfecho – variável principal que estamos

interessados, cuja variação ou ocorrência estamos interessados em entender

• Ex: Bebês nascidos com baixo peso (s/n)• Ex: Expressão gênica do gene Bcl-2 em células

tumorais

• Exposição – fator que pode influenciar o tamanho ou a ocorrência do desfecho

• Ex: Mãe fumou durante a gestação (s/n)• Ex: Dif. conc. de droga usada para inibir o

crescimento da célula tumoral

Desfecho Exposição

Variável resposta Variável explanatória

Variável dependente Variável independente

Fator de risco

Outros termos usados

Tipos de variáveis

• Dicotômica ou binária– sim / não– morreu / não morreu– doente / saudável– desnutrido / normal – masculino / feminino– maturo / imaturo– viável / não-viável

Qualitativa ou categórica

• Politômica– Nominal (não existe uma ordem nas respostas)

• estado civil• tipo de acidente de trânsito• cor da pele• religião• genótipo

– Ordinal (existe uma ordem)• nível econômico• idade (em grupos)• grau de instrução• grau de progressão do tumor• grau de desenvolvimento embrionário

Qualitativa ou categórica

• Discreta– Só números inteiros contagens

• idade (em anos)• número de filhos• número de blastômeros• tempo de resposta

• Contínua– Números com vírgula medidas

• nível de expressão gênica• altura• peso• toxicicidade celular

Quantitativa ou numérica

• Idade – Coletada em anos completos

• numérica discreta

– Categorizada em grupos de idade • categórica ordinal (20 a 29; 30 a 39; 40 a 49 anos)

• Renda familiar– Coletada em reais

• numérica contínua

– Categorizada em quintis de renda• categórica ordinal (1º a 5º quintil)

Variáveis derivadas

• IMC (Índice de Massa Corporal- kg/m2)

– Altura em m– Peso em Kg

• numérica contínua (23,3; 25,1; 30,3; 31,0...)• categórica ordinal (normal / sobrepeso / obeso)• dicotômica: obeso (s/n)

Variáveis derivadas

Apresentação dos dados

• Tabelas• Gráficos

• Os dados podem ser resumidos e organizados com o uso de estatísticas

– Em tabelas quando é importante a apresentação dos valores

– Em gráficos ou mapas apresentação de distribuições, tendências ou relacionamentos entre variáveis

Apresentação dos dados

• Apresentação sumária dos resultados “mais importantes”

• Auto-explicativas– Idealmente não precisa recorrer ao texto– Abreviações explicadas

• Apresentação clara – Tabelas não têm linhas verticais (quadro sim)– Linhas horizontais

• entre título e cabeçalhos das colunas• entre cabeçalhos e dados• no final

Tabelas

• Qual a freqüência de inatividade física nos indivíduos da amostra?

Inativos | Freq. Percent Cum.

------------+-----------------------------------

nao | 1837 58.90 58.90

sim | 1282 41.10 100.00

------------+-----------------------------------

Total | 3119 100.00

Variável categórica dicotômica

Variável categórica dicotômica

Tabela 1 - Frequência de inatividade física em indivíduos adultos e idosos residentes em Pelotas, RS.

Variável N Percentual

Inatividade física

Sim

Não

1282

1837

41,1%

58,9%

2 variáveis dicotômicas

• Qual a frequência de inatividade física conforme o sexo?

Inativos | sexo | masculino feminino | Total-----------+----------------------+---------- não | 809 1028 | 1837 | 59.79 58.21 | 58.90 -----------+----------------------+---------- sim | 544 738 | 1282 | 40.21 41.79 | 41.10 -----------+----------------------+---------- Total | 1353 1766 | 3119 | 100.00 100.00 | 100.00

Pearson chi2(1) = 0.7924 Pr = 0.373

Duas variáveis dicotômicas

Tabela 2 - Frequência de inatividade física (IF) conforme o sexo em 3119 indivíduos adultos e idosos residentes em Pelotas, RS.

* Teste do qui-quadrado para heterogeneidade

Variável Percentual de IF Valor-p

Sexo

Masculino

Feminino

40,2%

41,8%

0,4*

Duas variáveis dicotômicas

• Qual a distribuição dos indivíduos da amostra por nível econômico?

Nível econ.|| Freq. Percent Cum.

------------+----------------------------------- A | 147 4.64 4.64 B | 600 18.93 23.56 C | 1270 40.06 63.63 D | 1026 32.37 95.99 E | 127 4.01 100.00------------+----------------------------------- Total | 3170 100.00

Variável categórica ordinal

Tabela 3 - Distribuição da amostra de adultos e idosos conforme o nível econômico. Pelotas, RS, Brasil, 2002.

Variável N Percentual

Nível econômico

A

B

C

D

E

147

600

1270

1026

127

4,6%

18,9%

40,2%

32,4%

4,0%

Variável categórica ordinal

Estado civil N % solteiro 223 27,0 casado 438 52,9 viúvo 45 5,4 separado 109 13,2 outros 12 1,5 Total 827 100,0

Tabela 4 – Estado civil dos indivíduos.

Variável categórica ordinal

Estado civil Idade em anos No (%)

Total

15–20 21–29 30–39 solteiro 120 (75) 80 (25) 23 (7) 223 casado 27 (17) 185 (58) 226 (65) 438 viúvo 0 (0) 6 (2) 39 (11) 45 separado 12 (8) 43 (14) 54 (15) 109 outros 1 (0) 3 (1) 8 (2) 12 Total 160 (100) 317 (100) 350 (100) 827

Tabela 5 – Estado civil dos indivíduos por faixa etária.

2 variáveis categóricas: 1 ordinal x 1 nominal

• Qual o nível de expressão gênica do NPY em peixes adultos e juvenis?

Descriptive Statistics for JUVENIS = 1

Variable N Mean SD Minimum MaximumJuvenis 4 1.0000 0.1225 0.8176 1.0714

Descriptive Statistics for ADULTOS = 2

Variable N Mean SD Minimum MaximumAdultos 4 1.8569 0.2445 1.5868 2.1727

Quantitativa ou numérica

Barbosa-Silva MC, Barros AJ, Post CL et al. Can Bioelectrical Impedance Analysis Identify Malnutrition in Preoperative Nutrition Assessment? Nutrition 2003;19:422– 426.

Exemplo: médias estratificadas por sexo

• Distribuição de frequência de variáveis categóricas

• Barras separadas• No eixo X marcar as categorias• No eixo Y marcar a frequência absoluta ou

relativa (%)• Quando se tem um no. pequeno de

observações, marcar o no. absoluto em vez da %

• Escala do Y: SEMPRE iniciar do zero

Gráfico de barras

8

8,1

8,2

8,3

8,4

8,5

8,6

8,7

Jan Fev Mar Abr

0

2

4

6

8

10

Jan Fev Mar Abr

Taxas de inflação (dados fictícios)

Por que iniciar o eixo Y do zero?

Tipo de parto

0

10

20

30

40

50

60

Normal Cesárea

Por

cent

agem

Classe social

0

10

20

30

40

50

B C D E

Porc

enta

gem

No. de pneumonias

0

10

20

30

40

50

60

70

0 1 2 3 4 5+

Por

cent

agem

No. de filhos

05

10152025303540

1 2 3 4 5+

Por

cent

agem

Gráfico de barras

Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).

05

1015202530354045

Fre

q. r

elat

iva

(%)

A B C D E

Nível social

Nacional

Estudo

Gráfico de barras - apresentação

Gráfico de barras – artigo científico

Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).

0

5

10

15

20

25

30

35

40

45

A B C D ENível social

Fre

q.

rela

tiva

(%

)

Nacional

Estudo

Gráfico de barras - artigo

Gráfico de barras - apresentação

Gráfico de barras - artigo

Expressão gênica do NPY e sbGnRH associada ao desenvolvimento gonadal em linguados juvenis e adultos

Exemplo de colunas empilhadas

0%

20%

40%

60%

80%

100%

q1 q2 q3 q4 q5

Quintis nível econômico

outros

particular / convênio

hospital

posto

Busca de serviços de saúde por quintis de nível econômico

Gráfico de pizza

4%

25%

14%

10%1%

25%

7%

7%

7%

Trabalho Vigorosas

Trabalho Moderadas

Trabalho Caminhada

Deslocamentos

Domésticas Vigorosas

Domésticas Moderadas

Lazer Vigorosas

Lazer Moderadas

Lazer Caminhadas

Outra forma de distribuição de freqüência de variáveis categóricas

Tipo de atividade física realizada pelos indivíduos da amostra

• Distribuição de frequência de variáveis contínuas

• Divide os dados em classes de amplitudes iguais

• Área deve somar 100%• Barras encostam• O resto..., igual ao gráfico de barras

Histograma

Histograma – variável contínua, distribuição simétricaFr

act

ion

Distribuição de peso ao nascerPeso ao nascer (g)

1000 2000 2500 3000 3500 4000 5000 6000

0

.05

.1

Histograma – variável contínua, distribuição simétricaFr

act

ion

Distribuição de peso ao nascerPeso ao nascer (g)

1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 6000

0

.1

.2

.3

.4

Histograma – variável contínua, distribuição assimétrica

Freq

üênc

ia re

lativ

a (%

)

Renda familiar (R$)0 100 200 300 400 500

10

20

30

40

50

60

70

Figura 3 - Renda familiar (R$) de crianças freqüentando creches gratuitas em Fortaleza, CE, 1995.

Histograma – variável numérica discreta

0

5

10

15

20

25

0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–

Pontos da classif icação socioeconômica Abipeme

Pro

porç

ão d

e do

mic

ílios

(%

)

Classe E Classe CClasse D Classe B

Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças frequentando creches gratuitas em Campinas, 1994.

Gráfico de área

0

5

10

15

20

25

0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–

Pontos da classif icação socioeconômica Abipeme

Pro

porç

ão d

e do

mic

ílios

(%

)

Classe E Classe CClasse D Classe B

Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.

A mesma variável agrupada em categorias

Nível social

0

10

20

30

40

50

B C D E

Por

cent

agem

Figura 5 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.

Outros gráficos: pizza de pizza

procurou no PSF

tomou

não procurou

Não tomou

3,7%

57%

43%

Figura 6 – Indivíduos que deixaram de tomar os medicamentos que necessitavam nos últimos 15 dias e procura ao PSF

Outros gráficos: Linha

0

2

4

6

8

10

0 1 to 4 5 to 8 9 to 11 >=12

Schooling (years of formal education)

% % Low BMI

Figure 8. Prevalence of low body mass index (BMI) in females according to schooling level.

Mudanças no perfil dos medicamentos mais utilizados aos três, 12 e 24 meses de idade. Coorte de nascimentos 2004, Pelotas – RS.

0

5

10

15

20

25

30

35

3 meses 12 meses 24 meses

%

Analgésicos (N02) Antibacterianos (J01)

Sistema respiratório ( R ) Antidiarréico (A07)

Dermatológicos (D01+D02+D08) Antianêmicos + Vitaminas (A11+B03)

Dados agrupados

Obrigado pela atenção!!!Vinicius Farias Camposfariascampos@gmail.comvcampos_ib@ufpel.edu.br

top related