apresentação e distribuição de dados prof. dr. vinicius campos disciplina de bioestatística e...
Post on 17-Apr-2015
104 Views
Preview:
TRANSCRIPT
Apresentação e distribuição de dados
Prof. Dr. Vinicius CamposDisciplina de Bioestatística e Delineamento Experimental
Graduação em Biotecnologia - UFPel
Abordagens da aula...
Divisão da estatística
• Técnicas estatísticas que permitem uma primeira aproximação à realidade estudada, na procura de algum padrão
• As técnicas estatísticas diferem em função do tipo de variável que está sendo analisada
Estatística descritiva
Duas principais classes de variáveis• Desfecho – variável principal que estamos
interessados, cuja variação ou ocorrência estamos interessados em entender
• Ex: Bebês nascidos com baixo peso (s/n)• Ex: Expressão gênica do gene Bcl-2 em células
tumorais
• Exposição – fator que pode influenciar o tamanho ou a ocorrência do desfecho
• Ex: Mãe fumou durante a gestação (s/n)• Ex: Dif. conc. de droga usada para inibir o
crescimento da célula tumoral
Desfecho Exposição
Variável resposta Variável explanatória
Variável dependente Variável independente
Fator de risco
Outros termos usados
Tipos de variáveis
• Dicotômica ou binária– sim / não– morreu / não morreu– doente / saudável– desnutrido / normal – masculino / feminino– maturo / imaturo– viável / não-viável
Qualitativa ou categórica
• Politômica– Nominal (não existe uma ordem nas respostas)
• estado civil• tipo de acidente de trânsito• cor da pele• religião• genótipo
– Ordinal (existe uma ordem)• nível econômico• idade (em grupos)• grau de instrução• grau de progressão do tumor• grau de desenvolvimento embrionário
Qualitativa ou categórica
• Discreta– Só números inteiros contagens
• idade (em anos)• número de filhos• número de blastômeros• tempo de resposta
• Contínua– Números com vírgula medidas
• nível de expressão gênica• altura• peso• toxicicidade celular
Quantitativa ou numérica
• Idade – Coletada em anos completos
• numérica discreta
– Categorizada em grupos de idade • categórica ordinal (20 a 29; 30 a 39; 40 a 49 anos)
• Renda familiar– Coletada em reais
• numérica contínua
– Categorizada em quintis de renda• categórica ordinal (1º a 5º quintil)
Variáveis derivadas
• IMC (Índice de Massa Corporal- kg/m2)
– Altura em m– Peso em Kg
• numérica contínua (23,3; 25,1; 30,3; 31,0...)• categórica ordinal (normal / sobrepeso / obeso)• dicotômica: obeso (s/n)
Variáveis derivadas
Apresentação dos dados
• Tabelas• Gráficos
• Os dados podem ser resumidos e organizados com o uso de estatísticas
– Em tabelas quando é importante a apresentação dos valores
– Em gráficos ou mapas apresentação de distribuições, tendências ou relacionamentos entre variáveis
Apresentação dos dados
• Apresentação sumária dos resultados “mais importantes”
• Auto-explicativas– Idealmente não precisa recorrer ao texto– Abreviações explicadas
• Apresentação clara – Tabelas não têm linhas verticais (quadro sim)– Linhas horizontais
• entre título e cabeçalhos das colunas• entre cabeçalhos e dados• no final
Tabelas
• Qual a freqüência de inatividade física nos indivíduos da amostra?
Inativos | Freq. Percent Cum.
------------+-----------------------------------
nao | 1837 58.90 58.90
sim | 1282 41.10 100.00
------------+-----------------------------------
Total | 3119 100.00
Variável categórica dicotômica
Variável categórica dicotômica
Tabela 1 - Frequência de inatividade física em indivíduos adultos e idosos residentes em Pelotas, RS.
Variável N Percentual
Inatividade física
Sim
Não
1282
1837
41,1%
58,9%
2 variáveis dicotômicas
• Qual a frequência de inatividade física conforme o sexo?
Inativos | sexo | masculino feminino | Total-----------+----------------------+---------- não | 809 1028 | 1837 | 59.79 58.21 | 58.90 -----------+----------------------+---------- sim | 544 738 | 1282 | 40.21 41.79 | 41.10 -----------+----------------------+---------- Total | 1353 1766 | 3119 | 100.00 100.00 | 100.00
Pearson chi2(1) = 0.7924 Pr = 0.373
Duas variáveis dicotômicas
Tabela 2 - Frequência de inatividade física (IF) conforme o sexo em 3119 indivíduos adultos e idosos residentes em Pelotas, RS.
* Teste do qui-quadrado para heterogeneidade
Variável Percentual de IF Valor-p
Sexo
Masculino
Feminino
40,2%
41,8%
0,4*
Duas variáveis dicotômicas
• Qual a distribuição dos indivíduos da amostra por nível econômico?
Nível econ.|| Freq. Percent Cum.
------------+----------------------------------- A | 147 4.64 4.64 B | 600 18.93 23.56 C | 1270 40.06 63.63 D | 1026 32.37 95.99 E | 127 4.01 100.00------------+----------------------------------- Total | 3170 100.00
Variável categórica ordinal
Tabela 3 - Distribuição da amostra de adultos e idosos conforme o nível econômico. Pelotas, RS, Brasil, 2002.
Variável N Percentual
Nível econômico
A
B
C
D
E
147
600
1270
1026
127
4,6%
18,9%
40,2%
32,4%
4,0%
Variável categórica ordinal
Estado civil N % solteiro 223 27,0 casado 438 52,9 viúvo 45 5,4 separado 109 13,2 outros 12 1,5 Total 827 100,0
Tabela 4 – Estado civil dos indivíduos.
Variável categórica ordinal
Estado civil Idade em anos No (%)
Total
15–20 21–29 30–39 solteiro 120 (75) 80 (25) 23 (7) 223 casado 27 (17) 185 (58) 226 (65) 438 viúvo 0 (0) 6 (2) 39 (11) 45 separado 12 (8) 43 (14) 54 (15) 109 outros 1 (0) 3 (1) 8 (2) 12 Total 160 (100) 317 (100) 350 (100) 827
Tabela 5 – Estado civil dos indivíduos por faixa etária.
2 variáveis categóricas: 1 ordinal x 1 nominal
• Qual o nível de expressão gênica do NPY em peixes adultos e juvenis?
Descriptive Statistics for JUVENIS = 1
Variable N Mean SD Minimum MaximumJuvenis 4 1.0000 0.1225 0.8176 1.0714
Descriptive Statistics for ADULTOS = 2
Variable N Mean SD Minimum MaximumAdultos 4 1.8569 0.2445 1.5868 2.1727
Quantitativa ou numérica
Barbosa-Silva MC, Barros AJ, Post CL et al. Can Bioelectrical Impedance Analysis Identify Malnutrition in Preoperative Nutrition Assessment? Nutrition 2003;19:422– 426.
Exemplo: médias estratificadas por sexo
• Distribuição de frequência de variáveis categóricas
• Barras separadas• No eixo X marcar as categorias• No eixo Y marcar a frequência absoluta ou
relativa (%)• Quando se tem um no. pequeno de
observações, marcar o no. absoluto em vez da %
• Escala do Y: SEMPRE iniciar do zero
Gráfico de barras
8
8,1
8,2
8,3
8,4
8,5
8,6
8,7
Jan Fev Mar Abr
0
2
4
6
8
10
Jan Fev Mar Abr
Taxas de inflação (dados fictícios)
Por que iniciar o eixo Y do zero?
Tipo de parto
0
10
20
30
40
50
60
Normal Cesárea
Por
cent
agem
Classe social
0
10
20
30
40
50
B C D E
Porc
enta
gem
No. de pneumonias
0
10
20
30
40
50
60
70
0 1 2 3 4 5+
Por
cent
agem
No. de filhos
05
10152025303540
1 2 3 4 5+
Por
cent
agem
Gráfico de barras
Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).
05
1015202530354045
Fre
q. r
elat
iva
(%)
A B C D E
Nível social
Nacional
Estudo
Gráfico de barras - apresentação
Gráfico de barras – artigo científico
Figura 1 - Percentual dos níveis sociais (Abipeme) para o Brasil (1991) e famílias de crianças freqüentando creches gratuitas em Campinas (1994).
0
5
10
15
20
25
30
35
40
45
A B C D ENível social
Fre
q.
rela
tiva
(%
)
Nacional
Estudo
Gráfico de barras - artigo
Gráfico de barras - apresentação
Gráfico de barras - artigo
Expressão gênica do NPY e sbGnRH associada ao desenvolvimento gonadal em linguados juvenis e adultos
Exemplo de colunas empilhadas
0%
20%
40%
60%
80%
100%
q1 q2 q3 q4 q5
Quintis nível econômico
outros
particular / convênio
hospital
posto
Busca de serviços de saúde por quintis de nível econômico
Gráfico de pizza
4%
25%
14%
10%1%
25%
7%
7%
7%
Trabalho Vigorosas
Trabalho Moderadas
Trabalho Caminhada
Deslocamentos
Domésticas Vigorosas
Domésticas Moderadas
Lazer Vigorosas
Lazer Moderadas
Lazer Caminhadas
Outra forma de distribuição de freqüência de variáveis categóricas
Tipo de atividade física realizada pelos indivíduos da amostra
• Distribuição de frequência de variáveis contínuas
• Divide os dados em classes de amplitudes iguais
• Área deve somar 100%• Barras encostam• O resto..., igual ao gráfico de barras
Histograma
Histograma – variável contínua, distribuição simétricaFr
act
ion
Distribuição de peso ao nascerPeso ao nascer (g)
1000 2000 2500 3000 3500 4000 5000 6000
0
.05
.1
Histograma – variável contínua, distribuição simétricaFr
act
ion
Distribuição de peso ao nascerPeso ao nascer (g)
1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 6000
0
.1
.2
.3
.4
Histograma – variável contínua, distribuição assimétrica
Freq
üênc
ia re
lativ
a (%
)
Renda familiar (R$)0 100 200 300 400 500
10
20
30
40
50
60
70
Figura 3 - Renda familiar (R$) de crianças freqüentando creches gratuitas em Fortaleza, CE, 1995.
Histograma – variável numérica discreta
0
5
10
15
20
25
0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–
Pontos da classif icação socioeconômica Abipeme
Pro
porç
ão d
e do
mic
ílios
(%
)
Classe E Classe CClasse D Classe B
Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças frequentando creches gratuitas em Campinas, 1994.
Gráfico de área
0
5
10
15
20
25
0– 5– 10– 15– 20– 25– 30– 35– 40– 45– 50– 55– 60– 65– 70– 75–
Pontos da classif icação socioeconômica Abipeme
Pro
porç
ão d
e do
mic
ílios
(%
)
Classe E Classe CClasse D Classe B
Figura 4 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.
A mesma variável agrupada em categorias
Nível social
0
10
20
30
40
50
B C D E
Por
cent
agem
Figura 5 - Distribuição dos pontos da classificação socioeconômica Abipeme por domicílio de crianças freqüentando creches gratuitas em Campinas, 1994.
Outros gráficos: pizza de pizza
procurou no PSF
tomou
não procurou
Não tomou
3,7%
57%
43%
Figura 6 – Indivíduos que deixaram de tomar os medicamentos que necessitavam nos últimos 15 dias e procura ao PSF
Outros gráficos: Linha
0
2
4
6
8
10
0 1 to 4 5 to 8 9 to 11 >=12
Schooling (years of formal education)
% % Low BMI
Figure 8. Prevalence of low body mass index (BMI) in females according to schooling level.
Mudanças no perfil dos medicamentos mais utilizados aos três, 12 e 24 meses de idade. Coorte de nascimentos 2004, Pelotas – RS.
0
5
10
15
20
25
30
35
3 meses 12 meses 24 meses
%
Analgésicos (N02) Antibacterianos (J01)
Sistema respiratório ( R ) Antidiarréico (A07)
Dermatológicos (D01+D02+D08) Antianêmicos + Vitaminas (A11+B03)
Dados agrupados
Obrigado pela atenção!!!Vinicius Farias Camposfariascampos@gmail.comvcampos_ib@ufpel.edu.br
top related