1 bioestatÍstica profª. lúcia helena sagrillo pimassoni unidade 3 descrição e apresentação de...

Post on 07-Apr-2016

230 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

BIOESTATÍSTICA

Profª. Lúcia Helena Sagrillo Pimassoni

Unidade 3 Descrição e apresentação de dados

2

O objetivo é organizar, resumir e apresentar dados, de tal forma que possamos interpretá-los de acordo com os objetivos da pesquisa.

Estatística Descritiva

Dados estatísticos são observações da realidade que nos cerca. Podem ser fatos ou números.

3

a) Indivíduo ou unidade elementar: é a entidade de base sobre a qual o observador realiza um certo número de medições.

Exemplo: um paciente, um usuário, um empregado, um dente, uma cidade, um país, um eleitor, uma minhoca, etc...

Dados EstatísticosEm um conjuntos de dados, temos os indivíduos e as informações relativas a esses indivíduos, as variáveis. Segue que:

4

b) Variáveis: conjunto de informações levantadas para cada indivíduo.

Exemplo: no caso de um estudo clínico, os indivíduos seriam os pacientes atendidos e as variáveis seriam o sexo, a idade, pressão d/s, altura, tipo de sangue, número de cáries, etc.

Quanto ao tipo as variáveis podem ser quantitativas e qualitativas.

Dados Estatísticos

A técnica estatística depende do tipo de variável.

5

Tipos de VariáveisQualitativa: quando seus possíveis valores assumem modalidades não numéricas (categóricas), como sexo, profissão, escolaridade, região, nível hierárquico, etc... Pode ser:

Nominal: são dados que podem ser separados em categorias chamadas de não mensuráveis (cor dos olhos, sexo, região);

Ordinal: envolvem dados que podem ser dispostos em alguma ordem (nível hierárquico, nível de satisfação, grau de escolaridade).

6

Quantitativa: a característica do elemento observado é uma quantidade (salário, idade, altura, peso, etc... ). Pode ser:

Discreta: assumem valores inteiros. Os dados discretos são resultantes da contagem de um número de itens (número de pacientes internados, etc.);

Contínua: assumem qualquer valor num intervalo de valores. São dados resultantes de medições (taxa de colesterol, peso, altura, etc.).

Tipos de Variáveis

7

Exemplo de Planilha de DadosIndivíduo VAR 1 VAR2 … VARp

1

2

3

4

n

8

Exemplo de Planilha de Dados

9

Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes maneiras: Tabelas de Freqüências. Gráfico de Barras. Gráfico de Setores.

Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos

Ao estudarmos grandes conjuntos de dados, é conveniente organizá-los e resumi-los.

10

Apresentação e Organização dos dados: Métodos Tabulares e Métodos gráficos

Os dados quantitativos contínuos podem ser apresentados ou organizados das seguintes maneiras: Tabela de freqüências em classes Histogramas Polígono de freqüências Gráfico de linhas

11

Tabelas de Freqüências

Tabela de Freqüência é uma tabela na qual numa das colunas aparecem os valores observados da variável aleatória e nas demais colunas aparecem as freqüências de ocorrência dos respectivos valores. Essas colunas contém as seguintes freqüências: Freqüência absoluta. Freqüência relativa. Freqüência acumulada absoluta. Freqüência acumulada relativa.

12

Tabelas de Freqüências

Freqüência absoluta (f) é o número de vezes que cada valor se repete.

Freqüência Relativa (fr) fornece a relação entre a freqüência observada de um determinado valor e o número total de observações realizadas no experimento.

13

Tabelas de Freqüências

Freqüência acumulada absoluta (Fa): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.

Freqüência acumulada relativa (Fr): A soma das freqüências absolutas anteriores é chamada freqüência acumulada absoluta.

14

Tabelas de Freqüências

Exemplo

234 43,4

305 56,6

539 100,0

Tipo de partoNormal

Cesárea

Total

Freqüência %

Tabela 1. Tipo de parto*.

*Amostra de 539 pacientes do Hospital AAAA

15

Tabelas de Freqüências

Apgar de 5 minutos f fr (%) FA FR (%)1 2 0.4 2 0.43 1 0.2 3 0.65 3 0.6 6 1.26 4 0.7 10 1.97 16 3.0 26 4.98 65 12.1 91 17.09 346 64.7 437 81.7

10 98 18.3 575 100.0Total 535 100.0

Tabela 2. Apgar de 5 minutos*.

*Amostra de 539 pacientes do Hospital AAAA

16

A Tabela de Freqüências para dados agrupados em classe é constituída da mesma forma que para dados não agrupados, com a diferença de que agora os valores da variável a ser descrita passam a ser organizados por classes.

O nº de classes deve ficar entre 5 e 20. Utilizando intervalos podemos apresentar

os dados como no exemplo seguinte:

Tabelas de Freqüências em classe

17

Tabelas de Freqüências em classeExemplo

Peso ao nascer (kg) f fr FA FR

1,5 |-- 2,0 6 5.8 6 5.8

2,0 |-- 2,5 16 15.5 22 21.3

2,5 |-- 3,0 31 30.1 53 51.4

3,0 |--3,5 34 33.0 87 84.4

3,5 |-- 4,0 11 10.7 98 95.1

4,0 |-- 4,5 4 3.9 102 99.0

4,5 |-- 5,0 1 1.0 103 100.0

Total 103 100.0

Tabela 3. Peso de RN*.

*Amostra de 103 RN da Maternidade BBBB.

18

Tabelas de Freqüências em classe

Dada a seqüência: 1, 2, 3, 4, 5, 6, 7, 8. Podemos representar intervalos das seguintes formas:

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Tabelas de Freqüências em classe

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7

Intervalo fechado: 1 8 = 1,2,3,4,5,6,7,8

Intervalo fechado à esquerda: 1 8 = 1,2,3,4,5,6,7

Intervalo fechado à direita: 1 8 = 2, 3, 4, 5, 6, 7, 8

19

Gráficos

Variável qualitativa ou quantitativa discreta

Gráfico de Barras

Gráfico de Setores circulares

20

Gráficos

0

10

20

30

40

50

60

%

Normal Cesárea

Tipo de parto

Gráfico de Barras

21 Gráfico de Setores

Gráficos

92.8%

7.1% 0.2%

Cefálica

Pélvica

Córmica

22

Histograma

Polígono de freqüência

Gráfico de linhas

Gráficos

Variável quantitativa contínua

23

Gráficos

Hemoglobina em hemocue

14,5413,0911,6410,198,74

300

200

100

0

Histograma

24

Gráficos

0

2

4

6

8

10

12

14

16

0 5 15 25 35 45 55 65 75

Polígono de freqüência

25

Gráficos

Dados Prevalência e Incidência

1980 a 1998

ANO

98

97

96

95

94

93

92

91

90

89

88

87

86

85

84

83

82

81

80

40

30

20

10

0

prevalência

incidência

26

TERCEIRA LISTA DE EXERCÍCIOS

1. Em cada uma das situações, a seguir, identifique a variável a ser

medida; classifique a variável sob estudo; indique uma representação

gráfica adequada:

a) Um pesquisador está estudando o número de crianças desnutridas em

cada município do ES.

b) A Secretaria de Saúde do estado do ES está estudando o grau de

satisfação (muito satisfeito, satisfeito, pouco satisfeito e insatisfeito)

em relação aos programas sociais do governo federal.

27

TERCEIRA LISTA DE EXERCÍCIOS

c) Dentre os trabalhadores aposentados por acidente de trabalho será

realizado um estudo para identificar o tipo de acidente que foram

acometidos.

d) O corpo de enfermagem de certo hospital está analisando a perda

de peso de pacientes internados na UTI. Os pacientes são pesados

antes e depois da internação.

28

2. Elabore uma tabela de freqüência para os seguintes dados:

Uma pesquisa foi realizada Hospital Infantil com crianças da região de

São Pedro que apresentavam indícios de verminose. Foram realizados

exames para confirmação da suspeita. Os exames foram realizados

com 40 crianças e os resultados são apresentados abaixo, sendo que

“Sim” indica que foi confirmada a suspeita de verminose e “Não” indica

que a suspeita não foi confirmada.

Sim Sim Não Sim Não Não Não Sim Sim Sim Sim Não Sim Sim Sim Não Não Sim Não Sim Sim Sim Não Sim Não Sim Não Sim Sim Sim Sim Sim Sim Sim Sim Não Não Sim Sim Sim

TERCEIRA LISTA DE EXERCÍCIOS

29

3. Elabore uma tabela de freqüência para os dados referentes a

quantidade de anos trabalhados, quando 24 trabalhadores de certa

empresa desenvolveram doença ocupacional.

14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14

TERCEIRA LISTA DE EXERCÍCIOS

30

4. Complete a tabela abaixo de dados referentes ao nível de colesterol de 78 pacientes:

Nível de colesterol

fi fri(%) Fa Fr (%)

100 |-- 150 2

150 |-- 200 24

200 |-- 250 35

250 |-- 300 14

300 |-- 350 1

350 |-- 400 1

400 |-- 450 0

450 |-- 500 1

Total 78

TERCEIRA LISTA DE EXERCÍCIOS

31

5. Abaixo é dado um conjunto de dados referentes a tempos

(em dias) até a recidiva de 40 pacientes que realizaram

radioterapia. Monte uma distribuição de freqüências em classe.

175 187 195 203 212 225 241 249 175 190 195 209 213 235 245 249 178 190 198 209 218 236 245 251 183 194 199 210 220 237 245 255 185 194 201 210 220 238 248 258

TERCEIRA LISTA DE EXERCÍCIOS

32

Objetivam resumir um conjunto de valores em um único valor.

Medidas estatísticas

Ten d ênc ia C en tralM ed idas de O rdem

P os ição

D esvio M éd ioD esvio P ad rão

V ariânc ia C oef. de V ariação

D isp ersã o

M ed ida d eA ss im etria

P os itivaN egativa

A ss im etria

M ed ida deA ch atam ento

C urtose

M ed id as

33

Média Aritmética

A média aritmética, ou simplesmente média, é a soma de todos os valores do conjunto divididos pelo número observações.

Exemplo: Considere uma variável aleatória da qual foram observados os seguintes valores de rendimento em salários mínimos: 8; 10; 13; 17; 29.Calcule a média aritmética:

É sempre assim!... A média dos meus

rendimentos é sempre menor que o necessário!

34

Média Aritmética Algumas propriedades da média aritmética

A média de um conjunto de números pode ser sempre calculada.

Para um dado conjunto de números a média é única.

A média é sensível a (ou afetada por) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica.

35

36

Moda (Mo) é o valor da variável que mais se repete, o que possui maior freqüência. Uma variável pode ter mais de uma moda (bimodal, trimodal,multimodal e amodal).

Moda

Fácil de calcular;

Não é afetada por valores extremos;

Pode estar afastada do centro dos valores;

Não utiliza todos os valores da variável;

Nem sempre ela existe e pode existir mais de uma moda.

Odeio usar chapéu!...Mas não posso ficar fora da moda

Querida, seu chapéu é

maravilhoso!

Ah! Nada como andar

na moda!

37

Classifique o conjunto de dados de acordo com a moda, determine-a quando possível:

a) 8; 10; 13; 13; 17; 29b) 1; 3; 7; 9; 15; 20; 5 c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10e) 10, 15, 16, 16, 18, 18, 18, 19, 30

Moda

Exemplo

38

Mediana

A mediana é uma medida de posição, não sendo influenciada pelos valores observados.

Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de observações em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram acima da mediana.

MEDIANA

39

Mediana

Se n (o número de observações) é ímpar o valor da mediana ocupa a posição (n +1)/2.

Se n (o número de observações) é par o valor da mediana é a média dos valores que ocupam as posições (n/2) e (n/2 +1).

Ordenando-se as notas da turma em bioestatística temos: 0, 5, 6, 7, 8, 9, 9.5.

A mediana será igual a 7.

Exemplo

40

Mediana Fácil de calcular;

Não é afetada por valores extremos;

É um valor único;

Não utiliza todos os valores da variável.

Calcule a média, mediana e modas para os seguintes conjuntos de dados:

a) 32 42 46 46 54

b) 1000 1500 2000 2450 2500 2500 2500 100000

41

Qual das três medidas usar? Quando procuramos conhecer valores médios: a média. Ex.: em controle de qualidade, a média é utilizada para determinar se o processo está operando ao redor de um valor esperado, o alvo.

Se a variável tiver valores extremos, a mediana é mais adequada. Ex.: salário.

A moda é um valor típico. Variáveis qualitativas. Doenças que mais ocorrem.

42

Quartis

O interesse está em conhecer a posição de um determinado valor em relação ao grupo de valores.

Os quartis são os valores que dividem os dados ordenados em quatro partes, com igual número de dados. O primeiro quartil (Q1) delimita os 25% menores valores. O terceiro quartil (Q3) é o valor que separa os 25% maiores valores. O segundo quartil é a própria mediana.

43

O diagrama é um gráfico útil para descrição dos dados, visualização de sua variabilidade e comparação entre diferentes grupos.

Box-plot

GRUPO

Grupo 2Grupo1

Idad

e (a

nos)

50

40

30

20

10

44

Percentis

Ordenados os dados, os percentis são medidas que dividem os dados em partes iguais.

Percentil 10: separa 10% dos menores dados;

Percentil 20: separa 20% dos menores dados;

Percentil 80: separa 80% dos menores dados e 20% dos maiores;

E assim sucessivamente….

45

Medidas de Variabilidade ou dispersãoMedidas de dispersão dizem respeito à descrição de um grupo de valores em termos da variabilidade existente entre os itens incluídos dentro do grupo, ou seja, essas medidas indicam se os valores estão relativamente próximos uns dos outros, ou separados.

Pequena dispersão

Grande dispersão

46

Medidas de VariabilidadeAMPLITUDE: expressa a diferença entre o maior e o menor número num conjunto de dados.

DESVIO MÉDIO: soma dos módulos dos desvios dividido pelo total de dados.

VARIÂNCIA: soma dos quadrados dos desvios dividido pelo total de dados menos 1 (amostra).

DESVIO PADRÃO: raiz quadrada positiva da variância.

COEFICIENTE DE VARIAÇÃO: Mede o grau de variação relativa.

47

Amplitude

Amplitude = Maior valor - menor valor

Exemplos

a) 1, 2, 2, 3, 5, 7, 8, 9, 10 Amplitude =

b) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude =

970

48

Variância e Desvio padrão

Faculdade Notas dos alunos Média da Faculdade6 6 6 6 6 6 6 6

1 2 4 6 6 9 10 10

0 6 7 7 7 6 8 7

A

B

C

6,0

6,0

6,0

Exemplo: Considere as notas de bioestatística de alunos de três faculdades de Vitória:

49

Variância e Desvio padrão

As notas das três faculdades apontam para a mesma nota média, mas as notas estão distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e C, notamos que as notas de B são bem mais dispersas, indicando que B é mais heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante dos demais, uma nota extremamente baixa, acarretando um valor para a média abaixo da maioria das notas da turma.

50

Variância e Desvio padrão

Para melhorar o resumo dos dados, podemos apresentar uma medida de dispersão destes dados, como a variância ou desvio padrão.

É simples! Sempre sem dinheiro, a variância é zero!...

Como você consegue manter seu saldo bancário sempre

estável?

51

Variância e Desvio padrão

é sempre um número positivo;

se todos os valores de uma amostra forem iguais, a variância e o desvio padrão serão zero;

a variância e o desvio padrão são medidas afetadas pelos valores extremos da variável.

52

Variância e Desvio padrão

Para calcularmos essas medidas, devemos considerar os desvios de cada valor em relação à média. Depois, constrói-se uma média desses desvios.

Desvio da Média

Exemplo: 4, 5, 5, 6, 6, 7, 7, 8

53

Variância e Desvio padrãoNotas Desvio = Nota - Média

4 4 - 6 = -25 5 - 6 = -15 5 - 6 = -16 6 - 6 = 06 6 - 6 = 07 7 - 6 =17 7 - 6 =18 8 - 6 = 2

soma 0

Notas Desvio = Nota - Média (Desvio)2

4 4 - 6 = -2 (-2)2 = 45 5 - 6 = -1 (-1)2 = 15 5 - 6 = -1 (-1)2 = 16 6 - 6 = 0 (0)2 = 06 6 - 6 = 0 (0)2 = 07 7 - 6 =1 (1)2 = 17 7 - 6 =1 (1)2 = 18 8 - 6 = 2 (2)2 = 4

soma 0 12

71,118

12

Variância 3,171,1 padrãoDesvio

54

22 1

1

niix x

s n

Variância Amostral

Variância e Desvio padrão

Desvio padrão Amostral

11

2

nxx

sn

i i

55

Coeficiente de variação

O coeficiente de variação é uma medida relativa da variabilidade.

Ele é útil quando queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes desvios padrões e diferentes médias.

100MédiapadrãoDesvioCV

56

ExemploCalcule a variância e o desvio padrão do conjunto de dados abaixo:

i

1 3,2

2 3,2

3 2,8

4 2,1

5 2,9

6 3,1

7 3,2

8 3,0

9 3,5

10 4,0

Total 31

ix2ix xxi

2)( xxi

57

i

1 3,2 10,24 0,1 0,012 3,2 10,24 0,1 0,013 2,8 7,84 -0,3 0,094 2,1 4,41 -1,0 1,005 2,9 8,41 -0,2 0,046 3,1 9,61 0,0 0,007 3,2 10,24 0,1 0,018 3,0 9,00 -0,1 0,019 3,5 12,25 0,4 0,1610 4,0 16,00 0,9 0,81Total 31 98,24 0,0 2,41

ix2ix xxi 2)( xxi

24,0914,22 s 49,024,0 s

Exemplo

58

QUARTA LISTA DE EXERCÍCIOS

1. Considere pesos de 10 recém-nascidos e obtenha o peso médio,

o peso mediano e o peso modal.

2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,2 3,5 4,0

2. Considere escores de pacientes na evolução do tratamento com tianeptina e calcule Calcule a amplitude total, o desvio padrão e o coeficiente de variação:

26 27 25 26 27 49

59

QUARTA LISTA DE EXERCÍCIOS3. Muitos estudos mostram que o stress afeta a capacidade de

memorização. Observe as medidas e o gráfico abaixo sobre um

escore para memorização e faça um comentário sobre os

resultados. Escreva um breve texto comentando sobre as medidas

estatísticas encontradas.

Com stress Sem stress Número de observações 10,0 10,0

Mínimo 30,0 48,0 Máximo 65,0 90,0 Média 46,3 65,1 Moda 45,0 55,0 Mediana 45,0 59,0 Percentil 25 37,3 53,8 Percentil 75 56,3 81,3 Desvio padrão 11,2 15,1

Sem stressCom stress

100

90

80

70

60

50

40

30

20

top related