medidas de tendência central e de dispersão

45
MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE Bioestatística e Delineamento Experimental - 2013 Carolina Coll

Upload: others

Post on 19-Oct-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Medidas de tendência central e de dispersão

MEDIDAS DE TENDÊNCIA

CENTRAL E VARIABILIDADE

Bioestatística e Delineamento Experimental - 2013

Carolina Coll

Page 2: Medidas de tendência central e de dispersão

Tópicos da aula

Frequência absoluta e relativa

Medidas de tendência central e variabilidade

Variáveis contínuas: distribuição normal

Amostra

Page 3: Medidas de tendência central e de dispersão

Relembrando... tipos de variáveis

Dicotômicas

Politômicas

Nominais

(ordem não importa)

Ordinais

(tem uma ordem lógica)

Discretas

(números inteiros)

Contínuas

(aceitam decimais) Cor da pele,

estado civil...

NSE, estágio

desenvolvimento de

um tumor...

“CONTAGENS”

Nº filhos, nº de

células... “MEDIDAS”

Peso, pressão

arterial,

glicose...

Page 4: Medidas de tendência central e de dispersão

Por que sumarizar dados?

Page 5: Medidas de tendência central e de dispersão

Por que sumarizar dados?

Page 6: Medidas de tendência central e de dispersão

Por que sumarizar dados?

Page 7: Medidas de tendência central e de dispersão

Distribuição de frequência

Descrição de uma variável categórica

Cálculo de proporções

Divisão de um número por outro, onde o numerador está

contido (é subconjunto) no denominador

Exemplo: Desnutrição: sim /não

Em 100 crianças, 20 estão desnutridas (20%)

Page 8: Medidas de tendência central e de dispersão

Frequência absoluta e relativa

Tabela. Distribuição de idosos segundo concentração sanguínea

de vitamina D. São Paulo, 2012.

Concentração de vitamina D no sangue n %

Aceitável 20 40 Insuficiente 30 60 Deficiente 0 0

Total 50 100

Page 9: Medidas de tendência central e de dispersão

Distribuição de frequência

Descrição de uma variável numérica

Tabela que mostra um número de observações ou

valores dentro de certos intervalos

Page 10: Medidas de tendência central e de dispersão

Distribuição de frequência: variável “discreta”

Número de gravidezes das mães da coorte de 2004. Pelotas, RS (n=6000)

Número de gravidez Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

4 544 9,1

5 282 4,7

6 168 2,8

7 105 1,8

8 69 1,2

9 48 0,8

10 39 0,7

11 20 0,3

12 11 0,1

13 8 0,1

Page 11: Medidas de tendência central e de dispersão

Distribuição de frequência: variável “discreta”

Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)

Número de gravidezes Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

≥4 1294 21,6

Page 12: Medidas de tendência central e de dispersão

Distribuição de frequência: variável “contínua”

Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)

Peso ao nascer (gramas) Frequência %

<1000 52 1,1

1000-1499 43 0,9

1500-1999 98 2,2

2000-2499 305 6,7

2500-2999 1112 24,4

3000-3499 1747 38,3

3500-3999 976 21,5

4000 222 4,9

Page 13: Medidas de tendência central e de dispersão

...

... mas para variáveis contínuas queremos descrever

os dados de forma ainda mais sucinta!

Medidas de tendência central

Medidas de posição

Medidas de variabilidade (dispersão)

Page 14: Medidas de tendência central e de dispersão

Descrição de variáveis numéricas

MÉDIA

MEDIANA

MODA

AMPLITUDE

INTERVALO INTERQUARTIL

VARIÂNCIA

DESVIO PADRÃO

TERCIL

QUARTIL

QUINTIL

PERCENTIL

Page 15: Medidas de tendência central e de dispersão

Medidas de tendência central

Média

Moda

Mediana

Page 16: Medidas de tendência central e de dispersão

Medidas de tendência central

Média

É a soma dos valores de uma variável dividido pelo número

de valores

xi: valor de cada indivíduo

∑: somatória

n: total de indivíduos

x

x

n

i

i

n

1 Vantagem:

Utiliza TODOS os

valores da distribuição

Desvantagem:

É influenciada por

valores extremos

Page 17: Medidas de tendência central e de dispersão

1,80

1,70

1,60

1,50

1,90

Média

Altura média = (1,50+1,60+1,70+1,80+1,90)/5 = 1,70 m

Page 18: Medidas de tendência central e de dispersão

Média

É válida quando a distribuição dos dados é simétrica

em torno dos valores da média

153,9

110 134 149 161 165 178 180

141,3

100 110 115 125 134 200 205

Page 19: Medidas de tendência central e de dispersão

Medidas de tendência central

Moda

Valor que mais se repete na amostra (na distribuição)

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Moda: 2

Não tem muita utilidade!!!

Page 20: Medidas de tendência central e de dispersão

Medidas de tendência central

Mediana

Valor que divide a distribuição ao meio

1º passo: ordenar os dados de menor a maior

2º passo: ver qual valor ocupa o “meio” da distribuição

Se...

Número ímpar de dados: valor do meio

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Número par de dados: média dos dois do meio

1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9

Fórmula:

(n + 1)/2

Page 21: Medidas de tendência central e de dispersão

Mediana

1,80

1,70

1,60

1,50

1,90

Quando número de observações (n) for ímpar...

Page 22: Medidas de tendência central e de dispersão

Quando número de observações (n) for par...

Mediana =

= (1,70+1,80)/2 =

= 1,75 metros

Mediana

1,80

1,70

1,60

1,50

1,90

2,00

Page 23: Medidas de tendência central e de dispersão

Média x Mediana

Semelhantes para distribuições simétricas: Peso ao nascer

Média: 3131 g

Mediana: 3180 g

Distantes para distribuições assimétricas: Renda familiar

Média: R$ 791

Mediana: R$ 500

Page 24: Medidas de tendência central e de dispersão

Então...

Qual medida de tendência central usar?

MÉDIA ou MEDIANA?

Page 25: Medidas de tendência central e de dispersão

Mediana x Média: peso ao nascer

Distribuição simétrica

0

50

01

00

01

50

02

00

0

n

1000 2000 3000 4000 5000 6000Peso ao nascer

Média: 3131 gramas; Mediana: 3180 gramas

Média

Page 26: Medidas de tendência central e de dispersão

Mediana x Média: renda familiar

Distribuição assimétrica 0

10

00

20

00

30

00

n

0 5000 10000 15000 20000Renda famil iar (reais)

Média: R$ 791; Mediana: R$ 500

Mediana

Page 27: Medidas de tendência central e de dispersão

Mediana x Média: motilidade espermática

Page 28: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

153,9

110 134 149 161 165 178 180

153,5

98 105 198 213

A média é semelhante, mas a dispersão....

Page 29: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

Várias maneiras de medir a dispersão

Amplitude (maior - menor)

Amplitude interquartil (p75 - p25)

Variância

Desvio padrão

Page 30: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

Amplitude

Valor maior – valor menor

Apenas considera os valores extremos

Ex: 5 medidas de glicemia em mmol/l

80; 85; 88; 90; 500

Amplitude: 500-80=480

Medidas que se distanciam muito das demais influenciam

muito a amplitude

Page 31: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

Amplitude interquartil

Percentil 75 – percentil 25

Considera apenas a parte central dos valores de um

conjunto de dados

Joga fora os valores mais altos e os mais baixos

Não influenciada pelos valores discrepantes

Page 32: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

Variância (S2)

Boas propriedades estatísticas

Usa todas as observações

É uma medida dos “desvios” (ao quadrado) de cada

observação em relação à média

Pq ao quadrado?

Unidade de medida ao quadrado difícil interpretação

Page 33: Medidas de tendência central e de dispersão

Medidas de dispersão (variabilidade)

Desvio padrão (S)

É a raiz quadrada da variância

Quanto mais próximos os valores individuais estiverem de

sua média, < a dispersão e < o desvio-padrão

Muito útil para distribuições dos dados aproximadamente

normais

Page 34: Medidas de tendência central e de dispersão

Medidas de posição

Percentis (dividem os dados em 100 partes iguais)

Percentil 10, percentil 50, percentil 99...

Quartis

Primeiro, segundo, terceiro, quarto quartil

Quintil

Primeiro, segundo, terceiro, quarto, quinto quintil

Page 35: Medidas de tendência central e de dispersão

Percentis de peso ao nascer

. su peson,d

peso ao nascer em gramas

-------------------------------------------------------------

Percentiles Smallest

1% 1950 1100

5% 2340 1490

10% 2570 1550 Obs 962

25% 2870 1570 Sum of Wgt. 962

50% 3180 Mean 3200.639

Largest Std. Dev. 511.0475

75% 3510 4690

90% 3830 4700 Variance 261169.5

95% 4050 4700 Skewness -.1061833

99% 4450 4880 Kurtosis 3.579037

Page 36: Medidas de tendência central e de dispersão

Estatística descritiva

Medidas de ocorrência

• Frequência ou porcentagem

Medidas de tendência central

• Moda

• Média

• Mediana

Medidas de posição

• Quartis, quintis, percentis...

Medidas de dispersão ou variabilidade

• Amplitude

• Variância

• Desvio padrão

Page 37: Medidas de tendência central e de dispersão

Distribuição normal

Ou Gaussiana

Simétrica

Forma de “sino”

É uma distribuição contínua

Descreve bem fenômenos biológicos

5 4 0 0

5 0 0 0

4 6 0 0

4 2 0 0

3 8 0 0

3 4 0 0

3 0 0 0

2 6 0 0

2 2 0 0

1 8 0 0

1 4 0 0

1 0 0 0

6 0 0

1 8

1 6

1 4

1 2

1 0

8

6

4

2

0

S t d . D e v = 5 5 7 . 3 8

M e a n = 3 1 5 2

N = 5 2 5 8 . 0 0

Percentagem

Peso ao nascer

Page 38: Medidas de tendência central e de dispersão

Distribuição normal padrão (propriedades)

1. Qualquer variável com distribuição simétrica

(normal) pode ser relacionada com uma distribuição

normal padrão

Média: zero; DP: 1

Page 39: Medidas de tendência central e de dispersão

... Uso de amostras

O que seria uma amostra? Não é melhor avaliar

toda a população ?

Page 40: Medidas de tendência central e de dispersão

Amostra

Quero conhecer um atributo de uma população (alvo)

Estado nutricional das crianças brasileiras menores de 5 anos

Escolho um grupo para estudar

Crianças menores de 5 anos da cidade de Pelotas

Deste grupo tiro uma amostra

Page 41: Medidas de tendência central e de dispersão

Definição da população

UNIVERSO ou POPULAÇÃO TOTAL

POPULAÇÃO ALVO

AMOSTRA

Page 42: Medidas de tendência central e de dispersão

Amostra: características

1. Representar a população

Equiprobabilidade = representatividade

Todos os indivíduos da população alvo têm a mesma chance de

participar do estudo (de serem sorteados)

POPULAÇÃO ALVO POPULAÇÃO ALVO

Page 43: Medidas de tendência central e de dispersão

Amostra: características

2. Precisão

Amostra de tamanho adequado

Garantir o mínimo de precisão

Garantir a chance de demonstrar uma diferença entre dois

grupos

PODER: probabilidade de encontrar uma diferença quando ela

realmente existe

Quanto maior a amostra, maior o poder

Page 44: Medidas de tendência central e de dispersão

Então, a amostra...

Tem importância pelo que nos conta sobre a

população que representa

A média e o desvio padrão da amostra são usados

para estimar a média e o desvio padrão da

população

s

xamostra

população

Page 45: Medidas de tendência central e de dispersão

Obrigada!

[email protected]