aulas 3 e 4 - medidas de tendência central e de dispersão 1 medidas de tendência central e de...

39
Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo Amplitude de variação Variância Desvio padrão Coeficiente de variação de Pearson Quartis Percentis Box plot Exercícios

Upload: internet

Post on 22-Apr-2015

161 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

1

Medidas de tendência central e de dispersão

•Média aritmética

•Mediana

Valores mínimo e máximo

•Amplitude de variação

•Variância

•Desvio padrão

•Coeficiente de variação de Pearson

•Quartis

•Percentis

•Box plot

•Exercícios

Page 2: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

2

Medidas de tendência central e de dispersão

•Média aritmética

Valores individuais

Valores em distribuição de freqüência

Valores em intervalos de classe

Page 3: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

3

Medidas de tendência central e de dispersão

Notação: X variável

N tamanho da população n tamanho da amostra média populacional (parâmetro, geralmente desconhecido)

X Estatística (fórmula)

x média amostral (estimativa, valor calculado na amostra)

Page 4: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

4

•Média aritmética

Medidas de tendência central e de dispersão

Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

Média = anos85

1212853

Definição: Média aritmética é o valor que indica o centro de equilíbrio de uma distribuição de freqüências de uma variável quantitativa.

Média aritmética - é a soma dos valores de uma variável, dividida pelo número de valores.

Desvios em torno da média:3 – 8 =-5 anos5 – 8 =-3 anos8 – 8 = 0 anos2 – 8 = 4 anos

12 – 8 = 4 anossoma = 0 anos

Page 5: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

5

Medidas de tendência central e de dispersão

•só existe para variáveis quantitativas e seu valor é único;

•é da mesma natureza da variável considerada (média = 8 anos); e

•sofre influência dos valores aberrantes (3, 5, 8, 12, 42; média = 14 anos)

X: idade (anos) 3, 5, 8, 12, 12

x1 = 3; x2 = 5; x3=8; x4=12; x5= 12

xx x x

n

x

nn

ii

n

1 2 1...

Valores individuais

•Média aritmética

Page 6: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

6

Medidas de tendência central e de dispersão

Os dados a seguir são provenientes do grupo Western Collaborative Group Study, Califórnia (1960-61). Foram estudados 3154 homens de meia idade para investigar a relação entre padrões de comportamento e risco de doença coronariana.

Os dados apresentados são de 40 homens para os quais foram medidos os níveis de colesterol (mg por 100ml) e realizada uma categorização segundo comportamento.

O comportamento de tipo A é caracterizado pela urgência, agressividade e ambição. O de tipo B é relaxado, não competitivo e menos preocupado.

Tipo A: nível de colesterol

233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325

mlmgxA 100/05,24520

325212...291233

•Média aritmética

Page 7: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

7

Medidas de tendência central e de dispersão

•Média aritmética

Tipo B: nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213

mlmgxB 100/3,21020

213169...226344

Page 8: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

8

Medidas de tendência central e de dispersão

•Média aritmética - Valores em distribuição de freqüências

grupo A Colesterol (X) fi xifi

181 1 181 197 1 197 202 1 202 212 1 212 218 1 218 224 1 224 233 1 233 234 1 234 239 2 478 246 1 246 248 1 248 250 1 250 252 1 252 254 1 254 268 1 268 276 1 276 291 1 291 312 1 312 325 1 325

soma 20 4901

05,24520

4901x

n

fx

x

k

i

ii 1

mg/100ml

i representa o i-ésimo valor da variável

Page 9: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

9

Medidas de tendência central e de dispersão

•Média aritmética - valores em intervalos de classe

n

fx

X

k

i

iipm 1

i representa o i-ésimo intervalo

ipmx representa o ponto médio do intervalo,

fi é a freqüência de indivíduos no intervalo i, k é o número de intervalos e n o número de observações

concentração fi ponto médio (xipm) xipmfi 180,0|--200,0 2 190 380 200,0|--220,0 3 210 630 220,0|--240,0 5 230 1150 240,0|--260,0 5 250 1250 260,0|--280,0 2 270 540 280,0|--300,0 1 290 290 300,0|--320,0 1 310 310 320,0|--340,0 1 330 330

total 20 4880

mlmgx 100/0,244

20

4880

Page 10: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

10

Medidas de tendência central e de dispersão

Mediana (Med)

É o valor que ocupa a posição central de uma série de n observações, quando estas estão ordenadas de forma crescente ou decrescente.

a) valores individuais Quando número de observações (n) for ímpar:

a mediana é o valor da variável que ocupa o posto n 1

2

Quando o número de observações (n) for par:

a mediana é a média aritmética dos valores da variável que ocupam os

postos n

2 e n 2

2

Page 11: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

11

Medidas de tendência central e de dispersão

Mediana (Med)

Exemplo: Tipo A: nível de colesterol

233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325

Ordenando-se os valores:

181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325

Mediana = mlmg 100/5,2422

246239

Page 12: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

12

Medidas de tendência central e de dispersão

Mediana (Med)

Valores em distribuição de freqüência pontual

Colesterol (X) fi facumulada

181 1 1

197 1 2

202 1 3

212 1 4

218 1 5

224 1 6

233 1 7

234 1 8

239 2 10

246 1 11

248 1

250 1

252 1

254 1

268 1

276 1

291 1

312 1

325 1

Total 20

Mediana = mlmg 100/5,2422

246239

Page 13: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

13

Medidas de tendência central e de dispersão

Mediana (Med)

Valores em intervalos de classe

Nível de Colesterol (mg/100ml) (xi) fi facumulada 180|--200 2 2 200|--250 10 12 250|--300 6 300|--350 2

Total 20

Como são 20 observações, a mediana estará na posição 10 (20/2), a mediana está na classe de 200|-- 250 mg/100ml

10 observações -------50 mg/100ml 8 observações ------- x

4010

508

xx

Mediana = valor inicial do intervalo + 40 = 240 mg/100ml

Descobrindo o valor da variável que está na posição 10:

Page 14: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

14

Medidas de tendência central e de dispersão

Mediana (Med) Valores em intervalos de classe

anaclassemedi

oracumanteri

i f

fn

aLMed

2

Li é o limite inferior da classe que contém a mediana

a é a amplitude da classe que contém a mediana

oracumanterif é a freqüência acumulada até a classe anterior à classe que contém a mediana

anaclassemedif é a freqüência da classe que contém a mediana

mlmgMed 100/2404020010

22

20

50200

Page 15: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

15

Medidas de tendência central e de dispersão

OBS: existe para variável quantitativa e qualitativa ordinal; é da mesma natureza da variável considerada; torna-se inadequada quando há muitos valores repetidos; não sofre influência de valores aberrantes;

EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8 Média aritmética: 8,43 pmol/l; Mediana: 7,2 pmol/l

4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8 Média aritmética: 10,25 pmol/l; Mediana: 7,2 pmol/l

pode ser calculada mesmo quando os dados estão agrupados em intervalos

de classe e os extremos de algum intervalo não esteja definido (a não ser que a mediana caia neste intervalo).

Mediana (Med)

Page 16: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

16

Medidas de dispersão Valores mínimo e máximo: valores extremos da distribuição Amplitude de variação: é a diferença entre os 2 valores extremos da distribuição Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variação = 17-2 = 15 Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variação = 15

Medidas de tendência central e de dispersão

Page 17: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

17

Medidas de tendência central e de dispersão

Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

Média = anos85

1212853

Desvios em torno da média: 3 – 8 =-5 anos 5 – 8 =-3 anos 8 – 8 = 0 anos 12 – 8 = 4 anos 12 – 8 = 4 anos soma = 0 anos

Desvios quadráticos em torno da média: (3 – 8)2 =(-5 anos)2 = 25 anos2 (5 – 8)2 =(-3 anos)2 = 9 anos2 (8 – 8)2 = (0 anos)2= 0 anos2 (12 – 8)2= (4 anos)2= 16 anos2 (12 – 8)2= (4 anos)2 = 16anos2 soma dos desvios quadráticos em torno da média = 66 anos2

Variância e desvio padrão

Page 18: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

18

Variância e desvio padrão

Medidas de tendência central e de dispersão

Variância = soma dos desvios quadráticos em torno da média/número de observações

Variância = 22,135

66anos

Desvio padrão: é a raiz quadrada da variância , ou seja

2

2S S

Desvio padrão = anosanos 63,32,13 2

Page 19: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

19

Medidas de tendência central e de dispersão

Valores individuais:

Variância populacional: N

XXN

ii

1

2

2

)(

Variância amostral: 1

)(1

2

2

n

xxS

n

ii

Page 20: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

20

Medidas de tendência central e de dispersão

Exemplo: Tipo A: nível de colesterol

233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325

Variância: 222

2 )100/(37,134219

)05,245325(...)05,245233(mlmgs

Desvio padrão mlmgs 100/64,3637,1342

Tipo B: nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213

Variância: 222

2 )100/(747,233619

)3,210213(...)3,210344(mlmgs

Desvio padrão mlmgs 100/34,48747,2336

Page 21: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

21

Medidas de tendência central e de dispersãoValores em distribuição de freqüências

Variância amostral: 1

)(1

2

2

n

fxxS

n

iii

Tipo A: Nível de Colesterol

(mg/100ml) (xi)

fi xifi 2)( xxi ii fxx 2)(

181 1 181 4102,40 4102,40 197 1 197 2308,80 2308,80 202 1 202 1853,30 1853,30 212 1 212 1092,30 1092,30 218 1 218 731,70 731,70 224 1 224 443,10 443,10 233 1 233 145,20 145,20 234 1 234 122,10 122,10 239 2 478 36,60 73,21 246 1 246 0,90 0,90 248 1 248 8,70 8,70 250 1 250 24,50 24,50 252 1 252 48,30 48,30 254 1 254 80,10 80,10 268 1 268 526,70 526,70 276 1 276 957,90 957,90 291 1 291 2111,40 2111,40 312 1 312 4482,30 4482,30 325 1 325 6392,00 6392,00 Total 20 4901 25504,95

22 )100/(37,1342

19

95,25504mlmgsA ; mlmgs A 100/64,3637,1342

Page 22: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

22

Medidas de tendência central e de dispersão

Tipo B: Nível de Colesterol (mg/100ml) (xi) fi xifi 2)( xxi ii xfxx 2)(

137 1 137 5372,89 5372,89 148 1 148 3881,29 3881,29 153 1 153 3283,29 3283,29 169 1 169 1705,69 1705,69 175 1 175 1246,09 1246,09 183 1 183 745,29 745,29 185 1 185 640,09 640,09 188 1 188 497,29 497,29 194 1 194 265,69 265,69 202 1 202 68,89 68,89 212 1 212 2,89 2,89 213 1 213 7,29 7,29 224 1 224 187,69 187,69 226 1 226 246,49 246,49 242 1 242 1004,89 1004,89 246 1 246 1274,49 1274,49 250 1 250 1576,09 1576,09 252 1 252 1738,89 1738,89 263 1 263 2777,29 2777,29 344 1 344 17875,69 17875,69 Total 20 4206 44398,2

22 )100/(747,233619

2,44398mlmgsB ; mlmgsB 100/34,48747,2336

Page 23: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

23

Medidas de tendência central e de dispersão

Valores em intervalos de classe

Variância amostral: 1

)(1

2

2

n

fxx

S

n

iiipm

Nível de Colesterol (mg/100ml) (xi)

fi xi ponto médio (xipm)

xipmfi 2)( xxipm iipm fxx 2)(

180|--200 2 190 380 3192,25 6384,5 200|--250 10 225 2250 462,25 4622,5 250|--300 6 275 1650 812,25 4873,5 300|--350 2 325 650 6162,25 12324,5

Total 20 4930 28205,0

mlmgxx

xA 100/5,24620

4930

20

2325...0155

22 )100/(47,148419

0,28205mlmgsA ; mlmgs A 100/53,3847,1484

Page 24: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

24

Medidas de tendência central e de dispersão

Tipo B

Nível de Colesterol

(mg/100ml) (xi)

fi xi ponto médio (xipm)

xipmfi 2)( xxipm iipm fxx 2)(

130|--180 5 155 775 3364 16820 180|--200 4 190 760 529 2116 200|--250 7 225 1575 144 1008 250|--300 3 275 825 3844 11532 300|--350 1 325 325 12544 12544

Total 20 4260 44020

mlmgxx

xB 100/0,21320

4260

20

1325...5155

22 )100/(84,2316

19

44020mlmgsA ; mlmgs A 100/13,4884,2316

Page 25: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

25

Medidas de tendência central e de dispersão

Coeficiente de Variação de Pearson (CV):

é o quociente entre o desvio padrão e a média, ou seja 100x

S=CV x

CVtipo A: %0,1510005,245

64,36x ; CVtipoB: %0,23100

3,210

34,48x ;

Questão 13 São fornecidos valores de nível de triglicérides (mg/dL) de 9 pessoas 166 158 202 166 135 86 150 86 121

Calcule, apresentando o desenvolvimento da fórmula:

a) o nível médio de triglicérides; b) o nível mediano de triglicérides; c) o desvio padrão do nível de triglicérides e d) o coeficiente de variação do nível de triglicérides.

Page 26: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

26

Medidas de tendência central e de dispersão

Questão 14 A tabela abaixo foi extraída do artigo: Diagnóstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critérios para o Índice de Massa Corporal de MONTEIRO POA et al. (Rev. Saúde Pública, 2000;.34(5):506-13). Discuta os resultados obtidos ignorando a coluna do valor de p (este tópico será abordado na disciplina Bioestatística II).

Page 27: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

27

Medidas de tendência central e de dispersão

A tabela abaixo foi extraída do artigo: Avaliação da capacidade preditiva da circunferência da cintura para obesidade global e hipertensão arterial em mulheres residentes na Região Metropolitana de Belo Horizonte, Brasil de VELASQUEZ-MELENDEZ G et al. (Cad. Saúde Pública, 2002; 18(3): 765-771). Calcule e interprete os coeficientes de variação de Pearson para cada uma das variáveis apresentadas.

Page 28: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

28

Medidas de tendência central e de dispersão

Quartil Valores da variável que dividem a distribuição em quatro partes iguais. ¼ ½ ¾

25% 25% 25% 25% Q1: deixa abaixo 25% das observações

25% 75% Q2: deixa abaixo 50% das observações

50% 50% Q3: deixa abaixo 75% das observações

75% 25%

Primeiro quartil: ))1(

4

1(

1

n

xQ ; Terceiro quartil: ))1(

4

3(

3

n

xQ

onde x é o valor da variável e ))1(4

1( n e ))1(

4

3( n são índices que

representam as posições ocupadas por x.

Page 29: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

29

Medidas de tendência central e de dispersão

1.030* 1.310* 2.200* 1.680 2.550 1.050* 1.500* 2.270* 1.715 2.570 1.100* 1.550* 2.275* 1.720 2.600 1.175* 1.600* 2.440* 1.760 2.700 1.185* 1.720* 2.500* 1.930 2.830 1.225* 1.750* 2.560* 2.015 2.950 1.230* 1.770* 2.730* 2.040 3.005 1.262* 1.820* 1.130 2.090 3.160 1.295* 1.890* 1.410 2.200 3.400 1.300* 1.940* 1.575 2.400 3.640

Entre os recém-nascidos que sobreviveram: gxxQ 17201 6

))123(4

1(

gxxQ 28303 18))123(

4

3(

Observe que gxxQ 22002 12))123(

2

1(

Entre os recém-nascidos que foram a óbito gxxQ 12301 7

))127(4

1(

gxxQ 22003 21))127(

4

3(

e gxxQ 16002 14))127(

2

1(

Page 30: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

30

Medidas de tendência central e de dispersão

Supor o exemplo com 22 observações: n=22

)

4

35()

4

23())122(

4

1(

1 xxxQ

que é ¾ do caminho entre x5=1715 e x6=1720

gQ 8,1718)17151720(4

317151

)4

117())122(

4

3(

3 xxQ

que é ¼ do caminho entre x17=2700 e x18=2830

gQ 5,2732)27002830(4

127003

Page 31: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

31

Medidas de tendência central e de dispersão

Percentil Valores da variável que dividem a distribuição em cem partes iguais. Entre os recém-nascidos que sobreviveram Percentil 5:

)

5

11()

100

120())123(

100

5(

5 xxxP

gP 1186)11301410(5

111305

que é 1/5 do caminho entre x1=1130 e x2=1410

Percentil 10:

)5

22()

100

240())123(

100

10(

10 xxxP

; gP 1476)14101575(5

2141010

Percentil 50:

)12()

100

1200())123(

100

50(

50 xxxP

; gP 220050

Percentil 75:

)18()

100

1800())123(

100

75(

75 xxxP

; gP 283075

Percentil 90:

)5

321()

100

2160())123(

100

90(

90 xxxP

; gP 3304)31603400(5

3316090

Page 32: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

32

Medidas de tendência central e de dispersão

Box plot e identificação de valores aberrantes (outliers) O Box plot representa graficamente dados de forma resumida em um retângulo onde as linhas da base e do topo são o primeiro e o terceiro quartis, respectivamente. A linha entre estas é a mediana. Linhas verticais que iniciam no meio da base e do topo do retângulo, terminam em valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60). O valor adjacente superior é o maior valor das observações que é menor ou igual a Q3+1,5(Q3-Q1) e o valor adjacente inferior é definido como o menor valor que é maior ou igual a Q1-1,5(Q3-Q1), sendo a diferença Q3-Q1 denominada intervalo inter-quartil (IIQ). Valores outliers (discrepantes ou aberrantes) são valores que “fogem” da distribuição dos dados. O box plot além de apresentar a dispersão dos dados torna-se útil também para identificar a ocorrência destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior.

120 140 160 180 200 220 240 260 280 300 320 340 360 380

colesterol

A B

Page 33: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

33

Tipo A: nível de colesterol 181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325

Tipo A: n=20;

5,2195,1218)218224(4

12181

4

15

4

21)1(

4

1

xxxQn

5,2645,10254)254268(4

32543

4

315)21(

4

3)1(

4

3

xxxQn

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332, onde 332 é dado por: 332455,15,264 x .

181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde 152 é dado por: 152455,15,219 x .

Box plot

Page 34: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

34

Tipo B n=20

1772175)175183(4

11751

4

15

4

21)1(

4

1

xxxQn

2453242)242246(4

32423

4

315)21(

4

3)1(

4

3

xxxQn

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347, onde 347 é dado por: 347685,1245 x .

137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75 é dado por: 75685,1177 x .

Box plot

Page 35: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

35

Box plot

Tipo A: n=20;

5,2195,1218)218224(4

12181

4

15

4

21)1(

4

1

xxxQn

5,2645,10254)254268(4

32543

4

315)21(

4

3)1(

4

3

xxxQn

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332, onde 332 é dado por: 332455,15,264 x .

181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde 152 é dado por: 152455,15,219 x .

Tipo B n=20

1772175)175183(4

11751

4

15

4

21)1(

4

1

xxxQn

2453242)242246(4

32423

4

315)21(

4

3)1(

4

3

xxxQn

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347, onde 347 é dado por: 347685,1245 x .

137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75 é dado por: 75685,1177 x .

Page 36: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

36

Validade de Curso de capacitação em medida da Altura uterina para enfermeiros e graduandos de Enfermagem. Camila C A Paiva; Djacyr MC Freire. Ver Bras Enferm, Brasilia 2012, set-out;65(5):775-9

Page 37: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

37

Box plot

Questão 16 Os dados a seguir são de uma pesquisa que investigou as concentrações de minerais no leite materno, no período de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em período de lactação: colostro e leite maduro. cálcio (g/mL de leite) – grupo colostro

113 181 254 311 334 145 221 256 312 344 163 225 275 313 372 163 231 296 323 375 167 241 303 325 375 437

cálcio (g/mL de leite) – grupo maduro 159 175 181 188 200 206 213 214 217 231 238 238 242 244 256 259 260 263 264 275 277 279 281 293 302 303 314 344 394

a) Calcule a quantidade média de cálcio (g/mL de leite) em cada grupo. b) Calcule a quantidade mediana de cálcio (g/mL de leite) em cada grupo. c) Desenhe o box plot da concentração de cálcio (g/mL de leite) representando os dois grupos em um só gráfico. d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e igualdade de medianas.

Page 38: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

38

Questão 16

Grupo colostro: n=26 (par) Mediana é a media dos valores que ocupam os postos 13 e

14. mLgMed /5,2852

296275

Grupo colostro: mLgn

xx i

i

/35,27126

7055

26

1

Grupo maduro: mLgn

xx i

i

/07,25229

7310

26

1

Grupo maduro: n=29 (ímpar); a mediana é o valor da variável que ocupa o posto 15. Med= 256 g/mL

Page 39: Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão Média aritmética Mediana Valores mínimo e máximo

Aulas 3 e 4 - Medidas de tendência central e de dispersão

39

Questão 16

Medida Grupo colostro Grupo maduro Q1 211 213,5 Q2 285,5 256 Q3 327,25 280 Valor adjacente inferior 113 159 Valor adjacente superior 437 344

valor adjacente superior: maior valor abaixo de Q3+1,5x(IIQ) Valor adjacente inferior: Menor valor acima de Q1-1,5x(IIQ)

“Box plot” da variável concentração de cálcio (g/mL) segundo grupo de leite (colostro e maduro)

100

150

200

250

300

350

400

450

500

var1

grupo colostro grupo maduro