estatística descritiva - blogdoprofpc.files.wordpress.com · capítulo02) estascadescriva!...

86
Estatística Descritiva Prof. Paulo Cesar F. de Oliveira, BSc, PhD 15/08/13 1 © P C F de Oliveira 2013

Upload: phamdung

Post on 07-Dec-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Estatística Descritiva

Prof. Paulo Cesar F. de Oliveira, BSc, PhD

15/08/13 1 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va  

15/08/13 2 © P C F de Oliveira 2013

Seção  2.3   Medidas  de  Tendência  Central  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  Ø São  valores  de  um  conjunto  de  dados  que  representam  uma  entrada  4pica,  ou  central  

Ø Mais  usadas  Ø Média  Ø Mediana  Ø Moda    

15/08/13 3 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  

Ø Média  Ø Soma  de  todas  as  entradas  de  dados  dividida  pelo  número  de  entradas  

Ø Notação  sigma:  Σx = somar  todas  as  entradas  de  dados  (x)  no  conjunto  de  dados.

Ø Média  da  População  

Ø Média  da  Amostra        

15/08/13 4 © P C F de Oliveira 2013

µ =x∑

N

x =x∑

n

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Média  

Ø Os  preços  (em  dólares)  para  uma  amostra  de  vôos  entre  Chicago  e  Cancun  são  listados  abaixo.  Qual  é  a  média  de  preço  dos  vôos?  

872       432      397      427      388      782      397  

 

15/08/13 5 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø A  soma  dos  preços  dos  vôos  é   Σx  =  872  +  432  +  397  +  427  +  388  +  782  +  397  =  3695  Ø Para  encontrar  o  preço  médio  divida  a  soma  dos  preços  

pelo  número  de  preços  na  amostra  

 

15/08/13 6 © P C F de Oliveira 2013

872      432      397      427      388      782      397

x =x∑

n= 3695

7= 527,9

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  Ø Mediana  

Ø O  valor  que  está  no  meio  dos  dados  quando  o  conjunto  dos  dados  é  ordenado  

Ø Mede  o  centro  de  um  conjunto  de  dados  ordenado  dividindo-­‐o  em  duas  partes  iguais  

Ø Se  o  conjunto  de  dados  possui  um  número  de  entradas:  Ø  ímpar:  a  mediana  é  o  elemento  do  meio  Ø  par:  a  mediana  será  a  média  dos  dois  elementos  centrais  

15/08/13 7 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Mediana  

Ø Os  preços  (em  dólares)  para  uma  amostra  de  vôos  entre  Chicago  e  Cancun  são  listados  abaixo.  Qual  é  a  mediana  dos  preços  dos  vôos?  

 

15/08/13 8 © P C F de Oliveira 2013

872      432      397      427      388      782      397

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Ordene  os  dados  primeiro                        388      397      397      427      432      782      872  

Ø Existem  7  entradas  (número  impar),  portanto,  a  mediana  é  o  valor  do  meio,  ou  a  quarta  entrada  de  dados  

 

15/08/13 9 © P C F de Oliveira 2013

872      432      397      427      388      782      397

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Mediana  

Ø O  preço  de  $432  não  está  mais  disponível.  Qual  é  a  mediana  dos  preços  dos  vôos  restantes?  

   

15/08/13 10 © P C F de Oliveira 2013

872        397      427      388      782      397

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Ordene  os  dados  primeiro                        388      397      397      427      782      872  

Ø Existem  6  entradas  (número  par),  portanto,  a  mediana  é  média  das  duas  entradas  do  meio.  

 

15/08/13 11 © P C F de Oliveira 2013

872      397      427      388      782      397

med = 397 + 4272

= 8242

= 412

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  

Ø Moda  Ø Entrada  de  dados  que  ocorre  com  mais  frequência  Ø Se  nenhuma  entrada  é  repe\da,  o  conjunto  de  dados  não  possui  moda  

Ø Se  duas  entradas  ocorrem  com  a  mesma  frequência  elevada,  cada  é  uma  moda  e  são  chamados  de  bimodais.  

15/08/13 12 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Moda  

Ø Os  preços  (em  dólares)  para  uma  amostra  de  vôos  entre  Chicago  e  Cancun  são  listados  abaixo.  Qual  é  a  moda  dos  preços  dos  vôos?  

 

15/08/13 13 © P C F de Oliveira 2013

872      432      397      427      388      782      397

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Ordene  os  dados  primeiro                        388      397      397      427      432      782      872  

Ø A  entrada  397  ocorre  duas  vezes,  enquanto  que  as  outras  ocorrem  apenas  uma  vez.  

Ø Portanto  a  moda  dos  preços  dos  vôos  é  de  $397  

 

15/08/13 14 © P C F de Oliveira 2013

872      432      397      427      388      782      397

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Moda  

Ø Em  um  debate  polí\co,  pediu-­‐se  que  uma  amostra  dos  membros  do  público  citasse  o  par\do  ao  qual  eles  pertenciam.  As  respostas  estão  resumidas  na  tabela  a  seguir.  Qual  é  a  moda  das  respostas?  

 

15/08/13 15 © P C F de Oliveira 2013

Par\do  Polí\co   Frequência,  f  Democrata   34  Republicano   56  Outro   21  Não  responderam   9  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

 

15/08/13 16 © P C F de Oliveira 2013

Par\do  Polí\co   Frequência,  f  Democrata   34  Republicano   56  Outro   21  Não  responderam   9  

A  resposta  que  ocorre  com  mais  frequência  é  “Republicano”.  Desta  forma  a  moda  é  “Republicano”.  Isto  significa  que,  nessa  amostra,  há  mais  republicanos  do  que  pessoas  de  qualquer  outra  agremiação  polí\ca.  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  

Ø Comparando  a  Média,  Mediana  e  a  Moda  Ø Todas  as  3  medidas  descrevem  uma  entrada  4pica  de  um  conjunto  de  dados  

Ø Vantagem  de  usar  a  média  Ø É  a  medida  mais  confiável  porque  leva  em  conta  todas  as  entradas  do  conjunto  

Ø Desvantagem  de  usar  a  média  Ø Muito  afetada  por  dados  discrepantes  (outliers)  Ø Um  dado  discrepante  é  aquele  que  está  muito  afastado  dos  outros  dados  do  conjunto.  

15/08/13 17 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  –  Comparando  as  3  medidas  

Ø Encontre  a  média,  a  mediana  e  a  moda  da  seguinte  amostra  de  idades  de  uma  classe.  Qual  é  a  medida  de  tendência  central  que  melhor  descreve  uma  entrada  de  dados?  Existe  algum  dado  estranho?  

 

15/08/13 18 © P C F de Oliveira 2013

Idades  em  uma  classe  

20   20   20   20   20   20   21  

21   21   21   22   22   22   23  

23   23   23   24   24   65  Dado  discrepante  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Média  

Ø Mediana  

Ø Moda  

 

15/08/13 19 © P C F de Oliveira 2013

Idades  em  uma  classe  

20   20   20   20   20   20   21  

21   21   21   22   22   22   23  

23   23   23   24   24   65  

x =x∑

n= 47520

= 23,75anos

Med = 21+ 222

= 21,5anos

Moda = 20anos

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  –  Comparando  resultados  

Ø A  média  leva  em  conta  todas  as  entradas,  mas  é  influenciada  pelo  dado  estranho  de  65  

Ø A  mediana  também  leva  em  conta  todas  as  entradas,  mas  não  é  afetada  pelo  dado  estranho  

Ø Neste  caso  a  moda  existe,  mas  não  parece  representar  uma  entrada  4pica  

 15/08/13 20 © P C F de Oliveira 2013

Média  ≈  23,8  anos          Mediana  =  21,5  anos              Moda  =    20  anos  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  –  Comparando  resultados  

Ø Às  vezes  uma  comparação  gráfica  pode  ajudar  na  sua  decisão  sobre  qual  medida  de  tendência  central  melhor  representa  um  conjunto  de  dados  

 

15/08/13 21 © P C F de Oliveira 2013

Nesse  caso,  parece  que  a  mediana  é  a  que  melhor  descreve  o  conjunto  de  dados.  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  

Ø Média  Ponderada  Ø Média  de  um  conjunto  de  dados  cujas  entradas  têm  pesos  variáveis.  

   

15/08/13 22 © P C F de Oliveira 2013

x =x ⋅ w( )∑

w∑Onde:  w  é  o  peso  de  cada  entrada  de  x

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Você  está  assis\ndo  a  um  curso  no  qual  sua  nota  é  determinada  a  par\r  de  cinco  fontes:  50%  da  média  de  seus  testes,  15%  de  seu  exame  no  meio  do  curso,  20%  de  seu  exame  final,  10%  de  seu  trabalho  no  laboratório  de  informá\ca  e  5%  do  seu  trabalho  feito  em  casa.  As  suas  notas  são  86  (média  dos  testes),  96  (exame  no  meio  do  curso),  82  (exame  final),  98  (laboratório  de  informá\ca)  e  100  (trabalho  de  casa).  Qual  é  a  média  ponderada  de  suas  notas?  

 15/08/13 23 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

 

15/08/13 24 © P C F de Oliveira 2013

Fonte   Notas,  x Pesos,  w x·w Média  dos  Testes   86   0,50   86x0,50=  43,0  Exame  do  Meio   96   0,15   96x0,15  =  14,4  Exame  Final   82   0,20   82x0,20  =  16,4  Laboratório  de  Informá\ca   98   0,10   98x0,10  =  9,8  Trabalho  de  casa   100   0,05   100x0,05  =  5,0  

Σw = 1 Σ(x·w)  =  88,6  

x =x ⋅ w( )∑

w∑= 88,6

1= 88,6

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Tendência  Central  

Ø Média  de  Dados  Agrupados  Ø Média  de  uma  Distribuição  de  Freqüência        

15/08/13 25 © P C F de Oliveira 2013

x =x ⋅ f( )∑n

Onde:  x e f  são  respec\vamente  os  pontos  médios  e  as  frequências  de  uma  classe �

n = f∑Observe  que:  

Capítulo  02  Esta.s/ca  Descri/va   Ø Média  de  uma  Distribuição  de  Freqüência  

     

15/08/13 26 © P C F de Oliveira 2013

Em  Palavras                                Em  Símbolos  1. Calcule  o  ponto  médio  de  cada  classe.  

2. Calcule  a  soma  dos  produtos  entre  os  pontos  médios  e  as  freqüências.  

3. Calcule  a  soma  das  freqüências.  

4. Calcule  a  média  da  distribuição  de  freqüência.  

x =x ⋅ f( )∑n

n = f∑�

x =lim inf( ) + lim sup( )

2

x ⋅ f( )∑

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Use  a  distribuição  de  freqüência  ao  lado  para  aproximar  a  média  do  número  de  minutos  que  uma  amostra  de  internautas  gastou  durante  sua  navegação  mais  recente  na  rede.  

 

15/08/13 27 © P C F de Oliveira 2013

Classe   Ponto  Médio  

Frequência,  f  

 7  –  18   12,5   6  19  –  30   24,5   10  31  –  42   36,5   13  43  –  54   48,5   8  55  –  66   60,5   5  67  –  78   72,5   6  79  –  90   84,5   2  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

 

15/08/13 28 © P C F de Oliveira 2013

Classe   Ponto  Médio,  x

Freqüência,  f (x·f)  

   7  –  18   12,5   6   12,5x6  =  75,0  19  –  30   24,5   10   24,5x10  =  245,0  31  –  42   36,5   13   36,5x13  =  474,5  43  –  54   48,5   8   48,5x8  =  388,0  55  –  66   60,5   5   60,5x5  =  302,5  67  –  78   72,5   6   72,5x6  =  435,0  79  –  90   84,5   2   84,5x2  =  169,0  

n  = 50 Σ(x·f)  =  2089,0  

x =x ⋅ f( )∑n

x = 208950

≈ 41,8

Capítulo  02  Esta.s/ca  Descri/va   Ø Aspecto  das  Distribuições  

Ø Um  gráfico  revela  várias  caracterís\cas  de  uma  distribuição  de  freqüência.  Uma  delas  é  o  aspecto.  Ø Simétrica  quando  pode-­‐se  traçar  uma  linha  ver\cal  pelo  ponto  médio  do  gráfico  de  distribuição  e  as  duas  metades  resultantes  forem  aproximadamente  imagens  espelhadas  

Ø Uniforme  (retangular)  quando  todas  as  entradas,  ou  classes,  na  distribuição  \verem  frequências  iguais.  Ela  também  é  simétrica.  

Ø Assimétrica  se  a  “cauda”  do  gráfico  se  prolongar  mais  de  um  lado  do  que  o  outro.    Ø Uma  distribuição  será  assimétrica  à  esquerda  se  a  sua  cauda  se  

prolongar  para  a  esquerda.  Ø Uma  distribuição  será  assimétrica  à  direita  se  sua  cauda  se  prolongar  

para  a  direita.      15/08/13 29 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Aspecto  das  Distribuições  

   

15/08/13 30 © P C F de Oliveira 2013

Uma  linha  ver\cal  pode  ser  desenhada  no  meio  do  gráfico  de  distribuição  e  as  metades  resultantes  se  parecem  com  imagens  espelhadas         Média    =    Mediana  =  Moda  

Capítulo  02  Esta.s/ca  Descri/va  

15/08/13 31 © P C F de Oliveira 2013

Média      =    Mediana  

 Todas  as  entradas  na  distribuição  têm  frequências  iguais  ou  quase  iguais    

Capítulo  02  Esta.s/ca  Descri/va   Ø Aspecto  das  Distribuições  

   

15/08/13 32 © P C F de Oliveira 2013

Ø Assimétrica  nega\vamente  

Ø A  cauda  do  gráfico  alonga-­‐se  mais  à  esquerda  

Ø A  média  fica  à  esquerda  da  mediana  

 Média  <  Mediana  

Capítulo  02  Esta.s/ca  Descri/va   Ø Aspecto  das  Distribuições  

   

15/08/13 33 © P C F de Oliveira 2013

Ø A  cauda  do  gráfico  alonga-­‐se  mais  à  direita  

Ø A  média  fica  à  direita  da  mediana  

 

Média  >  Mediana  

Capítulo  02  Esta.s/ca  Descri/va  

15/08/13 34 © P C F de Oliveira 2013

Seção  2.4   Medidas  de  Variação  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  Ø Indicam  o  quanto  os  dados  se  apresentam  dispersos  (espalhados)  em  torno  da  região  central  

Ø Caracterizam,  portanto,  o  grau  de  variação  existente  no  conjunto  de  valores  

Ø Mais  usadas  Ø Amplitude  Total    Ø Desvio-­‐padrão    Ø Variância      

15/08/13 35 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  Ø Amplitude  Total  

Ø É  a  diferença  entre  as  entradas  máxima  e  a  mínima  do  conjunto.  

Ø Os  dados  devem  ser  quan\ta\vos            Amplitude Total = (entrada máxima) – (entrada mínima)

   

15/08/13 36 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Uma  empresa  contratou  10  pessoas  com  curso  superior.    O  salário  inicial  dessas  pessoas  é  mostrado  a  seguir.  

   Salário  inicial  (em  milhares  de  dólares)    41      38      39      45      47      41      44      41      37      42  

 

15/08/13 37 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Deve-­‐se  colocar  os  dados  em  ordem  para  determinar  o  menor  e  o  maior  salário  

                 37      38      39      41      41      41      42      44      45      47  

Amplitude Total = salário máx. – salário mín. = 47 – 37 = 10

 

15/08/13 38 © P C F de Oliveira 2013

mínimo   máximo  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Desvio  Ø Diferença  entre  a  entrada  e  a  média  do  conjunto  de  dados.  

Ø Conjunto  de  dados  de  uma  população   Desvio de x = x – µ  

Ø Conjunto  de  dados  de  uma  amostra   Desvio de x = x – x

   15/08/13 39 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Uma  empresa  contratou  10  pessoas  com  curso  superior.    O  salário  inicial  dessas  pessoas  é  mostrado  a  seguir.  

   Salário  inicial  (em  milhares  de  dólares)    41      38      39      45      47      41      44      41      37      42  

 

15/08/13 40 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Calcula-­‐se  primeiramente  o  salário  médio  inicial  

Ø Depois  calcula-­‐se  o  desvio  para  cada  entrada  de  dados  

 15/08/13 41 © P C F de Oliveira 2013

µ = 41510

= 41,5

Salário,  x Desvio:  x – µ 41   41  –  41,5  =  –0,5  38   38  –  41,5  =  –3,5  39   39  –  41,5  =  –2,5  45   45  –  41,5  =  3,5  47   47  –  41,5  =  5,5  41   41  –  41,5  =  –0,5  44   44  –  41,5  =  2,5  41   41  –  41,5  =  –0,5  37   37  –  41,5  =  –4,5  42   42  –  41,5  =  0,5  

Σx = 415 Σ(x – µ) = 0

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Variância  Populacional  

Ø Desvio  Padrão  Populacional  

   

15/08/13 42 © P C F de Oliveira 2013

σ 2 =x − µ( )2∑N

σ = σ 2 =x − µ( )2∑N

Soma  dos  quadrados,  SSx

Capítulo  02  Esta.s/ca  Descri/va   Ø Obtendo  a  Variância  e  o  Desvio  Padrão  Populacional  Populacional  

     

15/08/13 43 © P C F de Oliveira 2013

Em  Palavras                                Em  Símbolos  

1. Calcule  a  média  do  conjunto  de  dados.  

2. Calcule  o  desvio  de  cada  entrada.  

3. Eleve  cada  desvio  ao  quadrado.  

4. Some  os  resultados  para  obter  a  soma  dos  quadrados.  

SSx = x − µ( )2∑�

x − µ( )2�

µ =x∑

N

x − µ

Capítulo  02  Esta.s/ca  Descri/va   Ø Obtendo  a  Variância  e  o  Desvio  Padrão  Populacional    Populacional    

   

15/08/13 44 © P C F de Oliveira 2013

Em  Palavras                                Em  Símbolos  

5.  Divida  por  N  para  obter  a  variância  populacional.  

6.  Calcule  raiz  quadrada  para  obter  o  desvio  padrão  populacional.  

σ 2 =x − µ( )2∑N

σ =x − µ( )2∑N

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Uma  empresa  contratou  10  pessoas  com  curso  superior.  Os  salários  iniciais  para  cada  um  delas  são  mostrados  abaixo.  Calcule  a  variância  e  o  desvio  padrão  populacional  para  esses  salários.  

   Salário  inicial  (em  milhares  de  dólares)    41      38      39      45      47      41      44      41      37      42  

   

15/08/13 45 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Lembre-­‐se  que:    

Ø Calcule  SSx Ø N =  10

 15/08/13 46 © P C F de Oliveira 2013

µ = 41510

= 41,5

Σ(x – µ) = 0

Salário,  x Desvio:  x – µ Quadrados:  (x – µ)2 41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  38   38  –  41,5  =  –3,5   (–3,5)2  =  12,25  39   39  –  41,5  =  –2,5   (–2,5)2  =  6,25  45   45  –  41,5  =  3,5   (3,5)2  =  12,25  47   47  –  41,5  =  5,5   (5,5)2  =  30,25  41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  44   44  –  41,5  =  2,5   (2,5)2  =  6,25  41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  37   37  –  41,5  =  –4,5   (–4,5)2  =  20,25  42   42  –  41,5  =  0,5   (0,5)2  =  0,25  

SSx= 88,5 �

σ 2 = 88,510

= 8,85

σ = 8,85 ≈ 2,97

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Variância  Amostral  

Ø Desvio  Padrão  Amostral  

   

15/08/13 47 © P C F de Oliveira 2013

s2 =x − x ( )2∑

n −1

s = s2 =x − x ( )2∑

n −1

Soma  dos  quadrados,  SSx

Capítulo  02  Esta.s/ca  Descri/va   Ø Obtendo  a  Variância  e  o  Desvio  Padrão  Amostral  

     

15/08/13 48 © P C F de Oliveira 2013

Em  Palavras                                Em  Símbolos  

1. Calcule  a  média  do  conjunto  de  dados  amostrais.  

2. Calcule  o  desvio  de  cada  entrada.  

3. Eleve  cada  desvio  ao  quadrado.  

4. Some  os  resultados  para  obter  a  soma  dos  quadrados.  

SSx = x − x ( )2∑�

x − x ( )2�

x =x∑

n

x − x

Capítulo  02  Esta.s/ca  Descri/va   Ø Obtendo  a  Variância  e  o  Desvio  Padrão  Amostral  APopulacional    

   

15/08/13 49 © P C F de Oliveira 2013

Em  Palavras                                Em  Símbolos  

5.  Divida  por  n  –  1  para  obter  a  variância  amostral.  

6.  Calcule  raiz  quadrada  para  obter  o  desvio  padrão  amostral.  

s2 =x − x ( )2∑

n −1

s =x − x ( )2∑

n −1

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Os  salários  iniciais  abaixo  são  para  as  filiais  de  Chicago  de  uma  grande  empresa.  Esta  empresa  possui  outras  filiais  e  você  planeja  usar  esses  salários  para  es\mar  os  salários  iniciais  de  uma  população  maior.  Calcule  o  desvio  padrão  amostral.    

   Salário  inicial  (em  milhares  de  dólares)    41      38      39      45      47      41      44      41      37      42  

   

15/08/13 50 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Lembre-­‐se  que:    

Ø Calcule  SSx Ø n =  10

 15/08/13 51 © P C F de Oliveira 2013

x = 41510

= 41,5

Σ(x – x) = 0

Salário,  x Desvio:  x – x Quadrados:  (x – x)2 41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  38   38  –  41,5  =  –3,5   (–3,5)2  =  12,25  39   39  –  41,5  =  –2,5   (–2,5)2  =  6,25  45   45  –  41,5  =  3,5   (3,5)2  =  12,25  47   47  –  41,5  =  5,5   (5,5)2  =  30,25  41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  44   44  –  41,5  =  2,5   (2,5)2  =  6,25  41   41  –  41,5  =  –0,5   (–0,5)2  =  0,25  37   37  –  41,5  =  –4,5   (–4,5)2  =  20,25  42   42  –  41,5  =  0,5   (0,5)2  =  0,25  

SSx= 88,5 �

s2 = 88,510 −1

≈ 9,83

s = 9,83 ≈ 3,14

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Interpretando  o  Desvio  Padrão  Ø Desvio  Padrão  mede  o  quanto  uma  entrada  4pica  se  desvia  da  média  

Ø Quanto  mais  espalhadas  as  entradas  estão,  maior  será  o  desvio  padrão.  

     

15/08/13 52 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Interpretando  o  Desvio  Padrão  Ø Vários  conjuntos  de  dados  da  vida  real  têm  distribuições  com  a  forma  aproximada  de  um  sino.  

Ø Existe  para  isto  uma  regra  empírica  para  ajudar  a  ver  o  desvio  padrão  como  medida  de  variação  Ø Cerca  de  68%  dos  dados  estão  dentro  de  1  desvio  padrão  da  média  

Ø Cerca  de  95%  dos  dados  estão  dentro  de  2  desvios  padrão  da  média  

Ø Cerca  de  99,7%  dos  dados  estão  dentro  de  3  desvios  padrão  da  média    

       

15/08/13 53 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Interpretando  o  Desvio  Padrão  –  Regra  Empírica  

       

15/08/13 54 © P C F de Oliveira 2013

x

68%  dentro  de  1  desvio  padrão  

34%   34%  

99,7%  dentro  de  3  desvios  padrão  

2,35%   2,35%  

95%  dentro  de  2  desvios  padrão  

13,5%   13,5%  

x − 3s

x − 2s

x − s

x + s

x + 2s

x + 3s

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Em  um  levantamento  conduzido  pelo  Na\onal  Center  for  Health  Sta\s\cs  (Centro  Nacional  de  Esta4s\ca  da  Saúde),  a  média  da  amostra  de  alturas  de  mulheres  nos  Estados  Unidos  com  idade  entre  20  e  29  anos  foi  de  64  polegadas,  com  desvio  padrão  amostral  de  2,75  polegadas.  Es\me  o  percentual  de  mulheres  cujas  alturas  estão  entre  64  e  69,5  polegadas.  

         

15/08/13 55 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Como  a  distribuição  possui  a  forma  de  sino,  usa-­‐se  a  regra  empírica  

 

15/08/13 56 © P C F de Oliveira 2013

55,75   58,5   61,25   64   66,75   69,5   72,25  

34%  

13,5%  

x

x − 3s

x − 2s

x − s

x + s

x + 2s

x + 3s

x + 2s = 64 + (2 × 2,75) = 69,5

34% +13,5% = 47,5%

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Interpretando  o  Desvio  Padrão  Ø Teorema  de  Chebychev  

Ø A  parcela  de  qualquer  conjunto  de  dados  que  está  dentro  de  k  desvios  padrão  (k > 1)  da  média  é  pelo  menos  

Ø  k = 2:  em  qualquer  conjunto  de  dados,  pelo  menos                                              ou  75%  

dos  dados  estão  dentro  de  2  desvios  padrão  da  média  

Ø  k = 3:  em  qualquer  conjunto  de  dados,  pelo  menos                                                ou  

88,9%  dos  dados  estão  dentro  de  3  desvios  padrão  da  média    

 

       

15/08/13 57 © P C F de Oliveira 2013

1− 1k 2

1− 122

= 34

1− 132

= 89

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø A  distribuição  de  idade  para  a  Flórida  é  mostrada  no  histograma  abaixo.  Aplique  o  Teorema  de  Chebychev  aos  dados  usando  k = 2.  O  que  você  pode  concluir?          

15/08/13 58 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

 

15/08/13 59 © P C F de Oliveira 2013

k = 2: µ – 2σ = 39,2 – 2×24,8 = –10,4 µ + 2σ = 39,2 + 2×24,8 = 88,8

(use  0  já  que  idade  não  pode  ser  nega\va)  

Pelo  menos  75%  da  população  da  Flórida  está  entre  0  e  88,8  anos  de  idade.  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Variação  

Ø Desvio  Padrão  para  dados  agrupados  Ø  Desvio  Padrão  Amostral  de  uma  distribuição  de  frequência  

 

 

       

15/08/13 60 © P C F de Oliveira 2013

s =x − x ( )2 f∑n −1

n = f∑Onde:   (Número  de  entradas  no  conjunto  de  dados)  

Quando  uma  distribuição  de  frequência  possui  classes,  usa-­‐se  o  ponto  médio  de  cada  classe  para  calcular  a  média  e  o  desvio  padrão  amostral.    

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Você  coletou  uma  amostra  aleatória  do  número  de  crianças  por  família  em  uma  região.  Os  resultados  estão  dispostos  na  tabela  correspondente.  Determine  a  média  e  o  desvio  padrão  da  amostra  do  conjunto  de  dados.          

15/08/13 61 © P C F de Oliveira 2013

Número  de  crianças  em  50  famílias  

1   3   1   1   1  

1   2   2   1   0  

1   1   0   0   0  

1   5   0   3   6  

3   0   3   1   1  

1   1   6   0   1  

3   6   6   1   2  

2   3   0   1   1  

4   1   1   2   2  

0   3   0   2   4  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Primeiro  construa  a  distribuição  de  freqüência  

Ø Calcule  a  média  da  freqüência  de  distribuição  

 

 

15/08/13 62 © P C F de Oliveira 2013

x f xf 0   10   0×10  =  0  1   19   1×19  =  19  2   7   2×7  =  14  3   7   3×7  =21  4   2   4×2  =  8  5   1   5×1  =  5  6   4   6×4  =  24  

n =Σf = 50 Σ(xf ) = 91

x =(xf )∑n

= 9150

≈1,8

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Calcule  a  soma  dos  quadrados      

 

15/08/13 63 © P C F de Oliveira 2013

x f x – x (x – x)2 (x – x)2f

0   10   0  –  1,8  =  –1,8   (–1,8)2  =  3,24   3,24×10  =  32,40  1   19   1  –  1,8  =  –0,8   (–0,8)2  =  0,64   0,64×19  =  12,16  2   7   2  –  1,8  =  0,2   (0,2)2  =  0,04   0,04×7  =  0,28  3   7   3  –  1,8  =  1,2   (1,2)2  =  1,44   1,44×7  =  10,08  4   2   4  –  1,8  =  2,2   (2,2)2  =  4,84   4,84×2  =  9,68  5   1   5  –  1,8  =  3,2   (3,2)2  =  10,24   10,24×1  =  10,24  6   4   6  –  1,8  =  4,2   (4,2)2  =  17,64   17,64×4  =  70,56  

Σ = 145,4

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Calcule  o  desvio  padrão  amostral    

 

15/08/13 64 © P C F de Oliveira 2013

s =x − x ( )2 f∑n −1

= 145,450 −1

= 145,449

≈1,7

Capítulo  02  Esta.s/ca  Descri/va  

15/08/13 65 © P C F de Oliveira 2013

Seção  2.5   Medidas  de  Posição  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  Ø Descrevem  a  posição  de  um  valor  de  dados  específico  possui  em  relação  ao  resto  dos  dados  

Ø Mais  usadas  Ø Quar\s  Ø Percen\s    Ø Decis  Ø Escore  padrão  (z-­‐score)      

15/08/13 66 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  

Ø Frac/s  são  números  que  dividem  um  conjunto  de  dados  ordenado  em  partes  iguais  

Ø Quar/s  são  números  que  dividem  um  conjunto  de  dados  ordenado  em  4  partes  iguais  Ø  Primeiro  quar/l  –  Q1:  cerca  de  um  quarto  dos  dados  fica  

dentro  ou  abaixo  Ø  Segundo  quar/l  –  Q2:  cerca  da  metade  dos  dados  fica  dentro  

ou  abaixo  (mediana)  Ø  Terceiro  quar/l  –  Q3:  cerca  de  três  quartos  dos  dados  fica  

dentro  ou  abaixo  

 

       

15/08/13 67 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø A  pontuação  nos  testes  de  15  empregados  envolvidos  em  um  curso  de  treinamento  está  disposto  a  seguir.  Obtenha  o  primeiro,  segundo  e  terceiro  quar\s  da  pontuação  dos  testes.          

15/08/13 68 © P C F de Oliveira 2013

13    9    18    15    14    21    7    10    11    20    5    18    37    16    17  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Primeiro  ordene  os  dados  e  obtenha  Q2

Ø Q2  divide  o  conjunto  de  dados  em  2  metades  (mediana)    

15/08/13 69 © P C F de Oliveira 2013

5    7    9    10    11    13    14    15    16    17    18    18    20    21    37  

Q2

Metade  Inferior   Metade  Superior  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø O  primeiro  (Q1)  e  terceiro  (Q3)  quar\s  são  as  medianas  das  metades  inferior  e  superior

Ø Cerca  de  um  quarto  dos  empregados  fez  10  pontos  ou  menos,  cerca  da  metade  fez  15  pontos  ou  menos  e  cerca  de  três  quartos  conseguiu  18  pontos  ou  menos.    

 15/08/13 70 © P C F de Oliveira 2013

5    7    9    10    11    13    14    15    16    17    18    18    20    21    37  

Q2

Metade  Inferior   Metade  Superior  

Q1 Q3

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  

Ø Amplitude  Interquar/l  (AIQ)  Ø  Diferença  entre  o  terceiro  e  o  primeiro  quar\s  

 

       

15/08/13 71 © P C F de Oliveira 2013

AIQ = Q3 −Q1

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Obtenha  a  amplitude  interquar\l  da  pontuação  nos  15  testes  dados  no  exemplo  anterior.  

   

15/08/13 72 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Lembre-­‐se  que  

Q1 = 10, Q2 = 15, e Q3 = 18

Ø Então    

Ø  Isso  significa  que  as  pontuações  no  teste  na  metade  do  conjunto  de  dados  variam  no  máximo  em  8  pontos.  

15/08/13 73 © P C F de Oliveira 2013

AIQ = Q3 −Q1 =18 −10 = 8

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  

Ø Plote  Maria-­‐Chiquinha  (Box-­‐and-­‐whisker  plot)  Ø  Ferramenta  de  análise  exploratória  de  dados  Ø  Realça  caracterís\cas  importantes  de  um  conjunto  de  

dados  Ø  Requer  os  seguintes  valores  (resumo  cinco-­‐números)  

Ø Entrada  mínima  Ø Primeiro  quar\l  Q1  Ø Mediana  Q2  Ø Terceiro  quar\l  Q3  Ø Entrada  máxima    

 

       

15/08/13 74 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Desenhando  um  Plote  Maria-­‐Chiquinha  

Ø  Obtenha  o  resumo  cinco-­‐números  Ø  Construa  uma  escala  horizontal  que  abranja  a  amplitude  total  (AT)  

dos  dados  Ø  Plote  os  5  números  acima  da  escala  horizontal  Ø  Faça  uma  caixa  acima  da  escala  horizontal  de  Q1  a  Q3  e  trace  uma  

reta  ver\cal  na  caixa  passando  por  Q2  Ø  Faça  as  tranças  a  par\r  da  caixa  para  as  entradas  mínima  e  

máxima  

 

       

15/08/13 75 © P C F de Oliveira 2013

Trança   Trança  

Entrada  máxima  

Entrada  mínima  

Caixa  

Mediana,  Q2 Q3 Q1

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  

Ø Faça  um  plote  maria-­‐chiquinha  que  represente  a  pontuação  dos  15  testes  dados  no  exemplo  anterior.  O  que  você  pode  concluir  do  gráfico?  

   

15/08/13 76 © P C F de Oliveira 2013

5    7    9    10    11    13    14    15    16    17    18    18    20    21    37  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø O  resumo  cinco-­‐números  das  pontuações  

Ø Cerca  da  metade  das  pontuações  está  entre  10  e  18.  Ø Olhando  para  o  comprimento  da  trança  direita  pode-­‐se  

concluir  que  37  é  um  possível  dado  discrepante  (outlier).  

15/08/13 77 © P C F de Oliveira 2013

Min = 5 Q1 = 10 Q2 = 15 Q3 = 18 Max = 37

5 10   15   18   37  

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  

Ø Percen/s  e  outros  frac/s  

 

       

15/08/13 78 © P C F de Oliveira 2013

Frac/s   Resumo   Símbolos  Quar\s   Divide  o  conjunto  de  dados  

em  4  partes  iguais  Q1, Q2, Q3

Decis   Divide  o  conjunto  de  dados  em  10  partes  iguais  

D1, D2, D3,…, D9

Percen\s   Divide  o  conjunto  de  dados  em  100  partes  iguais  

P1, P2, P3,…, P99

Capítulo  02  Esta.s/ca  Descri/va    

Ø Exemplo  –  Interpretando  os  percen/s  Ø O  gráfico  de  freqüência  

acumulada  para  a  pontuação  no  teste  SAT  (teste  de  lógica)  do  ano  2000  está  representado  no  gráfico.  Que  pontuação  representa  o  72°  percen\l?  Como  interpretar  isso?                                              (Fonte:  College  Board  Online)    

   

15/08/13 79 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø O  72°  percen\l  corresponde  a  uma  pontuação  no  teste  de  1700  

Ø  Isto  significa  que  72%  dos  estudantes  \veram  uma  pontuação  no  SAT  de  1700  ou  menos  

15/08/13 80 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va   Ø Medidas  de  Posição  

Ø Escore  Padrão  (z-­‐score  ou  escore-­‐z)  Ø Representa  o  número  de  desvios  padrão  no  qual  está  um  valor  dado  x  a  par\r  da  média  m.  

 

       

15/08/13 81 © P C F de Oliveira 2013

z = valor −médiadesvio padrão

= x − µσ

Capítulo  02  Esta.s/ca  Descri/va     Ø Exemplo  1  

Ø A  velocidade  média  dos  veículos  ao  longo  de  um  trecho  de  uma  estrada  é  de  56  milhas  por  hora  (mph),  com  desvio  padrão  de  4  mph.  Foram  medidas  as  velocidades  de  3  carros  ao  longo  da  estrada,  obtendo-­‐se  respec\vamente  62  mph,  47  mph  e  56  mph.  Calcule  o  escore  z  correspondente  a  cada  velocidade.  O  que  você  pode  concluir?  

   

15/08/13 82 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

Ø Conclui-­‐se  que  a  velocidade  de  62  mph  está  1,5  desvios  padrão  acima  da  média,  a  de  47  mph  está  2,25  desvios  padrão  abaixo  da  média  e  a  de  56  mph  é  igual  à  média  

15/08/13 83 © P C F de Oliveira 2013

x = 62 mph x = 47 mph x = 56 mph

z = 62 − 564

=1,5

z = 47 − 564

= −2,25

z = 56 − 564

= 0

Capítulo  02  Esta.s/ca  Descri/va    

Ø Exemplo  2  Ø  Em  2007,  o  ator  Forest  Whitaker  ganhou  o  Oscar  de  melhor  

ator,  aos  45  anos  de  idade,  por  sua  atuação  no  filme  O  Úl4mo  Rei  da  Escócia.  A  atriz  Helen  Mirren  ganhou  o  prêmio  de  melhor  atriz  aos  61  anos  por  seu  papel  em  A  Rainha.  A  idade  média  para  todos  os  vencedores  do  prêmio  de  melhor  ator  é  43,7,  com  desvio  padrão  de  8,8.  A  idade  média  para  as  vencedoras  do  prêmio  de  melhor  atriz  é  36,  com  desvio  padrão  de  11,5.  Encontre  o  escore  z  que  corresponda  à  idade  de  cada  ator  ou  atriz.  Depois,  compare  os  resultados.  

   

15/08/13 84 © P C F de Oliveira 2013

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

15/08/13 85 © P C F de Oliveira 2013

Ø Forest  Whitaker  45 43.7 0.158.8

xz µσ− −= = ≈

Ø Helen  Mirren  61 36 2.1711.5

xz µσ− −= = ≈

Desvio  padrão  0,15  acima  da  média  

Desvio  padrão  2,17  acima  da  média  

Capítulo  02  Esta.s/ca  Descri/va     Ø Solução  

15/08/13 86 © P C F de Oliveira 2013

Escores  muito  incomuns  Escores  não  comuns  Escores  comuns  Escore  z  

z  =  0.15   z  =  2.17  

O  escore  z  correspondente  à  idade  de  Helen  Mirren  é  mais  de  dois  desvios  padrão  da  média,  então  é  considerado  incomum.  Comparado  a  outras  vencedoras  do  prêmio  de  melhor  atriz,  ela  é  rela\vamente  mais  velha,  enquanto  a  idade  de  Forest  Whitaker  é  pouco  acima  da  média  dos  ganhadores  do  prêmio  de  melhor  ator.