capítulo 2 descrição, exploração e comparação de dados prof. paulo renato de morais...
TRANSCRIPT
Capítulo 2Capítulo 2
Descrição, Exploração e Descrição, Exploração e Comparação de DadosComparação de Dados
Prof. Paulo Renato de MoraisProf. Paulo Renato de Morais
ESTATÍSTICA APLICADAESTATÍSTICA APLICADA
Descrevendo Descrevendo Dados QualitativosDados Qualitativos
Classe Freqüência Freq. RelativaCurso No Estudantes Proporção
Engenharia 130 0,65Economia 20 0,10Administração 50 0,25Total 200 1,00
Classe Freqüência Freq. RelativaCurso No Estudantes Proporção
Engenharia 130 0,65Economia 20 0,10Administração 50 0,25Total 200 1,00
Tabela de FreqüênciasTabela de Freqüências
1.1. Lista categorias e no. elementos na categoriaLista categorias e no. elementos na categoria
2.2. Obtida tabulando respostas na categoriaObtida tabulando respostas na categoria
3.3. Pode mostrar freqüências, % ou ambasPode mostrar freqüências, % ou ambas
Tabul.:Tabul.:|||| |||||||| |||||||| |||||||| ||||
Gráfico em ColunasGráfico em Colunas
0
50
100
150
Eng. Econ. Adm.
0
50
100
150
Eng. Econ. Adm.
Coluna mostra Coluna mostra freqüência ou %freqüência ou %
1/2 a 1 largura da coluna1/2 a 1 largura da coluna
Larguras iguaisLarguras iguais
Ponto ZeroPonto Zero
FreqüênciaFreqüência
CursoCurso
Econ.10%
Adm.25%
Eng.65%
Gráfico em SetoresGráfico em Setores
1. Mostra divisão da 1. Mostra divisão da quantidade total quantidade totalem categoriasem categorias
2. Útil para mostrar 2. Útil para mostrar diferenças relativasdiferenças relativas
3. Valor do ângulo:3. Valor do ângulo: (360°)(Porcentagem) (360°)(Porcentagem)
Cursos
(360°) (10%) = 36°
36°
QuestãoQuestão
Você deseja analisar a Você deseja analisar a divisão de mercado divisão de mercado dos fabricantes de dos fabricantes de programas para programas para Windows em 1992. Windows em 1992. Construa um gráfico Construa um gráfico em em colunascolunas e um e um gráfico em gráfico em setoressetores para descrever os para descrever os dados.dados.
MarcaMarca Div. Merc. (%)Div. Merc. (%)LotusLotus 1515MicrosoftMicrosoft 6060WordPerfectWordPerfect 1010OutrosOutros 1515
Solução do Gráfico em Solução do Gráfico em ColunasColunas
0%
20%
40%
60%
OutrosWordperfMicrosoftLotus
0%
20%
40%
60%
OutrosWordperfMicrosoftLotus
Div. Mercado (%)Div. Mercado (%)Div. Mercado (%)Div. Mercado (%)
MarcaMarcaMarcaMarca
Solução do Gráfico em Solução do Gráfico em SetoresSetores
Divisão do MercadoDivisão do Mercado
LotusLotus15%15%
OutrosOutros15%15%WordperfectWordperfect
10%10%
MicrosoftMicrosoft60%60%
Descrevendo Descrevendo Dados QuantitativosDados Quantitativos
1.1. Condensa dados agrupando valores Condensa dados agrupando valores similares em similares em classesclasses num gráfico num gráfico
2.2. Pode mostrar freqüências (contagens) Pode mostrar freqüências (contagens) ou freqüências relativas (proporções)ou freqüências relativas (proporções)
3.3. Primeiro deve-se construir uma tabela Primeiro deve-se construir uma tabela de distribuição de freqüênciasde distribuição de freqüências
HistogramaHistograma
Tabela de Distribuição de Tabela de Distribuição de FreqüênciasFreqüências
1.1. Determine amplitude totalDetermine amplitude total
2.2. Selecione número de classesSelecione número de classes UsualmenteUsualmente entre 5 e 20 inclusive entre 5 e 20 inclusive
3.3. Calcule intervalos de classe (comprimento)Calcule intervalos de classe (comprimento)
4.4. Determine limites das classesDetermine limites das classes
5.5. Calcule pontos médios das classesCalcule pontos médios das classes
6.6. Conte observações e designe a classesConte observações e designe a classes
Tabela de Distribuição de Tabela de Distribuição de FreqüênciasFreqüências
Dados: Dados: 2424, , 2626, , 2424, , 2121, , 27, 27, 3027, 27, 30, , 4141, , 3232, , 3838
LimitesLimites (Limite superior + inferior) / 2(Limite superior + inferior) / 2
Amplit. Amplit. = 10= 10
ClasseClasse P. médioP. médio FreqüênciaFreqüência
15 |---- 2515 |---- 25 2020 33
25 |---- 3525 |---- 35 3030 55
35 |---- 4535 |---- 45 4040 22
Tabela de Distribuição de Tabela de Distribuição de Freqüência Relativa e % Freqüência Relativa e %
Distribuição PercentualDistribuição PercentualDistribuição de Freqüência Distribuição de Freqüência RelativaRelativa
ClasseClasse Prop.Prop.
15 |---- 2515 |---- 25 0,30,3
25 |---- 3525 |---- 35 0,50,5
35 |---- 4535 |---- 45 0,20,2
ClasseClasse %%
15 |---- 2515 |---- 25 30,030,0
25 |---- 3525 |---- 35 50,050,0
35 |---- 4535 |---- 45 20,020,0
00
11
22
33
44
55
HistogramaHistograma
FreqüênciaFreqüência
Freqüência Freqüência RelativaRelativa
PorcentagemPorcentagem
00 1515 2525 3535 4545 5555
LimitesLimites
Colunas Colunas se tocamse tocam
ContagemContagem
Métodos Numéricos Métodos Numéricos para Dados Quantitativospara Dados Quantitativos
NotaçãoNotação
MedidaMedida AmostraAmostra PopulaçãoPopulação
MédiaMédia XX
Desvio padrãoDesvio padrão SS
VariânciaVariância SS22 22
TamanhoTamanho nn NN
Propriedades de Dados Propriedades de Dados QuantitativosQuantitativos
Tendência Central Tendência Central (Localização)(Localização)
Variação Variação (Dispersão)(Dispersão)
FormaForma
Métodos Numéricos Métodos Numéricos para Dados Quantitativospara Dados Quantitativos
PropriedadesNuméricas
MédiaMédia
MedianaMediana
ModaModa
TendênciaCentral
AmplitudeAmplitude
VariânciaVariânciaVariânciaVariância
Desvio PadrãoDesvio Padrão
Intervalo InterquartílicoIntervalo Interquartílico
Variação Forma
SimetriaSimetria
Medidas de Tendência Medidas de Tendência CentralCentral
MédiaMédia
1.1. Medida de tendência centralMedida de tendência central
2.2. Medida mais comumMedida mais comum
3.3. Funciona como ‘ponto de equilíbrio’Funciona como ‘ponto de equilíbrio’
4.4. Afetada por valores extremos (‘outliers’)Afetada por valores extremos (‘outliers’)
MédiaMédia
1.1. Medida de tendência centralMedida de tendência central
2.2. Medida mais comumMedida mais comum
3.3. Funciona como ‘ponto de equilíbrio’Funciona como ‘ponto de equilíbrio’
4.4. Afetada por valores extremos (‘outliers’)Afetada por valores extremos (‘outliers’)
5. 5. Fórmula (média amostral)Fórmula (média amostral)
XXXX
nn
XX XX XX
nn
iiii
nn
nn
11 11 22
Exemplo de MédiaExemplo de Média
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
XXXX
nn
XX XX XX XX XX XXiiii
nn
11 11 22 33 44 55 66
66
1010 33 44 99 88 99 111177 66 33 7,7,77
66
88 3030
,, ,, ,, ,, ,, ..
,,
MedianaMediana
1.1. Medida de tendência centralMedida de tendência central
2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais
MedianaMediana
1.1. Medida de tendência centralMedida de tendência central
2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais
3. 3. Posição da mediana na seqüência: Posição da mediana na seqüência:
PosiçãoPosição nn 11
22
MedianaMediana
1.1. Medida de tendência centralMedida de tendência central
2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais
3. 3. Posição da mediana na seqüência Posição da mediana na seqüência
4.4. Não é afetada por valores extremosNão é afetada por valores extremos
PosiçãoPosição nn 1122
Exemplo de Mediana: Exemplo de Mediana: Amostra Tamanho ÍmparAmostra Tamanho Ímpar
Dados:Dados: 24,124,1 22,622,6 21,521,5 23,723,7 22,622,6
Ordenação:Ordenação: 21,521,5 22,622,6 22,622,6 23,723,7 24,124,1
Posição:Posição: 11 22 33 44 55
PosiçãoPosição
MedianaMediana
nn 11
2255 11
2233
2222 66,,
Exemplo de Mediana Exemplo de Mediana Amostra Tamanho ParAmostra Tamanho Par
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
Ordenação:Ordenação: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7
Posição:Posição: 11 22 33 44 5566 PosiçãoPosição
MedianaMediana
nn 11
2266 11
2233 55
77 77 88 99
2288 33
,,
,, ,,,,
ModaModa
1.1. Medida de tendência centralMedida de tendência central
2.2. Valor que ocorre mais freqüentementeValor que ocorre mais freqüentemente
3.3. Não é afetada por valores extremosNão é afetada por valores extremos
4.4. Pode haver nenhuma moda ou várias Pode haver nenhuma moda ou várias modasmodas
5.5. Pode ser usada para dados quantitativos e Pode ser usada para dados quantitativos e qualitativosqualitativos
Exemplo de ModaExemplo de Moda
Nenhuma Moda:Nenhuma Moda:Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,3 7,77,7
Uma Moda:Uma Moda:Dados:Dados: 6,36,3 4,94,9 8,98,9 6,3 6,3 4,94,9 4,94,9
Mais de Uma Moda:Mais de Uma Moda:Dados:Dados: 2121 2828 2828 4141 4343 4343
QuestãoQuestão
Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são:determinado parâmetro de vôo. Os dados são:
17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11
Descreva estes dados em termos de Descreva estes dados em termos de tendência tendência centralcentral..
Solução da Tendência Solução da Tendência CentralCentral
MédiaMédia
XXXX
nn
XX XX XXiiii
nn
11 11 22 88
88
1717 1616 2121 1818 1313 1616 1212 1111
88
1515 55,,
Solução da Tendência Solução da Tendência CentralCentral
MedianaMediana
Dados:Dados: 1717 1616 2121 1818 1313 1616 1212 1111
Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 1818 2121
Posição:Posição: 11 22 33 44 55 66 77 88
PosiçãoPosição
MedianaMediana
nn 11
22
88 11
2244 55
1616 1616
221616
,,
Solução da Tendência Solução da Tendência CentralCentral
ModaModa
Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111
Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121Moda = 16Moda = 16
Resumo das Resumo das Medidas de Tendência Medidas de Tendência
Central Central
MedidaMedida EquaçãoEquação DescriçãoDescriçãoMédiaMédia XXii / / nn Ponto de EquilíbrioPonto de EquilíbrioMedianaMediana ((nn+1)+1) PosiçãoPosição
22Valor CentralValor CentralQuando OrdenadosQuando Ordenados
ModaModa NenhumaNenhuma Mais FreqüenteMais Freqüente
Medidas de VariaçãoMedidas de Variaçãoou Dispersãoou Dispersão
Amplitude TotalAmplitude Total
1.1. Medida de dispersãoMedida de dispersão
2.2. Diferença entre maior e menor Diferença entre maior e menor observaçãoobservação
AmplitudeAmplitude XX XXmaiormaior menormenor
Amplitude TotalAmplitude Total
1.1. Medida de dispersãoMedida de dispersão
2.2. Diferença entre maior e menor Diferença entre maior e menor observaçãoobservação
3.3. Ignora como os dados estão distribuídosIgnora como os dados estão distribuídos
AmplitudeAmplitude XX XXmaiormaior menormenor
77 88 99 1010 77 88 99 1010
Variância e Desvio PadrãoVariância e Desvio Padrão
1.1. Medidas de dispersãoMedidas de dispersão
2.2. Medidas mais comunsMedidas mais comuns
3.3. Considera como os dados estão distribuídosConsidera como os dados estão distribuídos
Variância e Desvio PadrãoVariância e Desvio Padrão
1.1. Medidas de dispersãoMedidas de dispersão
2.2. Medidas mais comunsMedidas mais comuns
3.3. Considera como os dados estão Considera como os dados estão distribuídosdistribuídos
4.4. Mostra variação ao redor da média (Mostra variação ao redor da média (XX ou ou ))
44 66 88 1010 1212
XX = 8,3= 8,3
Fórmula da Variância Fórmula da Variância AmostralAmostral
SS
(X(X X)X)
nn
(X(X X)X) (X(X X)X) (X(X X)X)
nn
iiii
nn
nn
22
22
11
1122
2222 22
11
11
Fórmula da Variância Fórmula da Variância AmostralAmostral
nn - 1 no denominador! - 1 no denominador! (Use (Use NN se se VariânciaVariância Populacional)Populacional)SS
(X(X X)X)
nn
(X(X X)X) (X(X X)X) (X(X X)X)
nn
iiii
nn
nn
22
22
11
1122
2222 22
11
11
Fórmula do Desvio Padrão Fórmula do Desvio Padrão AmostralAmostral
SS SS
(X(X X)X)
nn
(X(X X)X) (X(X X)X) (X(X X)X)
nn
iiii
nn
nn
22
22
11
1122
2222 22
11
11
Exemplo da VariânciaExemplo da Variância
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
SS
(X(X X)X)
nnXX
XX
nn
SS
iiii
nn
iiii
nn
22
22
11 11
2222 22 22
1188 33
(10(10 33 88 3)3) (4(4 99 88 3)3) (7(7 77 88 3)3)
66 1166 368368
onde onde ,,
,, ,, ,, ,, ,, ,,
,,
QuestãoQuestão
Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são:determinado parâmetro de vôo. Os dados são: 17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11
Quais são a Quais são a variância variância e oe o desvio padrão desvio padrão dos dos dados?dados?
SoluçãoSolução
Variância AmostralVariância Amostral
Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111
SS
(X(X X)X)
nnXX
XX
nn
SS
iiii
nn
iiii
nn
22
22
11 11
2222 22 22
111515 55
(17(17 1515 5)5) (16(16 1515 5)5) (11(11 1515 5)5)
88 1111111414
onde onde ,,
,, ,, ,,
,,
SoluçãoSolução
Desvio Padrão AmostralDesvio Padrão Amostral
SS SS
(X(X X)X)
nn
iiii
nn
22
22
11
1111111414 33 3434,, ,,
Resumo das Medidas de Resumo das Medidas de VariabilidadeVariabilidade
MedidaMedida EquaçãoEquação DescriçãoDescrição
Amplitude TotalAmplitude Total XXmaior maior - - XXmenormenor Dispersão TotalDispersão Total
Interv. InterquartílicoInterv. Interquartílico QQ3 3 - - QQ11 Dispersão 50% CentraisDispersão 50% Centrais
Desvio PadrãoDesvio Padrão(Amostral)(Amostral)
XX XX
nnii
22
11
Dispersão sobreDispersão sobreMédia AmostralMédia Amostral
Desvio PadrãoDesvio Padrão(Populacional)(Populacional)
XX
NNii
22 Dispersão sobreDispersão sobreMédia PopulacionalMédia Populacional
VariânciaVariância(Amostral)(Amostral)
((XXii --XX ))22
nn - 1- 1Dispersão QuadráticaDispersão Quadráticasobre Média Amostralsobre Média Amostral
FormaForma
FormaForma
1. Descreve como os dados estão distribuídos1. Descreve como os dados estão distribuídos
2. Medida pela simetria2. Medida pela simetria
SimétricaSimétricaMédiaMédia = = MedianaMediana = = ModaModa
FormaForma
1. Descreve como os dados estão distribuídos1. Descreve como os dados estão distribuídos
2. Medida pela simetria2. Medida pela simetria
Desvio à direitaDesvio à direitaDesvio à esquerdaDesvio à esquerda SimétricaSimétrica
Méd.Méd. = = MedianMedian = = ModaModaMéd.Méd. MedianMedian ModaModa ModaModa MedianMedian MédiaMédia
QuartisQuartis
QuartisQuartis
1.1. Medida de tendência Medida de tendência não-centralnão-central
2.2. Divide dados ordenados em 4 partesDivide dados ordenados em 4 partes
3.3. Posição do i-ésimo quartilPosição do i-ésimo quartil
25%25% 25%25% 25%25% 25%25%
QQ11 QQ22 QQ33
PosiçãoPosição dede QQii (n(n
ii 1)1)
44
Exemplo de Quartil (QExemplo de Quartil (Q11) )
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7
Posição:Posição: 11 22 33 44 5566Posição QPosição Q
1 1
11 1)1)
4411 (6(6 1)1)
44117575 22
66 3311
(n(n,,
,,
Exemplo de Quartil (QExemplo de Quartil (Q22))
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7
Posição:Posição: 11 22 33 44 5566Posição QPosição Q
2 2
22 1)1)
4422 (6(6 1)1)
4433 55
77 77 88 99
2288 3322
(n(n,,
,, ,,,,
Exemplo de Quartil (QExemplo de Quartil (Q33) )
Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7
Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7
Posição:Posição: 11 22 33 44 5566Posição QPosição Q
3 3
33 1)1)
4433 (6(6 1)1)
4455 2525 55
1010 3333
(n(n,,
,,
Intervalo InterquartílicoIntervalo Interquartílico
1.1. Medida de dispersãoMedida de dispersão
2.2. Também chamado dispersão centralTambém chamado dispersão central
3.3. Diferença entre terceiro e primeiro quartisDiferença entre terceiro e primeiro quartis
4.4. Dispersão dos 50% centraisDispersão dos 50% centrais
5.5. Não é afetado por valores extremosNão é afetado por valores extremos
IntervaloIntervalo InterquartílicoInterquartílico QQ QQ33 11
QuestãoQuestão
Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são: determinado parâmetro de vôo. Os dados são:
17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11
Quais são os Quais são os quartis Qquartis Q11 ee Q Q3 3 e o e o intervalo intervalo
interquartílicointerquartílico??
QQ11
Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111
Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121
Posição:Posição: 11 22 33 44 55 66 77 88
Solução do QuartilSolução do Quartil
Posição QPosição Q
1 1
11 1)1)
44
11 (8(8 1)1)
442225 25 22
121211
(n(n,,
Solução do QuartilSolução do Quartil
QQ33
Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111
Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121
Posição:Posição: 11 22 33 44 55 66 77 88Posição QPosição Q
33
33 1)1)
44
33 (8(8 1)1)
4466 7575 77
181833
(n(n,,
Solução do Intervalo Solução do Intervalo InterquartílicoInterquartílico
Intervalo InterquartílicoIntervalo Interquartílico
Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111
Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121
Posição:Posição: 11 22 33 44 55 66 77 88Intervalo Interquart.Intervalo Interquart. QQ QQ33 11 1818 1212 66