métodos quantitativos ii -...

16
Métodos Quantitativos II MEDIDAS DE VARIABILIDADE

Upload: truongnhi

Post on 12-Feb-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Métodos Quantitativos IIMEDIDAS DE VARIABILIDADE

O que significa Variabilidade?• As medidas de tendência central nos dão uma ideia da

concentração dos dados em torno de um valor. Entretanto, épreciso também conhecer suas características de espalhamento oudispersão – medidas de variabilidade (ou dispersão).

Medidas de Variabilidade• Amplitude Total

• Variância

• Desvio Padrão

• Coeficiente de Variação

Amplitude Total• Diferença entre o valor máximo e o mínimo de um conjunto de

dados.

Vantagem

• Forma fácil e rápida de calcular

Desvantagem

• Usa somente duas entradas do conjunto de dados.

Variância• A Variância pode ser definida como sendo a média aritmética do

quadrado dos desvios em relação à média da distribuição.

O desvio de uma entrada x em umapopulação é a diferença entre a entradae a média do conjunto de dados.

𝜇 = 𝑥

𝑁= 41,5

Salário anual (mil Reais) Desvio (x - µ)41 -0,538 -3,539 -2,545 3,547 5,541 -0,544 2,541 -0,537 -4,542 0,5

∑x = 415 ∑(x - µ) = 0

41 − 41,5 = −0,5

38 − 41,5 = −3,5

47 − 41,5 = 5,5

Diferença

Variância

𝜎2 = 𝑥 − 𝜇 ²

𝑁𝑆2 =

𝑥 − 𝑥 ²

𝑛 − 1

Variância Populacional Variância Amostral

𝜇 = 𝑚é𝑑𝑖𝑎 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑡𝑟𝑎𝑑𝑎𝑠

𝑥 = 𝑒𝑛𝑡𝑟𝑎𝑑𝑎

𝑥 = 𝑚é𝑑𝑖𝑎 𝑝𝑜𝑝𝑢𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑡𝑟𝑎𝑑𝑎𝑠

𝑥 = 𝑒𝑛𝑡𝑟𝑎𝑑𝑎

Desvio Padrão• O Desvio Padrão de uma distribuição populacional de N entrada é a

raiz quadrada da variância populacional.

𝜎2 = 𝑥 − 𝜇 ²

𝑁

Variância Populacional

𝜎2 = 𝑥 − 𝜇 ²

𝑁

Desvio Padrão Populacional

Roteiro para encontra a variância populacional e o desvio padrão• Encontre a média do conjunto de dados populacionais

• Encontre o desvio de cada entrada

• Faça o quadrado de cada desvio

• Obtenha a soma dos quadrados

• Divida por N para obter a variância populacional

• Encontra a raiz quadrada da variância populacional para obter o desvio padrão populacional

Exemplo

Salário anual (mil Reais)

Desvio (mil reais) Quadrado

41 -0,5 0,2538 -3,5 12,2539 -2,5 6,2545 3,5 12,2547 5,5 30,2541 -0,5 0,2544 2,5 6,2541 -0,5 0,2537 -4,5 20,2542 0,5 0,25

∑ = 415 0 ∑ (x - µ)² = 88,5

𝜎2 = 𝑥 − 𝜇 ²

𝑁≈ 8,85

𝜎2 = 8,85 ≈ 3

Mas o que isso significa?

Interpretação do Desvio Padrão• O desvio padrão representa a distância que as entradas mantém

em relação à média da distribuição.

◦ Se o valor do desvio padrão é baixo: significa que o conjunto de dados é maishomogêneo, com valores próximos uns dos outros e, portanto, com baixavariabilidade;

◦ Se o valor do desvio padrão é alto: significa que o conjunto de dados é maisheterogêneo, com valores mais distantes uns dos outros e, portanto, com altavariabilidade.

Interpretação do Desvio Padrão• Então, o que significa o valor do desvio padrão igual a 3?

Significa que os dados que compõe a distribuição estão, em grande parte, distantes em 3 unidades da média!

Calculando o Desvio Padrão para Dados Agrupados

• Onde 𝑛 é igual a 𝑓

𝑆2 = 𝑥 − 𝑥 2𝑓

𝑛 − 1

Coeficiente de Variação (CV)• É uma medida de dispersão relativa empregada para estimar a

precisão de experimentos. Sua principal qualidade é a capacidadede comparação de distribuições diferentes.

• Como duas distribuições podem ter médias/valores médiosdiferentes, o desvio-padrão dessas duas distribuições não écomparável. A solução é usar o coeficiente de variação, que é igualao desvio-padrão dividido pela média.

(Populacional) 𝑪𝒗 =𝝈

𝝁𝒙𝟏𝟎𝟎 ou 𝑪𝒗 =

𝑺

𝒙𝒙𝟏𝟎𝟎 (Amostral)

Exemplo• Compare a variabilidade relativa do tempo de reação de um

analgésico A com a variabilidade do peso das pessoas que sesubmeteram à dosagem desse analgésico. As médias e os desviospadrão foram:

• Analgésico A: 𝑥=3 min e S = 0,71

• Peso das pessoas: 𝑥=58,25 kg e S = 5,17

Solução do Exemplo• Solução: Vamos calcular o coeficiente de variação para cada item

observado.

• Cálculo para o tempo de reação do analgésico:

• Cálculo para o peso das pessoas:

• Comparando o coeficiente de variação do tempo de reação do analgésico e o do pesodas pessoas, podemos concluir que os dados referentes ao peso são mais consistentesque os dados referentes ao tempo de reação do analgésico, ou ainda, que os dadosreferentes ao peso são mais homogêneos que os do tempo de reação do analgésico.

O gráfico mostra a correlação entre duas variáveis, isto é, como elas estão se relacionando. Tem-se que, quanto maiorfor a intensidade de uso de Capital em determinada economia, ou seja, quanto maior for o nível tecnológico doprocesso produtivo, maior será o PIB per capta daquele local.