estatística aplicada slides unidade i

Post on 28-Dec-2015

26 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Unidade I

ESTATÍSTICA APLICADA

Prof. Luiz Felix

O termo estatística

Provém da palavra Estado e foi utilizadooriginalmente para denominarlevantamentos de dados, cuja finalidadeera orientar o Estado em suas decisões.

Foi utilizado em épocas remotas paradeterminar o valor dos impostoscobrados dos cidadãos e até mesmopara determinar a estratégia de umanova batalha.

Definição

Estatística é um conjunto de técnicas e métodos que nos auxiliam no processode tomada de decisão na presença de incerteza.

Exemplos de aplicações:

caracterização de perfil sócio-econômico;

análise de intenção de votos;

levantamento de pessoas com nível universitário.

População e amostra

População conjunto de todos os itens(pessoas, coisas, objetos) que interessam ao estudo de um fenômenocoletivo segundo alguma característica.

Amostra qualquer subconjunto nãovazio de uma população.

Estatística descritiva

Estatística descritiva é a parte da Estatística que tem por objetivodescrever os dados observados.

Exemplo: Índice Nacional de Preço aoConsumidor (INPC), que envolve asintetização dos aumentos dos produtos da cesta básica.

Estatística indutiva

Estatística indutiva é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é queO cálculo de probabilidade é que viabiliza a inferência estatística.

Exemplo: análise do mercado financeiro visando explicar tendênciasdas taxas de juros.

Principais fases do método estatístico

Definição do problema

Planejamento

Coleta de dados

Apuração dos dados

Apresentação dos dados

Análise e interpretação dos dados

Dados estatísticos

Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar asdeterminado candidato ganhar as eleições etc.

Tais números serão chamados de dados estatísticos.

Dados brutos e rol

Dados brutos uma sequência devalores numéricos não organizados, obtidos diretamente da observação deum fenômeno coletivo. Exemplo: idade dos meus professores: 49 63 34 2749, 63, 34, 27.

Rol uma sequência ordenada dedados brutosExemplo: idade dos meus professores: 27, 34, 49, 63 ou 63, 49, 34, 27.

Variáveis

Quantitativas

Contínuas – assumem qualquer valor em um intervalo. Ex.: idade.

Discretas – originam-se da contagem de itens. Ex.: quantidade de produtositens. Ex.: quantidade de produtos produzidos por dia.

Qualitativas

Nominais – definem categorias. Ex.: separação por sexo.

Por posto – dispõem os elementos em uma ordem de preferência. Ex.: primeiro, segundo...

Interatividade

Qual das seguintes séries abaixo representa um rol?

a) X: 1, 2, 3, 5, 4, 6

b) Y: 6, 5, 4, 7, 8, 9

c) Z: 1 1 3 3 5c) Z: 1, 1, 3, 3, 5

d) K: 5, 1, 1, 3, 3

e) L: 2, 2, 7, 8, 9, 1

Notação por índices

O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, ..., xn). “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2 3 4 n2, 3, 4..., n.

NOTAÇÃO SIGMA (∑):A maioria dos processos estatísticos irá exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representarsigma (∑) é utilizada para representar essas somas.

Medidas de tendência central

Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral, buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de númerosdeterminado conjunto de números.

As medidas mais usadas nesse sentido são as chamadas medidas de tendência central:

média;

mediana;mediana;

moda.

Média aritmética

É um valor calculado para um grupo de dados, usado para descrevê-los. É o ponto de equilíbrio dos dados.

x = ∑ xix ∑ xi

n

xi : cada variável da amostra.

n: é o número total de observações.

Média aritmética – exemplo

Calcule a média aritmética do conjunto de dados:

xi = 3, 5, 8, 12, 7, 25

x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10

n 6 6

Interpretação: O valor médio dos dados é 10, ou seja, os valores deste conjunto , j , jde dados concentram-se em torno do 10.

Média aritmética – exemplo

Calcule a média aritmética do conjunto de dados:

xi = 1, 1, 3, 5

x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5

n 4 4

Interpretação: O valor médio dos dados é 2,5, ou seja, os valores deste conjunto de , , j , jdados concentram-se em torno do 2,5.

Média aritmética ponderada

A cada valor xi deverá ser atribuído um peso wi .

xp = ∑ xi . wi

∑ w∑ wi

xi : cada variável da amostra.

wi : cada peso da amostra.

Média aritmética ponderada –exemplo

Um aluno tirou as notas 7, 3, 6 e 5 em quatro avaliações que, respectivamente, tinham os pesos 2, 5, 1, 2. Calcule a média do aluno levando-se em conta os pesos das avaliações.

xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5

∑ wi 2 + 5 + 1 + 2 10

Mediana

É um valor que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que estão à sua direita. É o ponto que ocupa a posição central em uma série.

Se o número de elementos do rol forímpar, a mediana será o valor do meio.

Se o número de elementos do rol for par, a mediana será a média dos 2 valores do meio.

Podemos calcular a posição da mediana com a fórmula:

posmed = (n + 1)

2

Mediana – exemplo

Determinar a mediana

xi = 2, 20, 12, 23, 20, 8, 12

Solução:

Rol xi: 2, 8, 12, 12, 20, 20, 23

n = 7, logo:

posmed = (7 + 1) = 8 = 4ª posição

2 2

A mediana é o elemento que ocupa a 4ª posição: mediana = 12posição: mediana = 12

Mediana – exemplo

Determinar a mediana

xi = 7, 21, 13, 15, 10, 8, 9, 13

Solução:

Rol xi: 7, 8, 9, 10, 13, 13, 15, 21

n = 8, logo:

posmed = (8 + 1) = 9 = 4,5ª posição

2 2

Neste caso, deve-se tirar a média entre os 2 valores do meio para se obter a medianavalores do meio para se obter a mediana.md = 10 + 13 = 23 = 11,5

2 2

Moda

É o valor de maior frequência em um conjunto de dados.

Se o conjunto de dados possui:

Uma moda unimodal

Duas modas bimodal Duas modas bimodal

Três modas trimodal

4 ou mais modas polimodal

Nenhuma moda amodal

Moda – exemplos

Determinar a moda

xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1

Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8

moda = 5 unimodal

Determinar a moda

xi = 5, 4, 3, 3, 5, 4

Solução: Rol xi: 3, 3, 4, 4, 5, 5

não existe moda amodal

Interatividade

Para o seguinte conjunto de dados

xi = 5, 9, 7, 31, 21, 13, 13, 21,

determinar a média aritmética simples, a mediana e a moda.

a) Média = 15; mediana = 13; moda = 13 e 21a) Média = 15; mediana = 13; moda = 13 e 21

b) Média = 15; mediana = 26; moda = 13 e 21

c) Média = 14; mediana = 26; moda = 13

d) Média = 15; mediana = 13; moda = 21

e) Média = 14; mediana = 26; moda = 13 e 21e) Média = 14; mediana = 26; moda = 13 e 21

Medidas de dispersão

Indicam o quanto os dados estão

dispersos em torno da região central.

Quanto maiores as medidas de dispersão, mais heterogêneos são os dados e ao contrário quanto menoresdados, e, ao contrário, quanto menores essas medidas, mais homogêneo o conjunto.

Analisaremos as seguintes medidas de dispersão:

lit d t t l amplitude total;

desvio padrão;

variância.

Medidas de dispersão

Considere os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 70, 70, 70, 70, 70

Y: 68, 69, 70, 71, 72

Z: 5 15 50 120 160Z: 5, 15, 50, 120, 160

Os 3 conjuntos apresentam a mesma média aritmética: 70.

Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z.

Medidas de dispersão

Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e modamoda.

É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados.

Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros.

Amplitude total

A amplitude total, ou intervalo, de um determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números.

Amplitude Total = Valor Máximo – Valor Mínimo

Sendo xi: 7, 8, 9, 10, 13, 20

Amplitude Total = 20 – 7 = 13

Desvio médio

A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência.

DMédio = ∑ | xi x |

n

Em que n é o número de observações.

Exemplo de | x |

| 3 | = 3

| 3 | = 3

Desvio médio – exemplo

Para o conjunto de dados xi = 2, 8, 4, 6, calcule o desvio médio.

Solução: DMédio = ∑ | xi x |

n

x = 2 + 8 + 4 + 6 = 20 = 5x = 2 + 8 + 4 + 6 = 20 = 5

4 4

DM = | 2 5 | + | 8 5 | + | 4 5 | + | 6 5 |

4

D = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1DM = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1

4 4

DM = 2

Variância e desvio padrão (população e amostra)

POPULAÇÃO

Variância: σ2 = ∑ (xi – x)2

n

Desvio Padrão: σ = σ2

AMOSTRA

Variância: S2 = ∑ (xi – x)2

n – 1

Desvio Padrão: S = S2

Variância e desvio padrão (população) – exemplo

Para a população xi = 4, 5, 8, 5, calcule a variância e o desvio padrão.

Solução: σ2 = ∑ (xi x)2 e σ = σ2

n

x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5

4 4

σ2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2

4

σ2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 2 25σ2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 2,25

4

Desvio padrão: σ = σ2 = 2,25 = 1,5

Variância e desvio padrão (amostra) – exemplo

Para a amostra xi= 4, 5, 8, 5, calcule a variância e o desvio padrão.

Solução: S2 = ∑ (xi x)2 e S = S2

n – 1

x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5

4 4

S2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2

4 – 1

S2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 9 = 3S2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 9 = 3

3 3

Desvio padrão: S = S2 = 3 = 1,73

Interatividade

Para a população xi = 1, 9, 3, 7, 5, calcule a variância e o desvio padrão.

a) Variância = 7 e desvio padrão = 2,64

b) Variância = 8 e desvio padrão = 2,82

c) Variância = 9 e desvio padrão = 3c) Variância = 9 e desvio padrão = 3

d) Variância = 10 e desvio padrão = 3,16

e) Variância = 11 e desvio padrão = 3,31

Distribuição de frequências

A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantescaracterísticas semelhantes.

A distribuição de frequências é a organização de dados em classes ou intervalos, para determinar o número de observações ou a percentagem de observações de cada classe chamadaobservações de cada classe, chamada de frequência de classes.

Distribuição de frequências

Classe: são intervalos que subdividem a amplitude total.

Limites de classe: são os limites extremos de cada classe.

Li é o menor valor das classes consideradas.

Ls é o maior valor das classes consideradas.

Amplitude de classe: é a diferença entre o limite Li e o Ls da classe e determina alimite Li e o Ls da classe e determina a amplitude das classes de uma distribuição de frequências.

h = Ls – Li

Distribuição de frequências

Li = 140 Ls = 150

Nº de classes = 4

Amplitude da classe h = 10

Alguns conceitos de uma distribuição de frequência

Frequência relativa %: é o quociente entre a frequência absoluta da i-ésima classe com o somatório das frequências, multiplicando esse resultado por 100:

fri% = fi . 100

n

Frequência acumulada: é o somatório da frequência absoluta da i-ésima classe com a frequência absoluta das classes anteriores.

Distribuição de frequências –exemplo

A observação das notas de 30 alunos em uma prova mostrou os valores:

3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7;

7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5;

5; 5 5; 4 5; 4; 7 5; 6 5; 5; 6; 6 5; 65; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6.

Distribuição de frequências –variável contínua

Rol

2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5;

5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5;

6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5

xi fi fri% Fi Fri%

2 |-- 4 4 13,33 4 13,33

4 |-- 6 12 40 16 53,33

6 |-- 8 10 33 34 26 86 676 | 8 10 33,34 26 86,67

8 |-- 10 4 13,33 30 100

∑ 30 100 --- ---

Distribuição de frequências –exemplo

xi fi fri% Fi Fri%

2 |-- 4 4 13,33 4 13,33

4 |-- 6 12 40 16 53,33

6 |-- 8 10 33,34 26 86,67

Alunos com nota > = 4 e menor 6: 12

|

8 |-- 10 4 13,33 30 100

∑ 30 100 --- ---

Alunos com nota menor que 6: 16

%Alunos com nota > = 4 e menor que 6: 40%

%Alunos com nota < que 6: 53,33%

Interatividade

A observação das notas de 30 alunos em uma prova mostrou os seguintes valores conforme mostrado na distribuição de frequências abaixo. Indique qual o percentual de alunos com nota menor que 8.

a) 10%

b) 33,34%

c) 26%

d) 86,67%

Notas fi

2 |-- 4 4

4 |-- 6 12

6 |-- 8 10e) 13,33%

8 |-- 10 4

ATÉ A PRÓXIMA!

top related