slides de estatística descritiva e probabilidade
Post on 26-Jun-2015
2.459 Views
Preview:
TRANSCRIPT
Professor: João Maria Filgueira, MSc(jmfilgueira@cefetrn.br)
Probabilidade Estatística
Plano de Ensino
Objetivo
Conteúdo
Metodologia
Avaliação
BIbliografia
Método EstatísticoA Ciência Estatística
Termos Estatísticos relevantes
Fases do Trabalho Estatístico
Exemplo para discussão
A Ciência Estatística
Estatística tem sua origem em Dados Estatais - Governamentais
A partir do século XVI surgem análises de nascimentos, de óbitos, de matrimônios, riquezas
No século XVIII surge, dessas análises, a Ciência Estatística
Dimensões: Descritiva, Probabilística, Inferencial
Termos Estatísticos relevantes
População: universo a ser estudado
Amostra: subconjunto da População
Variáveis: Qualitativas, Quantitativas
Variáveis Quantitativas: Discretas e Contínuas
Dados Estatísticos: valores das Variáveis
Fases do Trabalho Estatístico
2 - Planejamento
SoftwareEstatístico
3 – Coleta de dados
5 – Análise de dados
1 – Definição do Problema
6 – Apresentaçãode resultados
4 – Organizaçãode dados
Lista deReferências
Base deDados
Exemplo para discussãoEstudo para avaliar a Evasão Escolar em seu Município.
Como Planejar esse Estudo?
Quais as fases desse Trabalho Estatístico?
Quais as principais variáveis? E os principais desafios?
Estatística DescritivaDistribuição de frequências
Medidas de posição
Medidas de variabilidade
Medidas Separatrizes
Assimetria
Apresentação gráfica
Distribuição de FrequênciaRol: conjunto ordenado dos dados
Amplitude Total: AT = MAIOR - MENOR
Classes: Onde n é a quantidade de dados
Amplitude de classe: a = AT / c
Frequência: ocorrência do Rol nas classes
.25 n dados de número o se , n
25; n dados de número o se 5,
Distribuição Frequência
Exemplo
Considere os dados a seguir referentes a tempo de processamento de uma rotina computacional, implementada por diferentes Programadores. Obtenha a distribuição de frequência. Comente o resultado.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
MédiaValor médio dos dados
Dados não agrupados:
Onde X é o conjunto valores; n é a quantidade de dados.
Dados agrupados:
Onde X é o ponto médio; f é a frequência da classe;
f
XfX
)*(
n
XX
MedianaValor central dos dados
Dados não agrupados: , quando n for ímpar
, quando n for par
Onde x(n+1)/2 representa o valor da posição (n+1)/2
xn/2 representa o valor da posição n/2
x(n/2+1) representa o valor da posição (n/2+1)
)/2 X (XX
XX
1) (n/2n/2
1n
~
~2/)(
Mediana
Valor central dos dados
Dados agrupados:
É preciso obter a primeira classe com 50% dos dados. Esta é a classe mediana.
Onde L é o limite inferior da classe mediana; Sant é a soma das frequências anteriores; f é a frequência da classe mediana; a é a amplitude de classe.
a*f
Sant2f
LX
~
Moda
Valor de maior frequência
Dados agrupados:
É preciso obter a classe com maior frequência.
Onde L é o limite inferior da classe; Da = maior frequência - anterior; Dp = maior frequência - posterior; a é a amplitude de classe.
a*DpDa
DaLX
ˆ
Medidas de posição
Exemplo
Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha média, moda e mediana. Comente o resultado.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
Variância
X
1)(
)(* 22
f
XXfS
1
)( 22
n
XXS
Variação dos dados em relação à média
Dados não agrupados: Onde X o conjunto valores; n é número de dados; é a média.
Dados agrupados: Onde X é o ponto médio; f é a frequência da classe; é média.X
Desvio padrão
Variação dos dados em relação à média
Onde S2 é a variância
2SS
Coeficiente de variaçãoVariação dos dados em relação à média
Onde:S é o Desvio padrãoe é a Média
Quanto menor Cv, melhor a representatividade da média X.
100*X
SCv
X
Medidas de variação
Exemplo
Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e mediana. Obtenha variância, desvio padrão e coeficiente de variação. Comente o resultado.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
Medidas SeparatrizesOrganizam os dados em grupos percentualmente iguais Quartis – 25% Q1 25% Q2 25% Q3 25%
Decis – 10% D1 10% D2 ...... 10% D8 10% D9 10%
Percentis – 1% P1 1% P2 ...... 1% P98 1% P99 1%
a*f
Sant4f
*i
LQ i
a*f
Sant10f
*i
LDi
a*f
Sant100f
*i
LPi
Medidas Separatrizes
Exemplo
Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha o valor abaixo do qual há 75% dos dados, e o valor abaixo do qual há 10% dos dados . Comente os resultados.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
AssimetriaQuantifica o deslocamento/afastamento da distribuição em relação a medidas centrais
é a Média é a Moda S é o Desvio padrão
S
XXAss
ˆ
XX̂
AssimetriaSituações que a literatura apresenta
Ass > 0
Ass < 0
Ass = 0
Assimetria
Exemplo
Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e desvio padrão. Obtenha a Assimetria. Comente o resultado.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
Apresentação gráfica
Histograma
Gráfico de barra de classes e porcentagens
Polígono de frequência
Gráfico de linha de pontos médios e porcentagens
Apresentação gráfica
Exemplo
Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha histograma e polígono de frequência. Comente o resultado.
Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20
Diagrama de Pareto Gráfico de barra, por ordem de ocorrência
Frequência em ordem decrescente
Frequencia acumulada à direita
Diagrama em setores
Gráfico em forma de círculo: partes em um total
Recomenda-se um máximo de 7 partes
R e c e i t a d o M u n i c í p i o X ( 1 9 7 5 - 1 9 7 7 )
2 5 %3 3 , 3 %
4 1 , 7 %
1976 19771975
Probabilidade Significado
Axiomas de Probabilidade
Probabilidade condicional
Distribuição de Probabilidade
Valor Esperado
Variância
Distribuições Discretas
Distribuições Contínuas
Significado
Experimento aleatório
Espaço amostral - S
Eventos - E
Probabilidade Clássica P(E) = n(E)/n(S)
Axiomas
(1) Se Ø é um Evento vazio (evento
impossível), então P(Ø)=0
(2) Se Ac é o complemento do
evento A, então P(Ac) = 1 – P(A)
(3) Se A e B são dois eventos quaisquer, então: P(A B) = P (A) + P (B) – P (A B)
Exemplo
Em um lançamento de um dado, qual é probabilidade de se obter a FACE 4?
Experimento – lançar um dadoEspaço amostral – S={1,2,3,4,5,6}Evento – FACE 4; E = {4}P(E) = 1/6
Exemplo
Em um grupo de alunos do Curso de Análise de Sistemas, há 10 alunos que pagam Estatística, 5 que pagam Programação e 3 que pagam essas duas Disciplinas. Um aluno foi selecionado, qual é probabilidade dele pagar Estatística ou Programação?
Probabilidade condicional Para dois eventos E1 e E2, a
Probabilidade de E2 ocorrer, sabendo que E1 já havia ocorrido é dada por:
P(E2/E1) = P(E1 E2)/ P(E1), onde:
P(E1) é probabilidade de E1 ocorrer (só, sem E2)
P (E1E2) é a probabilidade dos dois ocorrerem juntos.
Exemplo
Em um lote de lâmpadas, há 8 boas, 2 com pequenos defeitos e 2 com grandes defeitos. Desse lote,são retiradas 2 lâmpadas, uma após a outra sem reposição. Qual a probabilidade de que ambas sejam defeituosas?Sabe-se que P(E2/E1) = P(E1 E2)/ P(E1) , logo tem-se:
P(E1 E2)= P(E1)* P(E2/E1)P(E1 E2)= (4/12)* P(E2/E1) P(E1 E2)= (4/12)* (3/11) P(E1 E2)= (4*3)/(12*11) P(E1 E2)= 12/132 = 0,0909
Distribuição de Probabilidade
Variável aleatória
Valores possíveis para Variável
Probabilidade de cada valor
Soma das Probabilidades igual a 1
Exemplo Em um lançamento de um dado,
construa a Distribuição de Probabilidade da face obtida em cada lançamento.Experimento – lançar um dado
Valores possíveis – S={1,2,3,4,5,6}P(1) = 1/6, P(2) = 1/6, P(3) = 1/6,
P(4) = 1/6, P(5) = 1/6, P(6) = 1/6X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Valor Esperado É o valor esperado para o experimento. Por exemplo, quando lança-se um dado, espera-se que ocorra a face ...
X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x
)()( xpxXE
Exemplo Em um lançamento de um dado, a
partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter o Valor Esperado.
E(X) = 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6
E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3,5
Portanto ao lançar-se um dado espera-se que ocorra as faces 3 e 4.
X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Variância
)()( 22 xpxXE
É uma medida de dispersão.
V(X) = E(X2) – [E(X)]2, onde:
X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x
)()( xpxXE
Exemplo Em um lançamento de um dado, a
partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter a Variância.
E(X2) = 12*1/6+22*1/6+32*1/6+42*1/6+52*1/6+62*1/6
E(X2) = (1+4+9+16+25+36)/6 = 91/6 = 15,17 E(X) = 3,5 V(X) = 15,17 – (3,5)2 = 2,92
X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Distribuições discretasVariável aleatória discreta assume valores inteiros, geralmente tipo 0,1,2, ..., n>=0
X - gols em uma partida de futebolX - votos de determinado candidatoX - lâmpadas queimadas em uma indústriaX - clientes em débito com determinada empresa
Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade
Distribuições Binomial
Variável aleatória discreta que pode assumir apenasdois valores, um de sucesso ou outro de fracasso, tipo 0,1.X – alunos aprovados;X – acertos em uma prova
n – repetições do experimento p – probabilidade de sucessoq – probabilidade de fracasso, q=1-px – valor de ocorrência de sucessoE(X) = n*p ; V(X) = n*p*q
xnxqpx
nxXP
)(
)!(!
!
xnx
n
x
n
Exemplo Em oito lançamentos de uma moeda,
qual é a probabilidade de se obter 3 caras? Calcular o Valor Esperado e a Variância?X-número de caras em lançamentos da moeda
X~B(n,x,p)n=8 repetições, x=3 caras, p=½ probabilidade de cara (sucesso)X~B(8,3,1/2)P(X=3) = C8,3*(1/2)3*(1-1/2)8-3
P(X=3) = 56*0,125*0,03125 = 0,21875 E(X) = n*p = 8*(1/2) = 4 caras V(X) = n*p*q = 8*(1/2)*(1-1/2)=8*(1/2)*(1/2) = 2
Distribuições Poisson
Variável aleatória discreta que pode assumir valores de sucesso em determinado intervalo. Este intervalo pode ser de tempo, de área, de volume.X – veículos que passam em uma rua por hora X – erros ortográficos em uma página de texto
t – taxa histórica de sucessox – valor de ocorrência de sucessoE(X) = t; V(X) = t
!
.)(
x
texXP
xt
Exemplo Qual é a probabilidade de se obter 1
chamada em 90 minutos, em um telefone que recebe em média 2 chamadas por hora?
X-número de chamadas telefônica por hora
X~P(x,t)x=1 chamada, t: 2 chamadas em 60 minutos
t chamadas em 90 minutost = 2*90/60 = 3X~P(1,3)
149361,01
3*049787,0
!1
3.)1(
13
e
XP
Distribuições contínuasVariável aleatória contínua assume valores reais, não determinados.
X – altura de alunosX – valor de compras de clientesX – tempo de vida de lâmpadasX – pesos de componentes eletrônicos
Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade. Há váriasdistribuições contínuas, vamos abordar a principal delas, que é a Distribuição Normal.
Distribuições Normal
Variável aleatória contínua, simétrica em torno damédia: com alta frequência em torno da média, com pequena frequência de valores altos e com pequena frequência de valores baixos.
E(X) = ; V(X) = 2
xx
xf ,2
exp2
1)(
2
2
Distribuições Normal
Como é possível observar é preciso integrar a funçãof(x) da Distribuição Normal, para poder obter o valorda probabilidade desejada. E isto é bastante difícil. O que fazer então? Gauss, que criou a Normal, propôs aseguinte Transformação Linear
Essa variável Z tem distribuição Normal com Média 0e variância 1. E, na maioria das vezes, -4<z<4, que éum intervalo bastante controlado.
X
Z
Distribuições NormalAssim, se X~( ; ) então Z~( 0 ; 1 ). Há váriastabelas Z que permitem calcular probabilidades entreintervalos de valores de z.
Por exemplo, é possível calcular a probabilidadeP(-1,45 < Z < 2,33), utilizando-se dessas tabelas Z.
Para utilizar essas tabelas Z, é preciso inicialmenterealizar a transformação
e utilizar as tabelas Z existentes.
X
Z
Exemplo Sabe-se que as notas de Informática seguem uma
distribuição normal, X~( =6,55; =2,01). Calcule a
probabilidade de um aluno obter nota entre 5,0 e 7,5.
P(5,0 < X < 7,5)=? Deve-se aplicar a transformação Z.
P [ (5,0-6,55)/2,01 <(X-6,55)/2,01<
(7,5-6,55)/2,01 ] P [ -0,77 <Z< 0,47 ]
Agora é só aplicar uma tabela Z.
X
Z
Análise de Correlação
Significado
Diagrama de Dispersão
Correlação Linear
Grau de explicação
Significado
Relação entre variáveis: duas
Existência de associação entre elas
Quantificação da associação
Predição de uma variável, em função da outra
Gráfico dos valores das variáveis
Diagrama de dispersão
Gráfico de pontos, tipo (X, Y)
Variável independente - X
Variável dependente - Y
Situações Possíveis
y’
x’
y’
x’
y’
x’
y’
x’
Ausência associação linear
Associação linear positiva
Associação linear negativa
y’
x’
y’
x’
Correlação Linear
Análise do relacionamento entre duas variáveis
Sinal do grau de relacionamento linear
Coeficiente de Correlação Linear
Equação
Onde n é a quantidade de pares (X,Y)
Valores do coeficiente: –1 r +1
r = n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2r =
n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2r =
n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2r =
n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2r =
n.x.y) - (x).(y)
n.x2) - (x)2 n.y2) - (y)2
Valores Análise0,00 a 0,19 Correlação bem fraca
0,20 a 0,39 Correlação fraca
0,40 a 0,69 Correlação moderada
0,70 a 0,89 Correlação forte
0,90 a 1,00 Correlação muito forte
Valores possíveis
r = 0,4 r = 0,7 r = 1,0
r = -0,3 r = -0,6 r = -0,9
Exemplo
Construa diagrama de dispersão e obtenha Coeficiente de Correlação Linear
Y = valor do faturamento (R$)X = horas de Programação
DADOS:
MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811
Grau de explicação
Variação explicada pela Correlação
Quanto maior a explicação, melhor a Correlação
É a explicação que dá qualidade a Correlação
Quando a explicação é baixa, outros fatores afetam a Correlação
Equação da ExplicaçãoE = r2*100 Onde r é o Coeficiente de Correlação Linear
Situações
r = 0,9 => 81% da variação é explicada
r = 0,7 => 49% da variação é explicada
Exercícios
Obtenha dados reais, de sua área funcional, para fazer uma análise de Correlação Linear.
Comente os resultados, do ponto de vista prático.
Análise de Regressão
Significado
Modelo de Regressão
Parâmetros de Regressão
Erro padrão de estimativa
SignificadoDescrever funcionalmente a relação entre X e Y: y = f(x)
Obter uma função que forneça pequenos desvios entre valores reais e os por ela gerados
O grau de explicação, previamente obtido, precisa ser alto
Aplicação prática
Predizer o valor de uma variável, a partirde um valor de outra variável
As variáveis não precisam ter as mesmas unidades de medidas
No caso de duas variáveis, a função é afim, y = a + bx.
Quando a função é uma reta
Considere os pares (10, 50) e (14, 40). Qual reta passa entre eles?
35
40
45
50
55
10 11 12 13 14 15
Equação de uma reta: y = a + bx
35
40
45
50
55
10 11 12 13 14 15
Inclinação da reta: b = (40 – 50) / (14 - 10) = -2,5
Intercepto: a = 50 – (-2,5)*10 = 75
y = 75 -2,5x
Modelo de Regressão
Função: y = a + bx
Desvio
Visão analítica
Modelo de RegressãoRegressão Linear: y = a + bx
Onde: a é o valor do intercepto da reta com o eixo Y;
b é o valor da inclinação da reta.
Considerações Matemáticas: para y = a + bx
(i) y = n.a - b x , e
(ii) xy = a x - b x² ,
onde n é o número de pares (X,Y)
Parâmetros da Regressão
Finalmente, com o método de desvios mínimos quadrados, e as duas equações (i) e (ii), tem-se
é a média de Y; é média de X
n é número de pares (X,Y).
n.x.y) - (x).(y)
n.x2) - (x)2b =
XbYa *
n
yY
n
xX
Calculando previsões
Pode-se calcular valores previstos para Y a partir de um valor de X.
O mesmo vale para valores de X a partir de valores de Y.
Para isto, basta substituir o valor conhecido na reta e obter o valor desejado
Calculando previsõesA soma das previsões de Y para cada valor original de X, é igual à soma dos valores originais de Y:
yp = y
Isto prova a consistência do modelo de regressão, caso o grau de explicação seja aceitável.
Exemplo
Obtenha a reta de regressão e calcule quantas horas precisariam ser programadas para obter-se um faturamento de R$ 1500
Y = valor do faturamento (R$)X = horas de Programação
DADOS:
MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811
Erro padrão de estimativa
Como foi verificado há desvios, embora mínimos, na regressão.
Logo, também haverá nos valores previstos, calculados a partir da reta de regressão.
É preciso, portanto, quantificar esse erro de previsão.
Erro padrão de estimativa A equação que quantifica o erro padrão é:
Onde: Yp são os valores previstos de Y para cada valor original de X;
Y são os valores originais da variável Y;
n é o número de pares (X,Y).
Cada previsão estará sujeita a este erro, para mais ou para menos.
2
2
n
YpYSe
Exercícios
Obtenha dados reais, de sua área funcional, para fazer uma análise de Regressão Linear.
Comente os resultados, do ponto de vista prático.
Transformações Lineares
Quando a relação entre (X,Y) não é linear, é possível aplicar uma transformação nos valores de X, de Y, ou de ambos
É preciso marcar um diagrama de dispersão, avaliar qual transformação aplicar, aplicá-la e realizar a análise de regressão
Para realizar alguma previsão é preciso aplicar o inverso da transformação, para manter a consistência dos valores
Transformações Lineares Uma das tranformações muito aplicadas é a função LOGARÍTMICA: y = axb
Ou seja, log (y) = log ( axb), mas
log (axb) = log (a) + log (xb), e log (xb) = b log (x)
Portanto, a função será: log (y) = log (a) + b log (x)
Transformações Lineares
Outras tranformações aplicadas são:
a função POTÊNCIA
e a função EXPONENCIAL
Os procedimentos são os mesmos da função LOGARÍTMICA: transforma os dados, realiza a análise; e inverte a transformação para calcular previsões.
top related