estatística i - 2008
Post on 06-Jun-2015
3.913 Views
Preview:
DESCRIPTION
TRANSCRIPT
ESTATÍSTICA IESTATÍSTICA I
EstatEstatíística stica II
Antonio A. Crespo define Estatística como : Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados quantitativos e qualitativos, e a utilização desses dados para a tomada de decisão.
Definição
AnAnáálise Exploratlise Exploratóória de Dadosria de Dados
Amostra
Conclusões
sobre as
características
da população
Informações
contidas nos
dados
População
(características)
Técnicas de
Amostragem
Análise
Exploratória
Inferência
Estatística
Introdução
AnAnáálise Exploratlise Exploratóória de Dadosria de Dados
Utilidade da Estatística na Gestão A Estatística permite: • Resolver problemas mediante a coleta de dados de boa qualidade• Argumentar utilizando dados• Analisar e interpretar dados• Detectar situações fora de controle e outras fontes de dificuldades que requerem atenção e medidas corretivas• Coletar evidências para fins legais•Determinar ociosidade de recursos e eficiência na utilização dos mesmos•Determinar custos de atividades, de produtos, de unidades organizacionais etc•Melhorar a qualidade de dados, desempenhos, decisões, ações, produtos, processos e serviços
AnAnáálise Exploratlise Exploratóória de Dadosria de Dados
Algumas Dificuldades com a Estatística • Culturais / Rejeição às "matemáticas" / Contato prematuro inadequado
• “Invisibilidade” da Estatística
• Armadilha da atividade
MMéétodo Estattodo Estatíístico stico
O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas as causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.
MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO
As fases são :
• Coletas de dados : é a obtenção, reunião e registro sistemático de dados, com um objetivo determinado.
• Direta : quando é obtida diretamente da fonte e pode ser :
- Contínua : Obtida ininterruptamente- Registro de nascimentos, etc.
- Periódica : em períodos curtos
- Censos
- Ocasional : esporadicamente
- Surto epidêmico
• Indireta : Quando é inferida ( deduzida ) a partir dos elementos
conseguidos pela coleta direta
- Mortalidade infantil
MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO
Crítica dos dados : devem ser criticados à procura de
erros grosseiros ou de certos vultos, que possam influir
sensivelmente nos resultados como:
- Externa : Informante
- Interna : dados da coleta
Apuração dos dados :é a soma e o processamento dos
dados obtidos e a disposição mediante critérios de
classificação.
MMÉÉTODO ESTATTODO ESTATÍÍSTICOSTICO
Exposição dos dados : devem ser apresentados sob forma de
tabelas ou gráficos tornando mais fácil e
compreensão do objeto de tratamento
estatístico
Análise dos resultados : É o estudo dos resultados com o objetivo
de tirar conclusões sobre o todo
(população), a partir de informações
fornecidas por parte representativa do
todo ( amostra).
PopulaPopulaçção e Amostra ão e Amostra
População : é o conjunto de entes portadores de , pelo menos, uma característica comum
Amostra : é um subconjunto finito de uma população
POPULAPOPULAÇÇÃO E AMOSTRAÃO E AMOSTRA
Devido a quantidade excessivamente grande de elementos que constantemente fazem parte da população, trabalhamos com uma amostra.
O aspecto comum dentre todas as técnicas existentes é a aleatoriedade, isto é, a igual chance que cada elemento da população deve ter de ser escolhido, as principais:
a) Casual Simples - sorteio
b) Sistemática - Os elementos já se encontram ordenados e então, sorteamos um número e sistematicamente os outros ficam determinados
c) Estratificada - Quando a população esta dividida em estratos de acordo com o fato em estudo
VariVariáávelvel
Variáveis
Qualitativas
Quantitativas
Nominais
Ordinais
Discretas
Contínuas
Variável - é convencionalmente, o conjunto de resultados possíveis de um fenômeno Tipos de variáveis
VariVariáávelvel
Exemplo ( Variáveis em uma ficha cadastral PF )
Variável Tipo
1 Número de dependentes Quantitativa, discreta
2 Idade Quantitativa, contínua
3 Local de nascimento Qualitativa, nominal
4 Nível educacional Qualitativa, ordinal
5
6
7
8
VariVariáávelvel
DISCRETA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos de série e na segunda coluna colocamos os valores das freqüências simples correspondentes.
Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno
xi = número de filhos
fi = freqüência absoluta
0 1
1 5
2 6
3 10
total 22
VariVariáávelvel
CONTÍNUA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna faixa de valores agrupados em ordem crescente da série e na segunda coluna coloca os valores das freqüências simples correspondentes.
Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande.
xi = número de filhos
fi = freqüência absoluta
2 /------ 4 4
4 /------ 6 12
6 /------ 8 10
8 /------ 10 4
total 30
Conceitos a serem aplicadosConceitos a serem aplicados
- Amplitude total de uma seqüência = é a diferença entre o Limite superior e o Limite inferior de uma seqüência. At = Ls – Li
- Intervalo de Classe = é qualquer subdivisão da amplitude total de uma série estatística. 2 /------ 4
- Limite de Classe = cada intervalo de classe fica caracterizado por dois números reais. O menor valor chamado de Limite inferior (Li) da classe e o maior valor chamado de Limite superior (Ls) da classe. 2 = Li e 4 = Ls
- Amplitude do intervalo de classe = é a diferença entre o Ls e o Li do intervalo de classe. A = Ls – Li 4-2 = 2 A = 2
- Freqüência simples ou absoluta de uma classe (fi) = é o número de elementos da seqüência que são maiores ou iguais ao Li desta classe e menores que o Ls desta classe.
DistribuiDistribuiçção de Freqão de Freqüüências ências
Freqüência Relativa (fir%) = é a divisão da freqüência simples deste elemento pelo número total de elementos da série:
fir = fi / n onde n ou somatória de fi, é o número total de elementos da série.
Ex: fir = 4 / 30 = 0,1333 ou 13,33%
DistribuiDistribuiçção de Freqão de Freqüüências ências
Freqüência Acumulada (fiac) = é a soma de fi simples deste elemento com as fi dos elementos que o antecedem.
fiac = fi1 + fi2 + fi3 ...fin
Freqüência acumulada relativa (firac%) = é a divisão da freqüência acumulada deste elemento pelo número total de elementos da série.
DistribuiDistribuiçção de Freqão de Freqüüências ências
xi fi fir% fiac firac%
0 1 3,33 1 3,33
1 5 16,67 6 20,00
2 6 20,00 12 40,00
3 10 33,34 22 73,34
4 4 13,33 26 86,67
5 4 13,33 30 100
Total 30 100
DistribuiDistribuiçção de Freqão de Freqüüênciasências
xi fi fir% fiac firac%
2 /------ 4 4 13,33 4 13,33
4 /------ 6 12 40,00 16 53,33
6 /------ 8 10 33,34 26 86,67
8 /------ 10 4 13,33 30 100
Total 30 100
RepresentaRepresentaçção Grão Grááfica - fica - HistogramaHistograma
0,34
0,26
0,12
0,16
0,04 0,04
0,02 0,02
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
5,5 13,5 21,5 29,5 37,5 45,5 553,5 61,5
Tributo ( % faturamento )
Pro
po
rção
RepresentaRepresentaçção Grão Grááfica - fica - HistogramaHistograma
Histograma Área = 1.00 ( ou 100% ) Área ~ freqüência ( f ou p ) Classes de mesma amplitude : altura ~ freqüência ( f ou p ) Notas :
Histograma é a representação gráfica adequada para o caso de variáveis contínuas
Pode ser utilizada para variáveis discretas agrupadas em classes
RepresentaRepresentaçção Grão Grááfica fica PolPolíígono de % acumuladagono de % acumulada
0
10
20
30
40
50
60
70
80
90
100
1.5 9.5 17.5 25.5 33.5 41.5 49.5 57.5 65.5
Tributo ( % faturamento )
% a
cum
ula
da
RepresentaRepresentaçção Grão Grááfica fica PolPolíígono de % acumuladagono de % acumulada
Mostra a porcentagem de empresas cujo recolhimento de tributos é menor ou igual a um dado valor Podemos ter também:
Polígono de freqüências acumuladas
Polígono de proporções acumuladas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
Alguns Padrões de HistogramasAlguns Padrões de Histogramas
• Tendência Central de um conjunto de
dados é a tendência das medidas destes
dados em se acumular em torno de certos
valores numéricos.
Medidas de Tendência CentralMedidas de Tendência Central
• É a soma das medidas dividida pelo número
de elementos do conjunto de dados.
• Vantagens – reflete cada valor e possui
propriedades matemáticas atraentes.
• Limitações – é influenciada por valores
extremos.
Medidas de Tendência CentralMedidas de Tendência Central
Exemplo :• Calcule a média dos seguintes grupos de dados:
1, 2, 3, 4, 5 e
2, 3, 3, 3, 4
n
xx
n
ii
1
Medidas de Tendência CentralMedidas de Tendência Central
Mediana - Para números aleatórios• É o valor intermediário de um conjunto de medidas
colocadas em ordem crescente (ou decrescente).
Vantagens - muito interessante para grande massa de dados - divide a área do histograma em partes iguais.- menos suscetível a valores extremos.Limitações – difícil de determinar para grande quantidade de
dados.
Medidas de Tendência CentralMedidas de Tendência Central
Média e Mediana
Sua comparação indica a assimetria da distribuição.
MedianaMédia
Medidas de Tendência CentralMedidas de Tendência Central
Moda - Para números aleatórios
• É a medida que ocorre com maior freqüência no conjunto de dados.
– Exemplo: notas de degustadores de vinho:
8, 7, 9, 6, 8, 10, 9, 9, 5, 7.Moda: 9
Medidas de Tendência CentralMedidas de Tendência Central
Moda• Vantagens- indica onde os dados tendem a se concentrar.- útil para dados qualitativos (Ex. notas de jurados).- pode haver mais de uma ou não ter sentido (Ex.
pesquisa de lazer).
• Limitações - não se presta a análise matemática;- pode não ser moda para certos conjuntos de dados.
Medidas de Tendência CentralMedidas de Tendência Central
Exemplo:
• Preferência do produto A (em %) colhida em diversas regiões do Brasil por meio de uma pesquisa de mercado.
56, 63, 64, 65, 66, 69, 71, 57,64, 66, 64, 65, 66, 66, 68 e 72.
N = 16
x = 1042
Média = 65,125Mediana = 65,5
Moda =66
Medidas de Tendência CentralMedidas de Tendência Central
Média Para variáveis discretas• Se os dados estão apresentados na forma de uma variável
discreta, utilizamos a média ponderada, considerando as freqüências (fi) como sendo as ponderações dos elementos (xi) correspondentes.
xi = número de filhos
fi = freqüência absoluta
fi * xi
0 1 0
1 5 5
2 6 12
3 10 30
total 22 47
Média =
47 / 22 =
2,14 filhos
Medidas de Tendência CentralMedidas de Tendência Central
Mediana para variáveis discretas• Para encontrarmos a mediana, dividimos por dois o total das
freqüências absolutas ( 22 / 2 = 11) e calculamos a Freqüência acumulada (fiac)
• Procuramos qual xi que conta o número (11) na Fi xi = 2
xi = número de filhos
fi = freqüência absoluta
fiac
0 1 1
1 5 6
Mediana = 2 6 12 (11)
3 10 22
total 22
Mediana = 2
filhos
Medidas de Tendência CentralMedidas de Tendência Central
Moda para variáveis discretas• Para encontrarmos a moda, basta verificar o elemento xi de maior
freqüência (fi).
xi = número de filhos
fi = freqüência absoluta
0 1
1 5
2 6
Moda = 3 10
total 22
Moda = 3 filhos
Medidas de Tendência CentralMedidas de Tendência Central
Média para variáveis contínuas
Se os dados estão apresentados na forma de uma variável contínua,utilizaremos a média aritmética ponderada, considerando as freqüências (fi) de cada classe ponderando com o ponto médio destas classe. PM = ((Li + LS) / 2)
Média = Somatória de PM*fi / somatória de fi
178 / 30 = 5,93 filhos
Medidas de Tendência CentralMedidas de Tendência Central
xi = número de filhos
Ponto Médio (PM)
fi = freqüência
absoluta
PM * fi
2 /------ 4 3 4 12
4 /------ 6 5 12 60
6 /------ 8 7 10 70
8 /------ 10 9 4 36
total 30 178
xi = número de filhos
fi = freqüência absoluta
fiac
2 /------ 4 4 4
4 /------ 6 12 16 (15)
6 /------ 8 10 26
8 /------ 10 4 30
total 30
Mediana para variáveis contínuas
• Para encontrarmos a mediana, dividimos por dois o total das freqüências absolutas ( 30 / 2 = 15) e calculamos a Freqüência acumulada (fiac)
•Procuramos qual xi que conta o número (15) na fiac xi = 4 /---6
Este será o intervalo que usaremos como base para resolvermos a fórmula da mediana.
Medidas de Tendência CentralMedidas de Tendência Central
Mediana para variáveis contínuas
• Fórmula da Mediana para variáveis contínuas
hfi
fiacnLimd
ant
.2/
Onde : Li = Limite inferior do intervalo de classe 4n = Total de fi 30fiacant = freqüência acumulada anterior ao intervalo de
classe 4fi = freqüência do intervalo de classe 12h = amplitude da classe = Ls – Li 6 – 4 = 2
Medidas de Tendência CentralMedidas de Tendência Central
Mediana para variáveis contínuas
• Então :2.
12
42/304
md
83,5md
Obs: o valor obtido pela fórmula é um valor aproximado
Medidas de Tendência CentralMedidas de Tendência Central
Moda para variáveis contínuas
• Fórmula da Moda para variáveis contínuas
Onde : Li = Limite inferior do intervalo de classe 4fipost = freqüência absoluta posterior ao intervalo de classe 10fiant = freqüência absoluta anterior ao intervalo de
classe 4h = amplitude da classe = Ls – Li 6 – 4 = 2
hfifi
fiLimo
antpost
post.
Medidas de Tendência CentralMedidas de Tendência Central
Moda para variáveis contínuas
Então:
2.410
104
mo
43,5mo
Medidas de Tendência CentralMedidas de Tendência Central
Exercícios de aplicação
• São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média.
• Desvio Médio• Variância• Desvio-Padrão• Coeficiente de variação
Medidas de DispersãoMedidas de Dispersão
• Desvio Médio = é a média dos desvios dos valores a contar de média. Ignorando-se o sinal de diferença
.fi
Medidas de DispersãoMedidas de Dispersão
• Variância = é a média dos quadrados dos desvios dos valores a contar da média, calculada usando-se n-1 em lugar de n, como fator de ajuste.
1
n
xxiS2
2
.fi
Medidas de DispersãoMedidas de Dispersão
• Desvio-padrão = é simplesmente a raiz quadrada positiva da variância.
2ss
Medidas de DispersãoMedidas de Dispersão
• Coeficiente de variação = trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas.
100.X
SCV
Medidas de DispersãoMedidas de Dispersão
xi = número de filhos
fi xi * fi
xi - x /xi-x/ * fi
(xi-x)2 * fi
0 1 0 -2,14 2,14 4,58
1 5 5 -1,14 5,7 6,50
2 6 12 -0,14 0,84 0,12
3 10 30 0,86 8,6 7,40
total 22 47 17,28 18,6
Média=2,14
DM = 0,79
S2 = 0,89
S = 0,94
CV = 43,93%
Para variáveis contínuas xi = PM
Medidas de DispersãoMedidas de Dispersão
Exercícios de aplicação
•Freqüência e probabilidade
•Eventos
•Definição subjetiva de probabilidade
ProbabilidadeProbabilidade
Resultados do lançamento de um dado (n=10 lançamentos)
Resultado do dado
Número de ocorrências do resultado (f)
Freqüência(f/n)
1
2
3
4
5
6
1
0
1
2
3
3
0,1 ou 10%
0
0,1 ou 10%
0,2 ou 20%
0,3 ou 30%
0,3 ou 30%
Freqüência é o percentual de ocorrencia de uma Freqüência é o percentual de ocorrencia de uma determinada observação dentro de uma amostradeterminada observação dentro de uma amostra
Resultados do lançamento de um dado
Resultado do dado
1
2
3
4
5
6
Número de ocorrências do resultado (f)
Freqüência(f/n)
1/6 * n
1/6 * n
1/6 * n
1/6 * n
1/6 * n
1/6 * n
16,7%
16,7%
16,7%
16,7%
16,7%
16,7%
Núm. de ocorrências do resultado (f)
Freq. Rela(f/n)
11
6
7
7
7
12
0,22 ou 22%
0,12 ou 12%
0,14 ou 14%
0,14 ou 14%
0,14 ou 14%
0,24 ou 24%
n = 50 lançamentos n =
Portanto, a probabilidade pode ser encarada como o limite da freqüênciade um determinado evento dentro da população em estudo
A medida que a amostra cresce, a freqüência se A medida que a amostra cresce, a freqüência se estabiliza: temos então a probabilidadeestabiliza: temos então a probabilidade
0,0
0,1
0,2
0,3
0,4
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
n = 10 n = 50 n = infinito
Representação gráfica dos resultados obtidos no lançamento repetido de um dado (n = número de lançamentos)
A freqüência pode ser representada graficamenteA freqüência pode ser representada graficamente
• Freqüência e probabilidade• Eventos
– Representações gráficas– Compostos– Condicionais– Dependentes e independentes
• Definição subjetiva de probabilidade
ProbabilidadeProbabilidade
Diagrama de árvoreDiagrama de árvore Diagrama de VennDiagrama de Venn
Formas de representação gráfica de eventosFormas de representação gráfica de eventos
Representação dos eventos possíveis para o sexo de cada criança de um casal que tenha três filhos
Criança 1 Criança 2 Criança 3
M
F
Resultado final
M
F
M
F
MF
MF
MFMF
M, M, M
M, M, FM, F, MM, F, FF, M, MF, M, FF, F, MF, F, F
A árvore permite a representação exaustiva dos A árvore permite a representação exaustiva dos eventoseventos
Agrupamento de casais segundo o sexo dos filhos
Casais com meninos somente Casais com
meninas somente
Casais com meninos e meninas
O diagrama de Venn é adequado ao agrupamentos dos O diagrama de Venn é adequado ao agrupamentos dos eventos de interesseeventos de interesse
M
F
M
F
MM
M
M
M
F
F
F
F
F
M
F
M
F
MM
M
M
M
F
F
F
F
F
M
F
Agrupamento de casais com quatro filhos e pelo menos duas meninasM, M, M, M
M, M, M, F
M, M, F, MM, M, F, FM, F, M, M
M, F, M, F
M, F, F, M
M, F, F, F
F, M, M, M
F, M, M, F
F, M, F, MF, M, F, FF, F, M, M
F, F, M, F
F, F, F, MF, F, F, F
Agrupamentodos resultadosque apresentemao menosduas meninas.
A combinação dos diagramas de árvore e de A combinação dos diagramas de árvore e de Venn permite representações mais complexasVenn permite representações mais complexas
Probabilidade de ocorrência do número 6 em um lançamento de dado,
condicionado ao resultado anterior ter sido 3.
Probabilidade de ocorrência do número 6 em um lançamento de dado,
condicionado ao resultado anterior ter sido 3.
Exemplo de evento independenteExemplo de evento independente
Resultado 1
3 1
2
3
4
5
6
Resultado 2 Probabilidade
1/6
1/6
1/6
1/6
1/6
1/6
•O resultado conhecido do primeiro lançamento não altera a probabilidade de
ocorrência do número 6 no segundo lançamento
•Mais formalmente, o evento B é independente se: P(B) = P(B | A)
•O resultado conhecido do primeiro lançamento não altera a probabilidade de
ocorrência do número 6 no segundo lançamento
•Mais formalmente, o evento B é independente se: P(B) = P(B | A)
Lançamentojá realizadoe resultadoconhecido!
Dependência e independência são termos que Dependência e independência são termos que obedecem a regras precisasobedecem a regras precisas
Exemplo de evento dependente
•Probabilidade de uma pessoa consumir requeijão e manteiga,dado que ela consome manteiga
Exemplo de evento dependente
•Probabilidade de uma pessoa consumir requeijão e manteiga,dado que ela consome manteiga
200130
Requeijão (R) Manteiga (M)
RM = 50
Não é consumidor: 20
•O resultado conhecido do consumo de manteiga altera a probabilidade de ocorrência do consumo dos dois produtos Mais formalmente, o evento B é dependente se:P(B) P(B | A)
•O resultado conhecido do consumo de manteiga altera a probabilidade de ocorrência do consumo dos dois produtos Mais formalmente, o evento B é dependente se:P(B) P(B | A)
•P(RM) = 50/300 = 1/6
•P(RM | M) = (50/300) / (200/300) = 1/4
Dependência e independência são termos que Dependência e independência são termos que obedecem a regras precisasobedecem a regras precisas
• Um casal com três crianças ter somente meninos
• Um casal com três crianças ter uma ou duas
meninas
• Um consumidor comprar requeijão e manteiga
Exemplos de eventos compostos
Eventos compostos são formados por dois ou mais eventosEventos compostos são formados por dois ou mais eventos
• Uma pesquisa com 300 pessoas, realizada em um supermercado, teve os seguintes resultados:– 130 pessoas consomem requeijão– 200 pessoas consomem manteiga– 50 pessoas consomem os dois
produtos– 20 pessoas não consomem nenhum
dos dois• Sabendo que uma pessoa escolhida ao
acaso é consumidora de manteiga, qual é a probabilidade de que ela também consuma requeijão?
• Uma pesquisa com 300 pessoas, realizada em um supermercado, teve os seguintes resultados:– 130 pessoas consomem requeijão– 200 pessoas consomem manteiga– 50 pessoas consomem os dois
produtos– 20 pessoas não consomem nenhum
dos dois• Sabendo que uma pessoa escolhida ao
acaso é consumidora de manteiga, qual é a probabilidade de que ela também consuma requeijão?
Descrição do casoDescrição do caso
Requei-jão
Sim
Não
Total
Sim
Não
To-tal
ManteigaTabela de respostas
50
150
80
20
130
170
200 100 300
O termo eventos condicionais indica que a ocorrência de um está condicionada à do outro
Antes da escolha do consumidorAntes da escolha do consumidor
200130
Requeijão (R) Manteiga (M)
RM = 50
Não é consumidor: 20
•Probabilidade de a pessoa ser consumidora dois produtos: P(RM) = 50/300 = 1/6 Neste caso, a incerteza é total. Você não sabe nada sobre a pessoa que foi escolhida. Portanto, a probabilidade de que ela consuma os dois produtos é simplesmente a freqüência de ocorrência desse tipo de consumidor na amostra
•Probabilidade de a pessoa ser consumidora dois produtos: P(RM) = 50/300 = 1/6 Neste caso, a incerteza é total. Você não sabe nada sobre a pessoa que foi escolhida. Portanto, a probabilidade de que ela consuma os dois produtos é simplesmente a freqüência de ocorrência desse tipo de consumidor na amostra
Após a escolha do consumidorApós a escolha do consumidor
200
Manteiga (M)
RM = 50
•Probabilidade de a pessoa ser consumidora dois produtos, condicionado a ela consumir manteiga: P(RM | M) = 50/200 = 1/4
•Neste caso, você sabe que pessoa consome manteiga, portanto os outros grupos de consumidores não devem ser considerados no cálculo. Em outras palavras, uma parte da incerteza foi eliminada.
•Probabilidade de a pessoa ser consumidora dois produtos, condicionado a ela consumir manteiga: P(RM | M) = 50/200 = 1/4
•Neste caso, você sabe que pessoa consome manteiga, portanto os outros grupos de consumidores não devem ser considerados no cálculo. Em outras palavras, uma parte da incerteza foi eliminada.
Sinal “condicionado a”
Em casos como esse, uma parte da incerteza já foi eliminada
• Probabilidade de um time ganhar de outro em uma partida de futebol
• Probabilidade de o mercado acionário subir amanhã
• Probabilidade de o lançamento de um novo produto ser um sucesso
Exemplos de eventos cuja probabilidade de ocorrência não pode ser (facilmente) determinada
Evento
Probabilidade não pode ser determinada
Probabilidade não pode ser determinada
Probabilidade pode ser estimada através de pesquisa de mercado, porém:
Estudo pode ser muito caroPesquisa não fornece, nem pode fornecer, 100% de certeza sobre o resultado do lançamento do produto
Comentário
Às vezes, não se pode determinar a probabilidade de um evento, ou pode ser muito demorado e custoso fazê-lo
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade– Binomial– Poisson
• Distribuições contínuas de probabilidade– Normal
Probabilidade
• Distribuição de probabilidade
– Uma distribuição de probabilidade é uma distribuição de freqüências para os resultados de um espaço amostral (isto é, para os resultados de uma variável aleatória).
Probabilidade
• Distribuições descontínuas de probabilidade– Binomial – Usa-se o termo binomial para designar situações em
que os resultados de uma variável aleatória podem ser agrupados em duas classes ou categorias.
– A utilização da binomial, exige certas hipótese como:• Há n observações ou provas idênticas• Cada prova tem dois resultados possíveis, um chamado “sucesso” e o
outro “fracasso”.• As probabilidades p de sucesso e 1 – p de fracasso permanecem
constantes em todas as provas.• Os resultados das provas são independentes uns dos outros.
Probabilidade
• Distribuições descontínuas de probabilidade– Fórmula da Binomial
)().()( fracassopsucessopx
nxP
x n-x
Onde: n = numero de amostrasx = número de sucessop(s) = percentual de sucessop (f) = percentual de fracasso
Probabilidade
• Binomial – suponha que 8% dos cachorros-quentes vendidos num estádio de beisebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro-quente, determine a probabilidade de que:– Todos queiram mostarda– Apenas um não queira
x n-x
Exemplo
)92,0).(08,0(0
7)(
xP
0 7a- =
0,5578
b-)92,0).(08,0(
1
7)(
xP =
0,3396
1 6
Exemplo
• Distribuição de probabilidade• Distribuições descontínuas de probabilidade
– Poisson – É útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço).
– A utilização da Poisson, exige certas hipótese como:• A probabilidade de uma ocorrência é a mesma em todo o campo
de observação.• A probabilidade de mais de uma ocorrência num único ponto é
aproximadamente zero.• O número de ocorrências em qualquer intervalo é independente do
número de ocorrências em outros intervalos.
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade– Formula de Poisson
x
exP
)()(
!
x
Onde: = média
x = número de ocorrências
e = valor tabelado
Probabilidade
Poisson – Uma mesa telefônica recebe chamadas a razão de 4,6 chamadas por minuto. Determine a probabilidade de cada uma das ocorrências abaixo:
1- Exatamente 2 chamadas2 -Nenhuma chamada
• 1
• 2
2
)6,4(0101,0)( xP
!
2
= 0,1063
0
)6,4(0101,0)( xP
!
0
= 0,0101
Exemplo
• Distribuições contínuas de probabilidade– Normal – É a mais importante distribuição de probabilidade, sendo aplicada em
inúmeros fenômenos e utilizada para desenvolvimento teórico da estatística. – As características das curvas normais são:
• A curva normal tem forma de sino• É simétrica em relação a média• Prolonga-se de – infinito a + infinito• Cada distribuição normal fica completamente especificada por sua média e
seu desvio padrão; há uma distribuição normal distinta para cada combinação de média e desvio padrão
• A área total sob a curva normal é considerado 100%• A área sob a curva entre dois pontos é a probabilidade de uma variável
normalmente distribuída tomar um valor entre esses pontos• A área sob a curva entre a média e um ponto arbitrário é função do número de
desvios padrões entre a média e aquele ponto.
Probabilidade
• Distribuições contínuas de probabilidade– Normal Fórmula
s
xxz
)(
)( x
z
amostrapopulação
Onde:
Z= número de desvios padrões a contar da média
X = valor arbitrário
= a média da distribuição normal
= o desvio padrão
Probabilidade
Normal – dado que uma população com média 25 e desvio padrão 2 tem distribuição normal, determine os valores de z para os seguintes valores da população:
a) 23,0 b)25,5
2
)2523( z
0,1z2
)255,25( z
1,0zCorresponde a 0,3413 ou 34,13% da área sobre a curva normal ou a probabilidade, conforme tabela z
Corresponde a 0,0398 ou 3,98% da área sobre a curva normal ou a probabilidade, conforme tabela z
Exemplo
• Regra de Chebyshev:• Ao menos 3/4 estará dentro de 2 s.• Ao menos 8/9 estará dentro de 3 s.• P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k desvios-padrão.
• Distribuição Normal• Aproximadamente 68% das medidas caem dentro de 1 s.• Aproximadamente 95% das medidas caem dentro de 2 s.• Aproximadamente 99,7% das medidas caem dentro de 3 s.
Desvio padrão : interpretação
• Aplicações de todos os conceitos estudados em exercícios práticos........
top related