trabalho de estatística
DESCRIPTION
Trabalho de EstatísticaTRANSCRIPT
TRABALHO DE ESTATÍSTICA
ÍNDICE
1.Teoria das Probabilidades.............................................32.Conceitos Fundamentais...............................................4
-Experimento Aleatório................................................4-Espaço Amostral.........................................................4-Eventos.......................................................................5-Operações com Eventos.............................................5-Eventos Especiais......................................................7
3.Conceitos de Probabilidade...........................................9-Definição Clássica.......................................................9-Definição Axiomática................................................9-Frequência Relativa.................................................10-Probabilidade Geométrica......................................11
4.Teoremas para cálculo de Probabilidades...................125. Probabilidade Condicional e Independência..............13
-Eventos Condicionados.............................................13-Eventos Independentes.............................................13-Regra do Produto.....................................................14
6.Variáveis Aleatórias....................................................15-Variável Aleatória Discreta.......................................15-Variável Aleatória Contínua.....................................19
7.Distribuição de Probabilidade de v.a.d e v.a.c............21-Distribuição Binomial................................................21-Distribuição de Poisson.............................................24-Distribuição Hipergeométrica...................................26-Distribuição de Bernoulli.........................................29-Distribuição Uniforme............................................30-Distribuição Exponencial.......................................31-Distribuição Normal..............................................33-Normal Padrão......................................................34
.Tabela de distribuição normal padronizada Z...............37
ÍNDICE DE FIGURAS-Operações com Eventos.............................................................6-Probabilidade Geométrica.......................................................11-Distribuição Normal Padronizada..........................................36
2
1.Teoria das Probabilidades
Uma probabilidade é o valor numérico que representa a chance, a probabilidade ou a possibilidade de que um determinado evento venha a ocorrer.
A probabilidade de um evento ocorrer corresponde a uma proporção ou fração cujo valor se estende entre 0 e 1.
Um evento que não apresente nenhuma chance de ocorrência (o evento impossível) tem uma probabilidade igual a 0 (zero). Um evento cuja ocorrência seja garantida (ou seja, evento certo) apresenta uma probabilidade igual a 1.
3
2. Conceitos Fundamentais
-Experimento Probabilístico ou Aleatório
Um experimento que pode fornecer diferentes resultados, muito embora seja repetido toda vez da mesma maneira, é chamado de um experimento aleatório.
Exemplo:
Ao lançar um dado uma vez, obtém-se o valor 3. Caso seja lançado o mesmo dado, da mesma maneira outra vez, este pode dar um valor diferente de 3, podendo assumir valores de 1 a 6. De fato, não há como prever o resultado do dado a partir de experimentos passados, o que caracteriza um experimento aleatório.
-Espaço Amostral
Espaço amostral é a coletânea de todos os eventos possíveis em um experimento. Denota-se por S.
Exemplo:
No caso do anterior do dado, o espaço amostral é S = {1,2,3,4,5,6}, pois o dado pode assumir valores de 1 a 6.
4
-Eventos
Cada resultado possível de um experimento é chamado de um evento.
Exemplo:
Ainda usando o exemplo do dado, ao lança-lo existem 6 eventos possíveis, pois o dado possui 6 faces.
-Operações com Eventos
. A união de dois evento é o evento que consiste em todos os resultados que estão contidos em cada um dos dois eventos. Denotamos a união por E1 U E2.
. A interseção de dois eventos é o evento que consiste em todos os resultados que estão contidos nos dois eventos, simultaneamente. Denotamos a interseção por E1 ∩ E2.
. O complemento de um evento em um espaço amostral é o conjunto dos resultados no espaço amostral que não estão no evento. Denotamos o complemento do evento E por E’.
5
Imagem 1: união dos conjuntos A e B
Imagem 2: interseção dos conjuntos A e B
Imagem 3: complementar do conjunto A
6
-Eventos Especiais
.Evento Impossível: evento que não faz parte do espaço amostral e, portanto, tem probabilidade de ocorrer igual a zero.
Exemplo: A probabilidade de ao jogar um dado obter como resultado o número 7 é exemplo de evento impossível, pois o espaço amostral é composto apenas por números de 1 a 6.
.Evento Certo: evento que engloba todo o espaço amostral e que, portanto, tem probilidade de ocorrer igual a 1.
Exemplo: Ao jogar uma moeda, a probabilidade de dar cara ou coroa é igual a 1, pois são as únicas alternativas possíveis. O que caracteriza um evento certo.
.Eventos mutuamente exclusivos: São eventos que não compartilham elementos entre sí, ou seja, eventos cuja interseção é nula. Para que um evento ocorra, o outro, necessariamente, não pode ocorrer.
Exemplo: A probabilidade de, ao jogar uma moeda, o resultado dê cara e coroa é zero, pois esses dois eventos (que dê cara e que dê coroa) são mutuamente excludentes.
7
.Evento Elementar: É aquele formado por um único elemento do espaço amostral.
Exemplo: O evento “tirar 6” ao jogar um dado é exemplo de evento elementar, porque é formado apenas pelo elemento 6 do espaço amostral.
.Eventos Equiprováveis: São eventos que têm a mesma probabilidade de acontecer.
Exemplo: Dar cara e dar coroa são dois eventos equiprováveis, pois ambos têm 50% de chance de ocorrer.
8
3.Conceitos de Probabilidade
-Definição Clássica de Probabilidade
A probabilidade de sucesso é baseada no conhecimento prévio do processo envolvido. No caso mais simples, em que cada um dos resultados está igualmente propenso a ocorrer, a chance de ocorrência do evento é definida por:
Probabilidade de ocorrência = X/T
onde,
X = número de maneiras em que o evento ocorreT = número total de resultados possíveis
-Definição Axiomática de Probabilidade
Dado um experimento aleatório E, e S o espaço amostral de um evento A – P(A) – é uma função definida em S que associa a cada evento um número real, satisfazendo os seguintes axiomas:
0 < P(A) <1P(S) = 1
Se A e B forem eventos mutuamente exclusivos, então:P(AUB) = P(A)+P(B)
9
-Frequência Relativa
Frequência relativa é a razão entre o número de eventos que estão contidos no conjunto de interesse do experimento e o número total de eventos do espaço amostral.
Exemplo: Ao jogar um dado, quero que o número dado seja par, então:
Frequência relativa = 3/6
Onde 3 representa o número de elementos pares e 6 representa o número total de eventos no espaço amostral.
10
-Probabilidade Geométrica
Consiste em utilizar da representação gráfica do problema no plano cartesiano para resolve-lo, ou por causa da natureza do problema em sí, ou para facilitar o cálculo.
Exemplo:
Dois amigos que pegam o metrô para o trabalho na mesma estação costumam chegar entre 7:00 e 7:20 da manhã na estação. Eles ficam no máximo 5 minutos esperando um pelo outro, após essa espera eles pegam o metrô com ou sem companhia. Qual a probabilidade deles se encontrarem na estação?
No plano cartesiano de coordenadas (s,t), um quadrado de lado 20 (minutos) representa todas as possibilidades de chegadas dos dois amigos na estação.
Imagem 4: Probabilidade geométrica
11
A área cinza (A) é formada a partir de duas retas, t = s+5 e t = s-5, e representa as possibilidades em que os dois amigos se encontram. Essa probabilidade é dada pela razão entre a área A e a área do quadrado:
[400 – (15x15/2 + 15x15/2)] / 400 = 7/16
4.Teoremas para cálculo de Probabilidades
- Se A é um conjunto vazio, então: P(A) = 0- Se Ac é complemento de A, então: P(Ac) = 1 –
P(A)- Se A B, então = P(A)⊂ ≤ P(B)- P(A) P(B) = P(A) + P(B) – P(A)∪ ∩ P(B)
12
5. Probabilidade condicional e independência
-Eventos Condicionados
A probabilidade condicional refere-se à probabilidade de ocorrer um evento A, tendo ocorrido um evento B.
P(A|B) = P(A e B) / P(A)
Exemplo:
A probabilidade de tirar uma carta de Rei de um baralho é de 1/13. No entanto, se alguém retira uma carta e nos diz que é uma figura, então a probabilidade da carta ser um Rei é 1/3. Ou seja, P(sair um rei|sair uma figura) = 1/3.
-Eventos Independentes
Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro, e vice-versa.
Exemplo: Ao jogar uma moeda duas vezes, o resultado obtido em uma jogada não afeta o resultado da seguinte, e vice-versa.
13
-Regra do Produto
Considere um conjunto finito um conjunto de eventos tais que os eventos condicionais tenham probabilidades positivas. Então temos que
usando a definição da probabilidade condicional podemos reescrever a igualdade acima como:
Com caso particular temos que, dados dois eventos e , concluímos que a probabilidade de ocorrência simultânea dos eventos e é igual a probabilidade de ocorrência do evento (ou ) vezes a probabilidade de ocorrência do evento (ou ) dado que ocorreu o evento (ou ), ou seja
14
6.Variáveis Aleatórias
Variável aleatória é uma função que transforma um espaço amostral qualquer em um espaço amostral numérico, que será sempre subconjunto do conjuntos dos números reais.
-Variável Aleatória Discreta
Variáveis numéricas discretas produzem resultados que advêm de um processo de contagem (por exemplo, o número de revistas que você assina).
.Função de Probabilidade (Unidimensional)
Seja X uma variável aleatória discreta e Sx o seu espaço amostral. A função de probabilidade P(X=x) será a função que associa a cada valor de X a sua probabilidade de ocorrência, desde que satisfaça duas condições:
1- P(X-x) ≥ 0, para todo x pertencente a Sx2- ∑ P(X-x) = 1
15
.Função de Distribuição de Probabilidades (FDP)
Seja X uma variável aleatória discreta e Sx o seu espaço amostral. A função de distribuição, definida por F(X) é uma função que associa a cada valor de X a probabilidade P(X≤x)
.Valor esperado
A média aritmética, µ, de uma distribuição é o valor esperado de sua respectiva variável aleatória.
µ = E(X) = Σ XiP(Xi)
Xi = o i-ésimo resultado para a variável aleatória, X.P(Xi) = probabilidade de ocorrência do i-ésimo resultado de X.
Propriedades:
1 - Se c é uma constante, então:E(c) = c
2 - Se X é uma v.a. e c uma constante, então:E(c+X) = c + E(X)
3 - Se X é uma v.a. e c uma constante, então:E(cX) = cE(X)
16
4 - A média dos desvios é igual a zero.E(X- µ) = 0
5 - A média dos desvios quadráticos é mínima.E(X- µ)ˆ2 < E(X-c)ˆ2 = 0
6 - Se X e Y são duas v.a. independentes, então:E(XY) = E(X)E(Y)
7 - Se X e Y são duas v.a., então:E(X ± Y) = E(X) ± E(Y)
.Variância
Seja X uma v.a. discreta e Sx o seu espaço amostral. O grau médio de dispersão dos valores de X em relação a sua média é conhecido como variância que é representada por V(X), ou simplesmente σˆ2, e definida como a média dos quadrados dos desvios em relação a média. Sendo assim, temos:
V(X) = σˆ2 = E(X- µ)ˆ2 = Σ(x- µ)ˆ2p(x)
Propriedades:
1 - Se k é uma constante, então:V(k) = 0
17
2 - Se X é uma v.a. e c uma constante, então:
V(X+c) = V(X)
3 - Se X é uma v.a. e k uma constante, então:X(kX) = kˆ2V(X)
4 - Se X e Y são duas v.a. independentes, então:V(X±Y) = V(X) + V(Y)
.Desvio Padrão
A partir da variância podemos obter o desvio padrão, denotado por σ e definido como a raiz quadrada da variância.
18
-Variável Aleatória Contínua
São contínuas todas as variáveis cujo espaço amostral Sx é infinito e não numerável. Assim, se X é uma v.a. contínua, então X pode assumir qualquer valor num intervalo [a;b] e o conjunto Sx será sempre definido como um intervalo.Variáveis numéricas contínuas produzem resultados que advêm de um processo de medição (por exemplo, a sua altura).
.Função Densidade de Probabilidade
Seja X uma v.a. contínua e Sx o seu espaço amostral. Uma função f associada a variável X é denominada função densidade de probabilidade se satisfizer duas condições
19
.Função Distribuição
Seja X uma variável aleatória continua e Sx o seu espaço amostral. A função de distribuição, definida por F(X) ou P(X≤x), é a função que associa a cada valor de x pertencente a Sx a sua probabilidade acumulada P(X≤x). Desta forma, temos:
Sendo Sx = [a,b], temos
F(a) = P(X≤a) = 0F(b) = P(X≤b) = 1
.Valor Esperado
Seja X uma v.a. contínua e Sx o seu espaço amostral. O valor médio de X, representado por E(X) ou µ, será dado por:
Sempre que a função for par e, portanto, simétrica f(µ) = 1/2
20
.Variância
Seja X uma v.a. contínua e Sx o seu espaço amostral. A variância de X, representada por V(X) ou σˆ2, será dada por:
7.Distribuição de Probabilidade de Variáveis Discretas e Contínuas
-Distribuição Binomial
A distribuição binomial é utilizada quando a variável aleatória de interesse é o número de eventos de interesse em uma amostra composta por n observações. A distribuição binomial possui quatro propriedades básicas:
. A amostra consiste em um número fixo de observações.
. Cada observação é classificada como uma dentre duas categorias mutuamente excludentes e coletivamente exaustivas.
21
. A probabilidade de uma observação ser classificada como o evento de interesse, π, é constante, de observação para observação. Assim, a probabilidade de uma observação ser classificada como não sendo o evento de interesse, 1 - π, é constante em relação a todas as observações.. O resultado de qualquer observação é independente do resultado de qualquer outra observação. Para assegurar a independência, as observações podem ser selecionadas aleatóriamente, seja a partir de uma população infinita sem reposição ou com reposição, seja a partir de uma população finita com reposição.
Para o caso do número de observações, n, ser muito grande, convém usar a fórmula a seguir:
em que
P(X = x|n,π) = probabilidade em que X = x eventos de interesse, dados n e πn = número de observaçõesπ = probabilidade de um evento de interesse1 - π = probabilidade de não haver um evento de interessex = número de eventos de interesse na amostra
= o número de combinações de x eventos de interesse dentre n observações
22
Exemplo:
Se a probabilidade de um formulário de pedidos etiquetado for 0,1, qual a probabilidade de que existam três formulários de pedidos de compra etiquetados na amostra de quatro pedidos?
.Média Aritimética
A média aritmética, μ, da distribuição binomial é igual ao tamanho da amostra, n, multiplicado pela probabilidade de um evento de interesse, π.
Exemplo: Em média, no longo prazo, você espera, teoricamente, μ = 4(0,1) = 0,4 formulário de pedidos de compra etiquetado em uma amostra com quatro pedidos de compra.
23
.Desvio Padrão
Exemplo: O desvio padrão para o número de formulários de pedidos de compra etiquetados é
-Distribuição de Poisson
Exemplos de variáveis que seguem a distribuição de Poisson são: defeitos na superfície de uma geladeira nova; o número de falhas na rede informatizada em um determinado dia e o número de pessoas que chegam em um banco. Você pode utilizar a distribuição de Poisson para calcular as probabilidades em situações como essas, contanto que sejam verificadas as seguintes propriedades:
. Você está interessado em contar o número de vezes em que um evento específico ocorre em uma determinada área de oportunidades. A área de oportunidades é definida por meio do tempo, da extensão, da área da superfície e assim sucessivamente.. A probabilidade de que um evento específico ocorra em uma determinada área de oportunidades é a mesma para todas as áreas de oportunidades
24
. O número de eventos que ocorrem em uma determinada área de oportunidades é independente do número de eventos que ocorrem em qualquer outra área de oportunidades.. A probabilidade de que dois ou mais eventos venha a ocorrer em uma determinada área de oportunidades se aproxima de zero à medida que a área de oportunidades vai se tornando menor.
.Medidas Descritivas
A distribuição de Poisson possui um parâmetro, chamado λ, que representa a média aritmética. A variância de uma distribuição de Poisson é também
igual a λ, e o desvio padrão é igual a .
.Cálculo da Distribuição de Poisson
A equação a seguir representa a expressão matemática correspondente a distribuição de Poisson para calcular a probabilidade de X eventos, sabendo-se que são esperados λ eventos.
sendoP(X = x|λ) = a probabilidade de que X=x eventos em uma área de oportunidades, conhecendo-se λλ = número esperado de eventose = constante matemáticax = número de eventos
25
Exemplo: Sabe-se que o número de acidentes de trabalho, por mês, em uma unidade de produção segue uma distribuicão de Poisson, com uma média aritmética de 2,5 acidentes de trabalho por mês. Qual é a probabilidade de que em um determinado mês nenhum acidente de trabalho venha a ocorrer?
A probabilidade de que em um determinado mês nenhum acidente ocorra é de 0,0821 ou 8,21%.
-Distribuição Hipergeométrica
No que diz respeito à distribuição hipergeométrica, os dados da amostra são selecionados sem reposição, a partir de uma população finita. Por conseguinte, o resultado de uma observação é dependente dos resultados das observações anteriores, ao contrário da distribuição binomial.
Considere uma população de tamanho N. Seja A o número total de eventos de interesse na população. A distribuição hipergeométrica é então utilizada para encontrar a probabilidade de X eventos de interesse em uma amostra de tamanho n, selecionada sem reposição. A equação a seguir representa a expressão matemática para encontrar X eventos, conhecendo-se n, N e A.
26
.Cálculo da Distribuição Hipergeométrica
em queP(X = x|n,N,A) = probabilidade de X eventos de interesse, conhecendo-se n, N e An = tamanho da amostraN = tamanho da populaçãoA = número de eventos de interesse na populaçãoN-A = número de eventos que não são de interesse na população
.Média Aritmética
.Desvio Padrão
27
Exemplo: Suponha que você está formando uma equipe de 8 gerente, de diferentes departamentos de sua empresa. Sua empresa tem um total de 30 gerentes, e 10 deles são do departamento financeiro. Se você vai selecionar aleatoriamente os membros da equipe, qual a probabilidade de que a equipe conterá 2 gerentes do departamento financeiro?
Nesse caso, a população N=30 gerentes dentro da organização é finita. Além disso, A = 10 são do departamento financeiro. Uma equipe de n = 8 membros está para ser selecionada.
A probabilidade de que a equipe venha a conter dois membros do departamento financeiro é de 0,298 ou 29,8%.
28
-Distribuição de Bernoulli
Uma v.a., X, de Bernoulli é aquela que assume apenas dois valores, 1 se ocorrer sucesso (S) e 0 se ocorrer fracasso (F), com probabilidade de sucesso.Sua probabilidade é dada por:
.Medidas Descritivas
Média = E(X) = p
Var(X) = p(1-p)
Exemplo:
X~Bernoulli (0,9)P(X=x) = pˆx(1-p)ˆ(1-x); x=0;1P(X=0) = 0,9ˆ0.(1-0,9)ˆ(1-0) = 0,1
29
-Distribuição Uniforme
Na distribuição uniforme, um determinado valor apresenta a mesma probabilidade de ocorrência em qualquer lugar do intervalo entre o menor valor, a, e o maior valor, b. A equação a seguir define a função densidade da probabilidade para a distribuição uniforme
em que
a = valor mínimo de Xb = valor máximo de X
.Medidas Descritivas
30
-Distribuição Exponencial
A distribuição exponencial é amplamente utilizada na teoria das filas para modelar a extensão do tempo decorrido entre chegadas em processos tais como clientes em caixas eletrônicos de bancos.A distribuição exponencial é definida por um único parâmetro, λ, a média aritmética do número de chegadas por unidade de tempo. A função de densidade da probabilidade para a extensão de tempo entre chegadas é fornecida pela equação a seguir
em que
e = constante matemáticaλ = média aritmética do número de chegadas por unidadeX = qualquer valor da variável contínua em que
.Medidas Descritivas
31
Exemplo: Suponha que clientes cheguem a um caixa eletrônico de um banco a uma taxa de 20 por hora. Se um cliente acabou de chegar, qual a probabilidade de que o próximo cliente chegue dentro do limite de um intervalo de 3 minutos (0,05 hora)?
Para este exemplo, λ = 20 e X = 0,05, portanto
Portanto, a probabilidade de que um cliente venha a chegar dentro de 3 minutos é 0,6321 ou 63,21%
32
-Distribuição Normal
A distribuição normal é a distribuição contínua mais habitualmente utilizada na estatística. A distribuição normal é de vital importância na estatística por três principais razões:
. Inúmeras variáveis contínuas comuns no mundo dos negócios possuem distribuições que se assemelham estreitamente à distribuição normal.. A distribuição normal pode ser utilizada para fazer aproximações para várias distribuições de variáveis discretas.. A distribuição normal proporciona a base para a inferência estatística clássica em razão de sua relação com o teorema do limite central.
A distribuição normal possui várias propriedades teóricas importantes:
. Ela é simétrica, e sua média aritmética e mediana são, consequentemente, iguais.. Em sua aparência, tem o formato de um sino.. Sua amplitude interquartil é igual a 1,33 do desvio-padrão. Consequentemente, os 50% dos valores centrais estão contidos no âmbito de um intervalo que tem como limites dois terços de um desvio-padrão abaixo da média aritmética e dois terços de um desvio-padrão acima da média aritmética.
. Possui uma amplitude infinita
33
.Função Densidade da Probabilidade Normal
em que
e = constante matemáticaπ = constante matemáticaμ = média aritméticaσ = desvio-padrãoX = qualquer valor da variável contínua,
-Normal Padrão
Encontrar probabilidades utilizando a expressão matemática anterior é cansativo em termos de cálculo. Uma vez que estão disponíveis as tabelas de probabilidades normais, você jamais precisa utilizar essa expressão. A primeira etapa para encontrar probabilidades normais diz respeito a utilizar a formula de transformação, para converter qualquer variável aleatória, X, distribuida nos moldes de uma distribuição normal, em uma variável aleatória normal padronizada, Z. O valor de Z expressa a diferença entre o valor de X e a média aritmética, μ, em unidades de desvio-padrão.
34
.Fórmula de Transformação
Embora a variável aleatória, X, tenha média aritmética μ e desvio-padrão σ, a variável aleatória padronizada, Z, terá sempre média aritmética μ = 0 e desvio-padrão σ = 1.Qualquer conjunto de valores distribuídos nos moldes de uma distribuição normal, pode ser convertido para sua forma padronizada. A partir de então, você pode determinar as probabilidades utilizando a Tabela de Distribuição Normal Padronizada Acumulada.
Exemplo: Sabendo que a média aritmética do tempo de download de uma música no Itunes é igual a 7s e o desvio-padrão é igual a 2s, qual a probabilidade de que o tempo de download esteja entre 5s e 9s?
35
Consultando a tabela, temos:
Portanto, a probabilidade é igual a 0,6826 ou 68,26%, como de fato mostra a imagem a seguir
Onde vemos que entre -1σ e +1σ a probabilidade é sempre 68,26%.
36
. Tabela de Distribuição Normal Padronizada Acumulada
- Bibliografia
.Estatística Teoria e Aplicações (Levine - Stephan -Krehbiel - Berenson).Slides do Curso de Estatística (Cavallare)
37