estatística e modelos probabilísticos - coe241classes/est-prob-2012/slides/aula_16.pdf · defina...
Post on 16-Aug-2018
221 Views
Preview:
TRANSCRIPT
Rosa Leão – 2012
Estatística e Modelos Probabilísticos - COE241
Aula de hoje
Para que serve a inferência estatística ?
Método dos Momentos
Maximum Likehood Estimator (MLE)
Teste de hipótese: definições
Aula passada
Variância amostral
Método de Replicações Independentes
Rosa Leão – 2012
Para que serve a inferência estatística ?
Para qualquer modelo probabilístico é necessário estimar os parâmetros das funções distribuição de probabilidade que serão usadas
A estimativa pode ser feita a partir de dados coletados do sistema
Exemplo: taxa de chegada de clientes no sistema, taxa de serviço de um recurso, taxa de falha de um equipamento, etc
Rosa Leão – 2012
Para que serve a inferência estatística ?
As estimativas são baseadas nos resultados coletados do sistema durante um certo tempo
O conjunto de todos os resultados possíveis de serem obtidos durante a execução do sistema é denominado população
Em geral somente um sub-conjunto da população está disponível
Métodos de inferência estatística tem o objetivo de estimar características de uma população a partir de um sub-conjunto da população denominado amostra
Rosa Leão – 2012
A medida que o tamanho da amostra aumenta, as estimativas se tornam mais representativas da população
A inferência estatística envolve as seguintes tarefas:
Estimativa de parâmetros do modelo
Teste de hipotése a respeito de parâmetros e distribuição de probabilidade da população
Para que serve a inferência estatística ?
Rosa Leão – 2012
Amostra aleatória
Definição:
O conjunto de variáveis aleatórias X1 , X
2 , ...,
XN é uma amostra aleatória de tamanho N da
população que possui a função distribuição F
X(x), dado que elas são independentes e
identicamente distribuídas com FXi(x) =F
X(x),
para todo i e todo x.
Rosa Leão – 2012
Estatística
Definição:
Qualquer função W(X1 , X
2 , ..., X
N ) calculada
a partir dos valores X1 , X
2 , ..., X
N é
chamada de uma estatística.
Exemplo: média amostral:
variância amostral:
X n=1n ∑i=1
nX i
S2=
1n−1
∑i=1
n X i−X n
2
Rosa Leão – 2012
Estimador
Definição:
Qualquer estatística (X1 , X
2 , ..., X
N )
usada para estimar um parâmetro da população é chamada um estimador para
Rosa Leão – 2012
Propriedades desejáveis para um estimador
Não tendencioso (unbiased): na média o estimador deve fornecer o valor verdadeiro.
Eficiente: deve apresentar a menor variância quando comparado com outros
Consistente: deve convergir em probabilidade para o valor verdadeiro
Rosa Leão – 2012
Estimador não tendencioso
Definição:
Uma estatística (X1 , X
2 , ..., X
N ) é uma
estimador não tendencioso do parâmetro se E[(X
1 , X
2 , ..., X
N )] =
Já provamos que a média amostral e a variância amostral são estimadores não tendenciosos.
Rosa Leão – 2012
Estimador eficiente
Definição:
Um estimador 1 do parâmetro é mais
eficiente que um estimador 2, dado que:
1 e
2 são estimadores não tendenciosos
de
Var[1 ] ≤ Var[
2] para todo
Var[1 ] < Var[
2] para algum
Rosa Leão – 2012
Estimador consistente
Definição:
Um estimador do parâmetro é consistente se ele converge em probabilidade para
Onde N é o tamanho da amostra
limN ∞ P [∣−∣]=0
Rosa Leão – 2012
Métodos para estimativa de parâmetros
Método dos momentos
Método da máxima verossimilhança (maximum likehood)
Rosa Leão – 2012
Método dos Momentos
Suponha a estimativa de um ou mais parâmetros da variável aleatória X
Defina o K-ésimo momento amostral da v.a. X como:
Igualando o valor obtido para o momento amostral com a expressão do momento da v.a. X, temos uma equação
M k=∑i=1n X i
k /n , i=1, 2, ...
E [X k]=M k
Rosa Leão – 2012
Método dos Momentos
O número de equações a serem resolvidas é igual ao número de parâmetros que temos que estimar para v.a. X
Exemplo: Se a v.a. X tem três parâmetros, precisamos de três equações:
E [X ]=M 1
E [X 2]=M 2
E [X 3]=M 3
Rosa Leão – 2012
Método MLE
Os valores de 1
2 , ...,
k que maximizam
a função likehood são os “maximum likehood estimators-MLE” dos parâmetros
1
2 , ...,
k
Os MLE dos parâmetros são os valores para os quais a sequência de amostras tem a maior probabilidade de ocorrer pois maximizam a função densidade conjunta
Rosa Leão – 2012
Método MLE: exemplo 1Maximizar L(p) é equivalente a maximizar o logaritmo natural de L(p)
Calcular a segunda derivada de ln L(p) e verificar se é negativa para afirmar que o valor encontrado para p maximiza ln L(p)
L p= p∑ x
i 1− pn−∑ x
i ,0 p1ln L p=∑
i=1n x i ln pn−∑
i=1n x i ln 1− p
d ln L pdp
=∑i=1n x i1
pn−∑i=1n xi −1
1− pp=1
n∑i=1n x i
Rosa Leão – 2012
Testes Estatísticos
São procedimentos que nos permitem decidir quando aceitar ou rejeitar uma determinada hipótese baseados na informação contida em uma amostra
Duas hipóteses devem ser definidas:
Hipótese nula - H0: é a hipótese que
estamos interessados em rejeitar
Hipótese contraditória – H1 : é a hipótese
alternativa
Rosa Leão – 2012
Testes Estatísticos: Regiões
O teste é baseado em um conjunto de variáveis aleatórias X
1 , X
2 , ..., X
N que é uma
amostra aleatória de tamanho N da população
O teste irá dividir o espaço de observações em duas regiões:
R(H0) – região de aceitação
R(H1) – região crítica ou de rejeição
Rosa Leão – 2012
Testes Estatísticos: Tipos de Erros
Tipo de erro I: A hipótese nula (H0) é verdadeira mas
a amostra está na região de rejeição do teste. Logo a hipótese H
0 será rejeitada quando deveria ser aceita.
A probabilidade de ocorrer este erro é também chamada de nível de significância do teste.
Rosa Leão – 2012
Testes Estatísticos: Tipos de Erros
Tipo de erro II: A hipótese nula (H0) é falsa mas a
amostra está na região de aceitação do teste. Logo a hipótese H
0 será aceita quando deveria ser rejeitada.
A probabilidade de ocorrer este erro é
é chamada a potência do teste (power of the test)
top related