ee-240/2009 estimação não-paramétrica ee-240/2009 estimação não-paramétrica

Post on 17-Apr-2015

129 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

EE-240/2009

Estimação Não-Paramétrica EE-240/2009Estimação Não-Paramétrica

EE-240/2009

Estimação Não-Paramétrica

• Assumir uma certa distribuição (normal, exponencial, Weibull, etc.)

• Estimar os parâmetros da distribuição a partir das observações

• Utilizar a distribuição com os parâmetros estimados.

Estimação Paramétrica

EE-240/2009

Estimação Não-Paramétrica

Densidade Normal

EE-240/2009

Estimação Não-Paramétrica

30 observações

EE-240/2009

Estimação Não-Paramétrica

Função densidade de probabilidade estimada(assumindo distribuição normal)

OK

EE-240/2009

Estimação Não-Paramétrica

Uma Densidade Bimodal

EE-240/2009

Estimação Não-Paramétrica

30 observações

EE-240/2009

Estimação Não-Paramétrica

Função densidade de probabilidade estimada(assumindo distribuição normal)

No Good!

EE-240/2009

Estimação Não-Paramétrica

• Nãoassumir um tipo específico de distribuição a priori

• Estimar a densidade de probabilidade a partir das observações

• Utilizar a densidade de probabilidade estimada.

Métodos não-paramétricos

EE-240/2009

Estimação Não-Paramétrica

Exemplo: Histograma (1)

EE-240/2009

Estimação Não-Paramétrica

30 observações

EE-240/2009

Estimação Não-Paramétrica

Divisão do intervalo em 10 trechos

EE-240/2009

Estimação Não-Paramétrica

Normalizar

EE-240/2009

Estimação Não-Paramétrica

Ajustar

EE-240/2009

Estimação Não-Paramétrica

Divisão do intervalo em 5 trechos

EE-240/2009

Estimação Não-Paramétrica

Divisão do intervalo em 20 trechos

EE-240/2009

Estimação Não-Paramétrica

60 observações

EE-240/2009

Estimação Não-Paramétrica

120 observações

EE-240/2009

Estimação Não-Paramétrica

240 observações

EE-240/2009

Estimação Não-Paramétrica

480 observações

EE-240/2009

Estimação Não-Paramétrica

960 observações

EE-240/2009

Estimação Não-Paramétrica

1920 observações

EE-240/2009

Estimação Não-Paramétrica

Divisão do intervalo em 10 trechos

30 observações

EE-240/2009

Estimação Não-Paramétrica

Divisão do intervalo em 20 trechos

EE-240/2009

Estimação Não-Paramétrica

3840 observações

EE-240/2009

Estimação Não-Paramétrica

• “Kernel density estimation”:

K(x) = Função kernel de “área unitária”

h = Parâmetro de alargamento (suavização)

EE-240/2009

Estimação Não-Paramétrica

h=1h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=1

Kernel Retangular, h=1

EE-240/2009

Estimação Não-Paramétrica

h=2

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Retangular, h=2

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Triangular, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

Kernel Gaussiano, h=1

EE-240/2009

Estimação Não-Paramétrica

[F,XI]=KSDENSITY(X) computes a probability density estimate of the sample in the vector X. KSDENSITY evaluates the density estimate at 100 points covering the range of the data. F is the vector of density values and XI is the set of 100 points. The estimate is based on a normal kernel function, using a window parameter (bandwidth) that is a function of thenumber of points in X.

F=KSDENSITY(X,XI) specifies the vector XI of values where the density estimate is to be evaluated.

(Matlab Statistics Toolbox)

EE-240/2009

Estimação Não-Paramétrica

Vantagens

Métodos paramétricos:

• Propriedades teóricas bem-

estabelecidas.

Métodos não-paramétricos:

• Dispensam a escolha a priori

de um tipo de distribuição.

• Aplicabilidade mais ampla.

• Simplicidade de uso.

EE-240/2009

Estimação Não-Paramétrica

Métodos paramétricos:

• Podem levar a resultados

inadequados se a população

não seguir a distribuição

assumida na análise.

Métodos não-paramétricos:

• Requerem um número maior de

amostras para atingir a mesma

“qualidade” de ajuste.

• Maior dificuldade para o

estabelecimento de propriedades

teóricas.

Desvantagens

EE-240/2009

Estimação Não-Paramétrica

Bootstrap

EE-240/2009

Estimação Não-Paramétrica

• Motivação: Em muitos casos, pode não ser trivial obter o intervalo

de confiança para uma dada estimativa.

• Exemplo (prognóstico baseado em análise de tendência): Previsão

da Remaining Useful Life com base na série histórica de um índice

de degradação.

EE-240/2009

Estimação Não-Paramétrica

EE-240/2009

Estimação Não-Paramétrica

• Pode não ser possível obter o intervalo de confiança de forma analítica se os dados não se conformarem às hipóteses usuais (ruído gaussiano, homoscedástico, etc.)

EE-240/2009

Estimação Não-Paramétrica

• Bootstrap: Técnica de reamostragem (com reposição) que pode ser

empregada para obter informações sobre a incerteza associada a

uma estimativa.

EE-240/2009

Estimação Não-Paramétrica

Amostragem com reposição

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Bootstrap

Reamostragem

EE-240/2009

Estimação Não-Paramétrica

Conjuntooriginal

Reamostragens

Bootstrap 1

Bootstrap 2

Bootstrap 3

EE-240/2009

Estimação Não-Paramétrica

Uso de Bootstrap em estimação

• Considere que uma variável y tenha sido estimada a partir de n

observações de uma variável x:

• Sejam X1, X2, ..., XN bootstraps gerados a partir de X. Seja ainda:

• Pode-se então levantar estatísticas com base nas N estimativas

resultantes.

EE-240/2009

Estimação Não-Paramétrica

• Exemplo 1: Estimativa da Mediana

Amostra de 10 observações gerada a partir de uma distribuição

uniforme no intervalo [0, 10] (números inteiros):

X = { 10, 2, 6, 5, 9, 8, 5, 0, 8 }.

Cálculo da mediana:

Xordenado = { 0, 2, 5, 5, 6, 8, 8, 9, 10 }

EE-240/2009

Estimação Não-Paramétrica

• Estimativas obtidas (em ordem crescente):

• Intervalo de confiança para a estimativa (70% de confiança 5-6):

EE-240/2009

Estimação Não-Paramétrica

• Exemplo 2 Estimativa de Mediana

Amostra de 30 observações gerada a partir de uma distribuição uniforme no

intervalo [0, 10]:

EE-240/2009

Estimação Não-Paramétrica

• Exemplo 2 Estimativa de Mediana

Amostra de 30 observações gerada a partir de uma distribuição uniforme no

intervalo [0, 10]:

•Em 69 dos 100

bootstraps, a

mediana obtida

estava no intervalo

[4, 6].

•Intervalo [4, 6]

69% de confiança.

EE-240/2009

Estimação Não-Paramétrica

Densidade de probabilidadepara o resultado obtido por Bootstrap

• Pode-se aplicar o método das janelas de Parzen aos resultados

obtidos a partir dos bootstraps.

• Neste caso, o resultado de cada bootstrap é considerado uma

“observação” da grandeza a ser estimada.

EE-240/2009

Estimação Não-Paramétrica

Exemplo anterior com kernel gaussiano

EE-240/2009

Estimação Não-Paramétrica

Bootstrap e análise de tendência

EE-240/2009

Estimação Não-Paramétrica

d

t

d

t

d

t

d

t

EE-240/2009

Estimação Não-Paramétrica

BOOTSTRP Bootstrap statistics.

BOOTSTRP(NBOOT,BOOTFUN,...) draws NBOOT bootstrap

data samples and analyzes them using the function,

BOOTFUN. NBOOT must be a positive integer. The

third and later arguments are the data; BOOTSTRP

passes bootstrap samples of the data to BOOTFUN.

(Matlab Statistics Toolbox)

EE-240/2009

Estimação Não-Paramétrica

Muito Obrigado!

top related