memórias autossociativas de projeção em subespaço baseadas

52
Mem´ orias Autossociativas de Proje¸c˜ ao em Subespa¸co Baseadas em M´ aquinas de Vetores de Suporte Emely Puj´ olli da Silva Orientador: Prof. Dr. Marcos E. Valle Universidade Estadual de Campinas Instituto de Matem´ atica, Matem´ atica Aplicada e Computa¸ ao Cient´ ıfica Campinas, 23 de Abril de 2015 Silva,E.P. (UNICAMP-IMECC) 1 / 23

Upload: others

Post on 28-Jul-2022

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memorias Autossociativas de Projecao em SubespacoBaseadas em Maquinas de Vetores de Suporte

Emely Pujolli da SilvaOrientador: Prof. Dr. Marcos E. Valle

Universidade Estadual de CampinasInstituto de Matematica, Matematica Aplicada e Computacao Cientıfica

Campinas, 23 de Abril de 2015

Silva,E.P. (UNICAMP-IMECC) 1 / 23

Page 2: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memorias Associativas

Baseado na capacidade do cerebro humano em armazenar e recordarinformacoes temos as Memorias Associativas - AM.

Assim uma memoria associativa deve recuperar uma informacaocorrompida ou incompleta.

Exemplo

Escutamos: “E o amor“Associamos: “E o amooorrrr que mexe com minha cabeca e me deixaassim...“

Silva,E.P. (UNICAMP-IMECC) 2 / 23

Page 3: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memorias Associativas

Baseado na capacidade do cerebro humano em armazenar e recordarinformacoes temos as Memorias Associativas - AM.

Assim uma memoria associativa deve recuperar uma informacaocorrompida ou incompleta.

Exemplo

Escutamos: “E o amor“Associamos: “E o amooorrrr que mexe com minha cabeca e me deixaassim...“

Silva,E.P. (UNICAMP-IMECC) 2 / 23

Page 4: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memorias Associativas

Baseado na capacidade do cerebro humano em armazenar e recordarinformacoes temos as Memorias Associativas - AM.

Assim uma memoria associativa deve recuperar uma informacaocorrompida ou incompleta.

Exemplo

Escutamos: “E o amor“

Associamos: “E o amooorrrr que mexe com minha cabeca e me deixaassim...“

Silva,E.P. (UNICAMP-IMECC) 2 / 23

Page 5: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memorias Associativas

Baseado na capacidade do cerebro humano em armazenar e recordarinformacoes temos as Memorias Associativas - AM.

Assim uma memoria associativa deve recuperar uma informacaocorrompida ou incompleta.

Exemplo

Escutamos: “E o amor“Associamos: “E o amooorrrr que mexe com minha cabeca e me deixaassim...“

Silva,E.P. (UNICAMP-IMECC) 2 / 23

Page 6: Memórias Autossociativas de Projeção em Subespaço Baseadas

Formalmente temos

F = {(xξ, yξ)/ξ = 1, ..., p}

o conjunto de pares de vetores composto dos itens memorizados (padraode entrada) e os itens relembrados (padrao de saıda) e chamado oconjunto das memorias fundamentais

Uma memoria associativa corresponde a uma aplicacao M de A em Bespacos vetoriais, tal que

M(xξ) ≈ yξ

M(xξ) ≈ yξ

para xξ versao ruidosa de xξ.

Silva,E.P. (UNICAMP-IMECC) 3 / 23

Page 7: Memórias Autossociativas de Projeção em Subespaço Baseadas

Formalmente temos

F = {(xξ, yξ)/ξ = 1, ..., p}

o conjunto de pares de vetores composto dos itens memorizados (padraode entrada) e os itens relembrados (padrao de saıda) e chamado oconjunto das memorias fundamentais

Uma memoria associativa corresponde a uma aplicacao M de A em Bespacos vetoriais, tal que

M(xξ) ≈ yξ

M(xξ) ≈ yξ

para xξ versao ruidosa de xξ.

Silva,E.P. (UNICAMP-IMECC) 3 / 23

Page 8: Memórias Autossociativas de Projeção em Subespaço Baseadas

Podemos classificar uma memoria associativa por:

heteroassociativa quando yξ 6= xξ ou

autoassociativa quando yξ = xξ.

Silva,E.P. (UNICAMP-IMECC) 4 / 23

Page 9: Memórias Autossociativas de Projeção em Subespaço Baseadas

Podemos classificar uma memoria associativa por:

heteroassociativa quando yξ 6= xξ ou

autoassociativa quando yξ = xξ.

Silva,E.P. (UNICAMP-IMECC) 4 / 23

Page 10: Memórias Autossociativas de Projeção em Subespaço Baseadas

Podemos classificar uma memoria associativa por:

heteroassociativa quando yξ 6= xξ ou

autoassociativa quando yξ = xξ.

Silva,E.P. (UNICAMP-IMECC) 4 / 23

Page 11: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memoria Autoassociativa

Seja o conjunto das memorias fundamentais da forma

F = {x1, x2, ..., xp}

onde os vetores x1, x2, ..., xp ∈ Rn sao chamados memoriasfundamentais, e sao linearmente independentes.

Entao buscamos uma aplicacao M : Rn → Rn que satisfaca

M(xξ) = xξ

M(xξ) = xξ

para xξ versao ruidosa de xξ.

Silva,E.P. (UNICAMP-IMECC) 5 / 23

Page 12: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memoria Autoassociativa

Seja o conjunto das memorias fundamentais da forma

F = {x1, x2, ..., xp}

onde os vetores x1, x2, ..., xp ∈ Rn sao chamados memoriasfundamentais, e sao linearmente independentes.

Entao buscamos uma aplicacao M : Rn → Rn que satisfaca

M(xξ) = xξ

M(xξ) = xξ

para xξ versao ruidosa de xξ.

Silva,E.P. (UNICAMP-IMECC) 5 / 23

Page 13: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

SejaS = {s ∈ Rn;M(s) = s}

o conjunto dos pontos fixos da aplicacao M. Uma memoria associativaM : Rn → Rn e uma memoria autoassociativa de projecao (PAM) se

M(x) ∈ S e d(x,M(x)) ≤ d(x, s), ∀s ∈ S (1)

com d uma certa medida de distancia em Rn.

Definicao

Se M : Rn → Rn e uma memoria autoassociativa de projecao e S

subespaco de Rn, entao dizemos que M e uma memoria autoassociativade projecao em subespaco (SPAM).

Note que F ⊆ S para uma memoria autoassociativa.

Silva,E.P. (UNICAMP-IMECC) 6 / 23

Page 14: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

SejaS = {s ∈ Rn;M(s) = s}

o conjunto dos pontos fixos da aplicacao M. Uma memoria associativaM : Rn → Rn e uma memoria autoassociativa de projecao (PAM) se

M(x) ∈ S e d(x,M(x)) ≤ d(x, s), ∀s ∈ S (1)

com d uma certa medida de distancia em Rn.

Definicao

Se M : Rn → Rn e uma memoria autoassociativa de projecao e S

subespaco de Rn, entao dizemos que M e uma memoria autoassociativade projecao em subespaco (SPAM).

Note que F ⊆ S para uma memoria autoassociativa.

Silva,E.P. (UNICAMP-IMECC) 6 / 23

Page 15: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

SejaS = {s ∈ Rn;M(s) = s}

o conjunto dos pontos fixos da aplicacao M. Uma memoria associativaM : Rn → Rn e uma memoria autoassociativa de projecao (PAM) se

M(x) ∈ S e d(x,M(x)) ≤ d(x, s), ∀s ∈ S (1)

com d uma certa medida de distancia em Rn.

Definicao

Se M : Rn → Rn e uma memoria autoassociativa de projecao e S

subespaco de Rn, entao dizemos que M e uma memoria autoassociativade projecao em subespaco (SPAM).

Note que F ⊆ S para uma memoria autoassociativa.

Silva,E.P. (UNICAMP-IMECC) 6 / 23

Page 16: Memórias Autossociativas de Projeção em Subespaço Baseadas

Vamos estudar algumas memorias, para isso faremos a seguinte hipotese:

Suponhamos S o subespaco gerado pelas memorias fundamentais, isto eS = [F].

Dado o padrao de entrada x ∈ Rn sua saıda M(x) ∈ S e combinacao lineardos elementos de F isto e, existem α1, α2, ..., αp ∈ R escalares tais que

M(x) = α1x1 + α2x2 + ...+ αpxp

Silva,E.P. (UNICAMP-IMECC) 7 / 23

Page 17: Memórias Autossociativas de Projeção em Subespaço Baseadas

Vamos estudar algumas memorias, para isso faremos a seguinte hipotese:

Suponhamos S o subespaco gerado pelas memorias fundamentais, isto eS = [F].

Dado o padrao de entrada x ∈ Rn sua saıda M(x) ∈ S e combinacao lineardos elementos de F isto e, existem α1, α2, ..., αp ∈ R escalares tais que

M(x) = α1x1 + α2x2 + ...+ αpxp

Silva,E.P. (UNICAMP-IMECC) 7 / 23

Page 18: Memórias Autossociativas de Projeção em Subespaço Baseadas

Vamos estudar algumas memorias, para isso faremos a seguinte hipotese:

Suponhamos S o subespaco gerado pelas memorias fundamentais, isto eS = [F].

Dado o padrao de entrada x ∈ Rn sua saıda M(x) ∈ S e combinacao lineardos elementos de F isto e, existem α1, α2, ..., αp ∈ R escalares tais que

M(x) = α1x1 + α2x2 + ...+ αpxp

Silva,E.P. (UNICAMP-IMECC) 7 / 23

Page 19: Memórias Autossociativas de Projeção em Subespaço Baseadas

Uma maneira de descrever esse problema e como um problema deminimizacao

minα∈Rp

d(x,Xα).

Em forma matricialx ≈ Xα

com X = [x1, ..., xp] ∈ Rn×p a matriz de posto completo denominadamatriz das memorias fundamentais e α = [α1, ..., αp] o vetor doscoeficientes.

Silva,E.P. (UNICAMP-IMECC) 8 / 23

Page 20: Memórias Autossociativas de Projeção em Subespaço Baseadas

Uma maneira de descrever esse problema e como um problema deminimizacao

minα∈Rp

d(x,Xα).

Em forma matricialx ≈ Xα

com X = [x1, ..., xp] ∈ Rn×p a matriz de posto completo denominadamatriz das memorias fundamentais e α = [α1, ..., αp] o vetor doscoeficientes.

Silva,E.P. (UNICAMP-IMECC) 8 / 23

Page 21: Memórias Autossociativas de Projeção em Subespaço Baseadas

Estimadores de Regressao

Em um problema de Regressao Multilinear procuramos estimar f : X→ Y

no ponto x dado a observacao y , ou seja y ≈ f (x).

Em outras palavras, buscamos f (x) de modo que o erro ε na expressao

y = f (x) + ε (2)

se torne o menor possıvel.

Uma maneira de resolver (2) e utilizar uma funcao perda para descreverquanto o erro ira influenciar na estimativa de f (x).

Silva,E.P. (UNICAMP-IMECC) 9 / 23

Page 22: Memórias Autossociativas de Projeção em Subespaço Baseadas

Estimadores de Regressao

Em um problema de Regressao Multilinear procuramos estimar f : X→ Y

no ponto x dado a observacao y , ou seja y ≈ f (x).

Em outras palavras, buscamos f (x) de modo que o erro ε na expressao

y = f (x) + ε (2)

se torne o menor possıvel.

Uma maneira de resolver (2) e utilizar uma funcao perda para descreverquanto o erro ira influenciar na estimativa de f (x).

Silva,E.P. (UNICAMP-IMECC) 9 / 23

Page 23: Memórias Autossociativas de Projeção em Subespaço Baseadas

Estimadores de Regressao

Em um problema de Regressao Multilinear procuramos estimar f : X→ Y

no ponto x dado a observacao y , ou seja y ≈ f (x).

Em outras palavras, buscamos f (x) de modo que o erro ε na expressao

y = f (x) + ε (2)

se torne o menor possıvel.

Uma maneira de resolver (2) e utilizar uma funcao perda para descreverquanto o erro ira influenciar na estimativa de f (x).

Silva,E.P. (UNICAMP-IMECC) 9 / 23

Page 24: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

Denote por (x , y , f (x)) ∈ X× Y× Y a tripla consistindo do padrao x, umaobservacao y e uma previsao f (x). Entao a aplicacaoρ : X× Y× Y→ [0,∞) com a propriedade ρ(x , y , y) = 0 para todo x ∈ X

e y ∈ Y e chamada de funcao perda.

Os algoritmos de regressao sao estruturados de acordo com o risco. Ouseja, a solucao do problema e encontrada minimizando alguma forma dofuncional risco. Estimadores minimizam o risco empırico.

Definicao

O risco empırico e definido como

Remp[f ] =1

n

n∑i=1

ρ(xi , yi , f (xi ))

Silva,E.P. (UNICAMP-IMECC) 10 / 23

Page 25: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

Denote por (x , y , f (x)) ∈ X× Y× Y a tripla consistindo do padrao x, umaobservacao y e uma previsao f (x). Entao a aplicacaoρ : X× Y× Y→ [0,∞) com a propriedade ρ(x , y , y) = 0 para todo x ∈ X

e y ∈ Y e chamada de funcao perda.

Os algoritmos de regressao sao estruturados de acordo com o risco. Ouseja, a solucao do problema e encontrada minimizando alguma forma dofuncional risco.

Estimadores minimizam o risco empırico.

Definicao

O risco empırico e definido como

Remp[f ] =1

n

n∑i=1

ρ(xi , yi , f (xi ))

Silva,E.P. (UNICAMP-IMECC) 10 / 23

Page 26: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

Denote por (x , y , f (x)) ∈ X× Y× Y a tripla consistindo do padrao x, umaobservacao y e uma previsao f (x). Entao a aplicacaoρ : X× Y× Y→ [0,∞) com a propriedade ρ(x , y , y) = 0 para todo x ∈ X

e y ∈ Y e chamada de funcao perda.

Os algoritmos de regressao sao estruturados de acordo com o risco. Ouseja, a solucao do problema e encontrada minimizando alguma forma dofuncional risco. Estimadores minimizam o risco empırico.

Definicao

O risco empırico e definido como

Remp[f ] =1

n

n∑i=1

ρ(xi , yi , f (xi ))

Silva,E.P. (UNICAMP-IMECC) 10 / 23

Page 27: Memórias Autossociativas de Projeção em Subespaço Baseadas

Definicao

Denote por (x , y , f (x)) ∈ X× Y× Y a tripla consistindo do padrao x, umaobservacao y e uma previsao f (x). Entao a aplicacaoρ : X× Y× Y→ [0,∞) com a propriedade ρ(x , y , y) = 0 para todo x ∈ X

e y ∈ Y e chamada de funcao perda.

Os algoritmos de regressao sao estruturados de acordo com o risco. Ouseja, a solucao do problema e encontrada minimizando alguma forma dofuncional risco. Estimadores minimizam o risco empırico.

Definicao

O risco empırico e definido como

Remp[f ] =1

n

n∑i=1

ρ(xi , yi , f (xi ))

Silva,E.P. (UNICAMP-IMECC) 10 / 23

Page 28: Memórias Autossociativas de Projeção em Subespaço Baseadas

No caso da regressao, a funcao perda toma a forma particular

ρ(x , y , f (x)) = ρ(f (x)− y)

com ρ : R→ [0,∞).

Entao um Estimador de regressao resolve o seguinte problema

minn∑

i=1

ρ(f (xi )− yi ).

Cada estimador resolve o problema de regressao colocando hipoteses sobrea funcao perda ρ.

Silva,E.P. (UNICAMP-IMECC) 11 / 23

Page 29: Memórias Autossociativas de Projeção em Subespaço Baseadas

No caso da regressao, a funcao perda toma a forma particular

ρ(x , y , f (x)) = ρ(f (x)− y)

com ρ : R→ [0,∞).

Entao um Estimador de regressao resolve o seguinte problema

minn∑

i=1

ρ(f (xi )− yi ).

Cada estimador resolve o problema de regressao colocando hipoteses sobrea funcao perda ρ.

Silva,E.P. (UNICAMP-IMECC) 11 / 23

Page 30: Memórias Autossociativas de Projeção em Subespaço Baseadas

No caso da regressao, a funcao perda toma a forma particular

ρ(x , y , f (x)) = ρ(f (x)− y)

com ρ : R→ [0,∞).

Entao um Estimador de regressao resolve o seguinte problema

minn∑

i=1

ρ(f (xi )− yi ).

Cada estimador resolve o problema de regressao colocando hipoteses sobrea funcao perda ρ.

Silva,E.P. (UNICAMP-IMECC) 11 / 23

Page 31: Memórias Autossociativas de Projeção em Subespaço Baseadas

Exemplos de funcoes perda

Perda Quadrada Funcao perda de Tukey Funcao perda ε−insensıvel

ρQ (u) = (u)2 ρT (u) =

{u2

2 −u4

2k2 + u6

6k4 se |u| ≤ ku2

6 se |u| > kρε(u) =

{|u| − ε se |u| ≥ ε0 c. c.

Silva,E.P. (UNICAMP-IMECC) 12 / 23

Page 32: Memórias Autossociativas de Projeção em Subespaço Baseadas

Colocando em termos das memorias autoassociativas

arg minα∈Rp

n∑i=1

ρ

p∑j=1

Xijαj − xi

Resolver o problema de regressao com estimadores, resulta na solucao doproblema de memorias autoassociativas com a hipotese de que S esubespaco gerado pelas memorias fundamentais.

Silva,E.P. (UNICAMP-IMECC) 13 / 23

Page 33: Memórias Autossociativas de Projeção em Subespaço Baseadas

Memoria Autoassociativa Linear Otima

Seja o caso em que ρ(u) = u2 ou seja, a funcao perda toma a forma dametrica euclideana

α∗ = arg minα∈Rp

||x− Xα||2

que e o problema de quadrados mınimos, cuja a solucao de norma mınimapode ser obtido por

α∗ = X †x

onde X † representa a pseudo-inversa de X .

Silva,E.P. (UNICAMP-IMECC) 14 / 23

Page 34: Memórias Autossociativas de Projeção em Subespaço Baseadas

O padrao pode ser recuperado utilizando a expressao

M(x) = Xα∗

Este e o modelo introduzido por Kohonen e Ruohonen, chamadoMemoria Associativa Linear Otima - OLAM.

Ainda, M(x) = M0x com M0 = XX † chamada matriz peso sinaptico, oque faz da aplicacao M linear.

Silva,E.P. (UNICAMP-IMECC) 15 / 23

Page 35: Memórias Autossociativas de Projeção em Subespaço Baseadas

O padrao pode ser recuperado utilizando a expressao

M(x) = Xα∗

Este e o modelo introduzido por Kohonen e Ruohonen, chamadoMemoria Associativa Linear Otima - OLAM.

Ainda, M(x) = M0x com M0 = XX † chamada matriz peso sinaptico, oque faz da aplicacao M linear.

Silva,E.P. (UNICAMP-IMECC) 15 / 23

Page 36: Memórias Autossociativas de Projeção em Subespaço Baseadas

ε−Regressao de Vetor de Suporte

Apesar da simplicidade da solucao de quadrados mınimos esta tem sidocriticada por sua falta de robusteza, ou seja, insensibilidade a pequenasvariacoes nas hipoteses.

Uma melhora pode ser obtida ao substituir a aproximacao de quadradosmınimos por um estimador robusto e elegante para o problema deregressao multilinear Xα ≈ x.

A ε−regressao de vetor de suporte tem como objetivo encontrar o α talque Xα tenha no maximo ε de diferenca do padrao desejado x e aomesmo tempo, ser o mais plana possıvel.

A planitude neste caso, significa que procuramos um α com magnitudepequena.

Silva,E.P. (UNICAMP-IMECC) 16 / 23

Page 37: Memórias Autossociativas de Projeção em Subespaço Baseadas

ε−Regressao de Vetor de Suporte

Apesar da simplicidade da solucao de quadrados mınimos esta tem sidocriticada por sua falta de robusteza, ou seja, insensibilidade a pequenasvariacoes nas hipoteses.

Uma melhora pode ser obtida ao substituir a aproximacao de quadradosmınimos por um estimador robusto e elegante para o problema deregressao multilinear Xα ≈ x.

A ε−regressao de vetor de suporte tem como objetivo encontrar o α talque Xα tenha no maximo ε de diferenca do padrao desejado x e aomesmo tempo, ser o mais plana possıvel.

A planitude neste caso, significa que procuramos um α com magnitudepequena.

Silva,E.P. (UNICAMP-IMECC) 16 / 23

Page 38: Memórias Autossociativas de Projeção em Subespaço Baseadas

ε−Regressao de Vetor de Suporte

Apesar da simplicidade da solucao de quadrados mınimos esta tem sidocriticada por sua falta de robusteza, ou seja, insensibilidade a pequenasvariacoes nas hipoteses.

Uma melhora pode ser obtida ao substituir a aproximacao de quadradosmınimos por um estimador robusto e elegante para o problema deregressao multilinear Xα ≈ x.

A ε−regressao de vetor de suporte tem como objetivo encontrar o α talque Xα tenha no maximo ε de diferenca do padrao desejado x e aomesmo tempo, ser o mais plana possıvel.

A planitude neste caso, significa que procuramos um α com magnitudepequena.

Silva,E.P. (UNICAMP-IMECC) 16 / 23

Page 39: Memórias Autossociativas de Projeção em Subespaço Baseadas

ε−Regressao de Vetor de Suporte

Apesar da simplicidade da solucao de quadrados mınimos esta tem sidocriticada por sua falta de robusteza, ou seja, insensibilidade a pequenasvariacoes nas hipoteses.

Uma melhora pode ser obtida ao substituir a aproximacao de quadradosmınimos por um estimador robusto e elegante para o problema deregressao multilinear Xα ≈ x.

A ε−regressao de vetor de suporte tem como objetivo encontrar o α talque Xα tenha no maximo ε de diferenca do padrao desejado x e aomesmo tempo, ser o mais plana possıvel.

A planitude neste caso, significa que procuramos um α com magnitudepequena.

Silva,E.P. (UNICAMP-IMECC) 16 / 23

Page 40: Memórias Autossociativas de Projeção em Subespaço Baseadas

O funcional risco tem a forma

R[α; X , x] =1

2||α||2 + C

n∑i=1

ρε

p∑j=1

Xijαj − xi

(3)

onde C > 0 e a constante que determina a troca entra a planitude e aquantidade de desvios maiores que ε sao permitidos.

Para minimizar o risco (3) colocamos na forma de um problema deotimizacao convexa, e para permitir alguns erros incluimos variaveis defolga.

minimizar1

2||α||2 + C

n∑i=1

(ξ+i + ξ−i )

sujeito a x− Xα ≤ ε+ ξ+

Xα− x ≤ ε+ ξ−

ξ+, ξ− ≥ 0

(4)

Silva,E.P. (UNICAMP-IMECC) 17 / 23

Page 41: Memórias Autossociativas de Projeção em Subespaço Baseadas

O funcional risco tem a forma

R[α; X , x] =1

2||α||2 + C

n∑i=1

ρε

p∑j=1

Xijαj − xi

(3)

onde C > 0 e a constante que determina a troca entra a planitude e aquantidade de desvios maiores que ε sao permitidos.

Para minimizar o risco (3) colocamos na forma de um problema deotimizacao convexa, e para permitir alguns erros incluimos variaveis defolga.

minimizar1

2||α||2 + C

n∑i=1

(ξ+i + ξ−i )

sujeito a x− Xα ≤ ε+ ξ+

Xα− x ≤ ε+ ξ−

ξ+, ξ− ≥ 0

(4)

Silva,E.P. (UNICAMP-IMECC) 17 / 23

Page 42: Memórias Autossociativas de Projeção em Subespaço Baseadas

O funcional risco tem a forma

R[α; X , x] =1

2||α||2 + C

n∑i=1

ρε

p∑j=1

Xijαj − xi

(3)

onde C > 0 e a constante que determina a troca entra a planitude e aquantidade de desvios maiores que ε sao permitidos.

Para minimizar o risco (3) colocamos na forma de um problema deotimizacao convexa, e para permitir alguns erros incluimos variaveis defolga.

minimizar1

2||α||2 + C

n∑i=1

(ξ+i + ξ−i )

sujeito a x− Xα ≤ ε+ ξ+

Xα− x ≤ ε+ ξ−

ξ+, ξ− ≥ 0

(4)

Silva,E.P. (UNICAMP-IMECC) 17 / 23

Page 43: Memórias Autossociativas de Projeção em Subespaço Baseadas

Muitas vezes, o problema (4) e mais facil ser resolvido na sua forma dual.A ideia e contruir a Funcao de Lagrange utilizando a funcao objetivo ecolocando pesos nas restricoes. Assim

L(α, λ+, λ−, η+, η−) =1

2

p∑j=1

α2j + C

n∑i=1

(ξ+i + ξ−i )

−n∑

i=1

λ+i (ε− yi + ξ+

i +

p∑j=1

Xijαj)

−n∑

i=1

λ−i (ε+ yi + ξ−i −p∑

j=1

Xijαj)

−n∑

i=1

(η+i ξ

+i + η−i ξ

−i )

(5)

Aqui λ−, λ+, η−, η+ ≥ 0 sao os multiplicadores de Lagrange.

Silva,E.P. (UNICAMP-IMECC) 18 / 23

Page 44: Memórias Autossociativas de Projeção em Subespaço Baseadas

Muitas vezes, o problema (4) e mais facil ser resolvido na sua forma dual.A ideia e contruir a Funcao de Lagrange utilizando a funcao objetivo ecolocando pesos nas restricoes. Assim

L(α, λ+, λ−, η+, η−) =1

2

p∑j=1

α2j + C

n∑i=1

(ξ+i + ξ−i )

−n∑

i=1

λ+i (ε− yi + ξ+

i +

p∑j=1

Xijαj)

−n∑

i=1

λ−i (ε+ yi + ξ−i −p∑

j=1

Xijαj)

−n∑

i=1

(η+i ξ

+i + η−i ξ

−i )

(5)

Aqui λ−, λ+, η−, η+ ≥ 0 sao os multiplicadores de Lagrange.

Silva,E.P. (UNICAMP-IMECC) 18 / 23

Page 45: Memórias Autossociativas de Projeção em Subespaço Baseadas

E possıvel verificar que essa funcao tem ponto de sela com respeito asvariaveis primais e duais na solucao (SMOLA, SCHOLKOPF).

Derivamos a funcao de Lagrange com respeito a αk , ξ+ e ξ−, obtendo asexpressoes

αk =n∑

i=1

(λ+i − λ

−i )Xik

η+k = C − λ+

kη−k = C − λ−k

E das duas ultimas expressoes, obtemos ainda

C − λ+k = η+

k ≥ 0⇔ λ+k ≤ C

C − λ−k = η−k ≥ 0⇔ λ−k ≤ C , ∀k = 1, ..., n.

Silva,E.P. (UNICAMP-IMECC) 19 / 23

Page 46: Memórias Autossociativas de Projeção em Subespaço Baseadas

E possıvel verificar que essa funcao tem ponto de sela com respeito asvariaveis primais e duais na solucao (SMOLA, SCHOLKOPF).

Derivamos a funcao de Lagrange com respeito a αk , ξ+ e ξ−, obtendo asexpressoes

αk =n∑

i=1

(λ+i − λ

−i )Xik

η+k = C − λ+

kη−k = C − λ−k

E das duas ultimas expressoes, obtemos ainda

C − λ+k = η+

k ≥ 0⇔ λ+k ≤ C

C − λ−k = η−k ≥ 0⇔ λ−k ≤ C , ∀k = 1, ..., n.

Silva,E.P. (UNICAMP-IMECC) 19 / 23

Page 47: Memórias Autossociativas de Projeção em Subespaço Baseadas

Encontramos o seguinte problema dual

Maximizar −1

2

p∑j=1

[n∑

i=1

(λ+i − λ

−i )Xij

]2

−n∑

i=1

(λ+i + λ−i )ε+

n∑i=1

(λ+i − λ

−i )yi

sujeito a 0 ≤ λ+ ≤ C0 ≤ λ− ≤ C

(6)

Silva,E.P. (UNICAMP-IMECC) 20 / 23

Page 48: Memórias Autossociativas de Projeção em Subespaço Baseadas

E a solucao do problema

α∗ = XT (λ+ − λ−)

conhecida como expansao do vetor de suporte e determina a estimativa α∗

em funcao dos multiplicadores de Lagrange.

Dessa maneira o padrao recordado toma a forma

M(x) = Xα∗

Silva,E.P. (UNICAMP-IMECC) 21 / 23

Page 49: Memórias Autossociativas de Projeção em Subespaço Baseadas

E a solucao do problema

α∗ = XT (λ+ − λ−)

conhecida como expansao do vetor de suporte e determina a estimativa α∗

em funcao dos multiplicadores de Lagrange.

Dessa maneira o padrao recordado toma a forma

M(x) = Xα∗

Silva,E.P. (UNICAMP-IMECC) 21 / 23

Page 50: Memórias Autossociativas de Projeção em Subespaço Baseadas

Experimentos computacionais

Proxima apresentacao...

Silva,E.P. (UNICAMP-IMECC) 22 / 23

Page 51: Memórias Autossociativas de Projeção em Subespaço Baseadas

Experimentos computacionais

Proxima apresentacao...

Silva,E.P. (UNICAMP-IMECC) 22 / 23

Page 52: Memórias Autossociativas de Projeção em Subespaço Baseadas

Obrigada!

Silva,E.P. (UNICAMP-IMECC) 23 / 23