uso da seleção de protótipos para otimizar a classificação baseada em dissimilaridade

15
USO DA SELEÇÃO DE PROTÓTIPOS PARA OTIMIZAR A CLASSIFICAÇÃO BASEADA EM DISSIMILARIDADE Felipe Soares Queiroga (fsq)

Upload: lucy-price

Post on 02-Jan-2016

21 views

Category:

Documents


0 download

DESCRIPTION

Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade. Felipe Soares Queiroga ( fsq ). Motivação. Objetos “Similares” podem sem agrupados com intuito de formar uma classe, uma “classe” nada mais é que um conjunto de objetos “similares”. [KIMA, 2006]. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

USO DA SELEÇÃO DE PROTÓTIPOS PARA OTIMIZAR A CLASSIFICAÇÃO BASEADA EM DISSIMILARIDADE

Felipe Soares Queiroga (fsq)

Page 2: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

MOTIVAÇÃO

Objetos “Similares” podem sem agrupados com intuito de formar uma classe, uma “classe” nada mais é que um conjunto de objetos “similares”. [KIMA, 2006]

Page 3: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

OBJETIVOS

Dois Principais objetivos do Artigo:

Utilizar um PRS como uma ferramenta para minimizar o número de amostras que serão utilizados pela DBC.

Utilizar a medida de distância de Mahalanobis, associada com o algoritmo de PRS, para obter uma vantagem distinta ao implementar uma DBC.

Page 4: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

PROTOTYPE REDUCTION SCHEMES (PRS)

O que é: Um Método de seleção de vetores de protótipos

necessários para a representação de dissimilaridade.

Usado Para: Reduzir a Base de Treinamento a Protótipos Reduzir os Custos de computar, armazenar e

processar toda a base de Treinamento.

Page 5: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

PRS’S UTILIZADOS

Random: Seleção Randômica de m

Amostras a partir do Conjunto de Treinamento.

Método Mais Simples

Riscos: Como a Escolha é Aleatória, pode resultar em uma seleção de protótipos desbalanceada

Espaço de Seleção de Protótipos com a técnica Random [Duin, 2004].

Page 6: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

PRS’S UTILIZADOS

RandomC: Seleção Randômica de mi

Amostras por classe w Existente no Conjunto de Treinamento T

Soluciona o Problema de se Ter Classes Desbalanceadas que Tivemos com a Técnica Random.

Espaço de Seleção de Protótipos com a técnica RandomC [Duin, 2004].

Page 7: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

PRS’S UTILIZADOS KCentres:

1. Seleciona randomicamente mi Amostras por Classe wi Existente no Conjunto de Treinamento T.

2. Separa as instâncias de cada classe de acordo com a proximidade de cada protótipo.

3. Calcula o centro para cada conjunto.Objeto cuja distância para os outros da classe é o valor mínimo.

4. Para cada centro, se o centro for diferente, o protótipo é substituído pelo centro e retorna para o passo 2

Espaço de Seleção de Protótipos com a técnica KCentres [Duin, 2004].

Page 8: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

MEDIDAS DE DISSIMILARIDADE

Medida Utilizada Para Quantificar a Dissimilaridade Entre Dois Vetores.

No andamento do projeto, foram implementadas quatro formas diferentes no cálculo das dissimilaridades.

Page 9: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

DISSIMILARIDADE USADAS

Norma de City Block:

Norma Euclidiana: Norma Max: Norma de

Minkowski:

Page 10: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

MATRIZ DE DISSIMILARIDADE

Após Selecionarmos Protótipos e definirmos a medida de dissimilaridade, podemos construir a Matriz de Dissimilaridade:

Page 11: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

CLASSIFICAÇÃO

Reduzir d Dimensão da Matriz de Dissimilaridade:

Page 12: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

EXEMPLO:Exemplo de um Espaço de Dissimilaridade 2D classificador por um sub-Conjunto de dígitos escritos a mão (3 e 8). A Representação da Dissimilaridade D(T, R) é baseada na Distância Euclidiana entre as imagens binárias com suavização Gaussin. [Duin, 2004]

R é escolhido randomicamente e consiste de dois exemplos, um de cada digito. [Duin, 2004]

Page 13: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

RESULTADOS:

Utilização Do Classificador Desenvolvido Sobre a Base Ionosphere do UCI.

Page 14: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

DÚVIDAS?

Page 15: Uso da Seleção de Protótipos Para Otimizar a Classificação Baseada em Dissimilaridade

REFERÊNCIAS: [Duin, 1997] R.P.W. Duin, D. Ridder and D.M.J. Tax, Experiments with

a featureless approach to pattern recognition, Pattern Recognition Lett. 18 (1997), pp. 1159–1166.

[Duin, 2004] R.P.W. Duin, E. Pekalska and Pavel Paclok. Prototype Selection for Dissimilarity-based Classifiers (2004).

[KIMA, 2006] Sang-Woon Kima and B. John Oommen. On using prototype reduction schemes to optimize dissimilarity-based classification. (2006).