uma proposta de melhoria no processo de recuperação de imagens com base na distribuição de...

16
Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando Índice Invertido Patrícia Proença 1 , Ilmério Silva 2 , Celia Barcelos 3 , 1 [email protected], 2 [email protected], 3 [email protected], 4

Upload: henri-palma

Post on 07-Apr-2016

219 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando Índice InvertidoPatrícia Proença1, Ilmério Silva2,

Celia Barcelos3,

1 [email protected], 2 [email protected], 3 [email protected], 4

Page 2: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

2

Objetivo

indexação de características de baixo nível de segmentos de imagens digitais mapeadas para um índice invertido:

melhoras de desempenho no processamento de consultas;

ganho na precisão no conjunto de imagens recuperadas em grandes bases de dados;

Page 3: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Motivação

Grande número de imagens digitais;

Necessidade de localizar imagens: melhores algoritmos de busca, métodos de

indexação e técnicas de classificação de imagens digitais;

Page 4: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

4

Trabalhos Relacionados

crescimento da busca de imagens pelo próprio conteúdo - CBIR (Recuperação de Imagens Baseada no Conteúdo), [Datta et al, 2008]: encontrar imagens relevantes - características visuais

extraídas automaticamente das imagens;

em [Matos et al, 2008a] e [Matos et al, 2008b] - adaptação do CBIR: paradigma Índice Invertido; índice invertido - ganho na velocidade de recuperação de

documentos sem perda de qualidade na recuperação;

Page 5: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

5

Trabalhos Relacionados

[Matos et al, 2008a] - sistema de recuperação baseado em conteúdo: técnicas textuais - indexação e cálculo da similaridade;

termos da recuperação textual palavras presentes nos arquivos textuais - na recuperação por conteúdo :

faixas de valores extraídos da imagem através característica de baixo nível - momentos de cor;

momentos de cor - caracteriza as imagens em termos da distribuição dos canais de cores:

três medidas estatísticas: média, desvio padrão e obliqüidade;

Page 6: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Trabalhos Relacionados - [Matos et al, 2008a] imagens - espaço de cor RGB para o espaço de cor

HSV e calculo dos três momentos para cada canal H, S e V – vetor com nove posições;

Imagens indexadas com os valores - cada canal de cor HSV;

similaridade - cosseno entre os vetores; melhoria no desempenho do processamento:

sem perda significativa na qualidade da recuperação quando comparada com a busca por distância euclidiana;

Page 7: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

7

Vetor de Característica

Tabela 1 – Descrição do vetor de característica resultante da extração de característica da imagem usando os três momentos de cor do espaço HSV, [Matos et al, 2008a].

Page 8: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

8

Índice Invertido

Africa10: MHA...DSC...IVHFlor13: MHB...DSD...IVHAfrica12: MHB...DSD...IVHÔnibus33: MHA...DSC...IVH . . .

Imagens MHA

Vocabulário

IVHIVH

MHB

DSCDSD

Lista Invertida

áfrica10, ônibus33...áfrica12, flor13, ...

áfrica10, ônibus33...áfrica12, flor13, ...

áfrica12, ônibus33...áfrica10, flor13, ...

Índice Invertido

Page 9: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

9

Cálculo da Similaridade –Utilizando o Índice Invertido

Imagem de Consulta:

Vetor de característica Ic =[MHA, MSB]

I1 = [MHA ,MSC]

I2 = [MHB, MSC]

I3 = [MHA,MSB]

I4 = [MHF,MSD]

Banco de dados de imagens

Lista Invertida:MHA I1, I3

MHB I2

MHC I4

MSB I3

MSC I1, I2

MSD I4

Neste caso teríamos as imagens ordenadas da seguinte forma:

I3, I1

Vetor de característica Ic =[MHA, MSB]Vetor de característica Ic =[MHA, MSB]

Lista Invertida:MHA I1, I3

MHB I2

MHC I4

MSB I3

MSC I1, I2

MSD I4

Lista Invertida:MHA I1, I3

MHB I2

MHC I4

MSB I3

MSC I1, I2

MSD I4

Lista Invertida:MHA I1, I3

MHB I2

MHC I4

MSB I3

MSC I1, I2

MSD I4

Page 10: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Metodologia

algoritmos de segmentação - obter uma segmentação satisfatória das imagens;

adaptar o algoritmo desenvolvido em [Matos et al, 2008a]: atribuir os termos da Tabela 1 a cada segmento

das imagens segmentadas;

vetor - termos encontrados em todos os segmentos da imagem;

Page 11: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Segmento 1 = [MHA, DHC, ....., IVE] Segmento 2 = [MHB, DHG, ......, IVA]

Imagem 1 = Segmento 1 + Segmento 2

Imagem 1

Imagem 1 = [MHA, MHB, DHC, DHG, ......, IVA, IVE]

Segmentação

Page 12: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Metodologia

importância do termo no documento: trabalhos [Matos et al, 2008a] e [Matos et al,

2008b] - pesos de valores fixos são atribuídos as faixas de valores;

discriminação dos termos : estudar formas de reformular esses pesos;

observando a distribuição destes termos nos segmentos;

Page 13: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Metodologia

experimentos - coleção referência com aproximadamente 32.000 imagens, [Datta et al, 2008];

objetivo principal - ganho no tempo de execução em grandes coleções sem perder a qualidade da recuperação;

Page 14: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

14

Banco de dados da imagem

Page 15: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

15

Resultados Esperados Aumentar qualitativamente e

quantitativamente a quantidade de faixas - segmentação de imagens;

Atribuição de pesos em cada faixa - uma melhor discriminação entre as faixas;

Melhorar a qualidade da precisão obtida no trabalho [Matos et al, 2008a], mantendo o ganho de desempenho no processamento da consulta;

Page 16: Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando

Muito Obrigada!

Patrícia Proença

[email protected]