classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos...
TRANSCRIPT
Classificação de imagens de fotografias Classificação de imagens de fotografias históricas usando detecção de linhas ehistóricas usando detecção de linhas e
paralelogramos pela presença de edifíciosparalelogramos pela presença de edifícios
Natália Cosse Batista
Grupo [email protected]
Sumário
1. Introdução2. Trabalhos relacionados3. Definição do problema4. Metodologia5. Testes preliminares6. Classificação simples por limiar7. Classificação com SVM8. Conclusões9. Trabalhos futurosReferências principais
1. Introdução (1/2)
• Base de imagens do APM: 6.000 imagens digitais.
1. Introdução (2/2)
• Objetivo: classificar as imagens com base na presença de edifícios.
• Edifícios: são objetos feitos pelo homem com bordas bem definidas e contornos retilíneos. Contém características regulares causadas principalmente pela presença de janelas e portas, que são evidência de estrutura na imagem.
• Classes:– Edifícios– Intermediárias– Não-edifícios
2. Trabalhos relacionados (1/3)
• Iqbal e Aggarwal: recuperação por classificação de imagens contendo grandes objetos feitos pelo homem usando agrupamento perceptivo.
• Características: número de linhas longas, junções em L, junções em U, grupos paralelos e polígonos.
2. Trabalhos relacionados (2/3)
• Transformada de Hough:
– linhas são representadas por pontos no espaço de parâmetros.
– Tamanho dos picos estão relacionados ao número de pixels que compõe a linha.
2. Trabalhos relacionados (3/3)
• Jung e Schramm: detecção de paralelogramos utilizando Transformada de Hough particionada.
• Picos aparecem aos pares: simetria em relação ao eixo θ.
• Distâncias horizontais: ângulo entre pares.• Distâncias verticais (eixo ρ)
entre os pares de picos são os
lados do paralelogramo.
3. Definição do problema
• Classificar as imagens em edifícios, intermediárias e não-edifícios com base nas características: número de linhas e número de paralelogramos.
4. Metodologia (1/2)
• Separar um conjunto de 90 imagens nas três classes.
• Filtros para melhorar qualidade da imagem (Gaussiano e melhora do contraste).
• Detectar bordas (Canny).
• Detectar linhas.
• Detectar paralelogramos.
4. Metodologia (2/2)
5. Testes preliminares
• Imagens sintéticas: para análise dos parâmetros do detector de linhas e paralelogramos.
• Redução da resolução, retirada da moldura, filtro gaussiano, filtro para melhora do contraste.
6. Classificação simples por limiar (1/2)
• Tiles 20x20 e lado mínimo = 10. • Nos experimentos com 25 imagens, 5 de cada
configuração, foram selecionados limiares para o # linhas e # paralelogramos.
• Resultados
para 90 imagens:
maior parte foi
classificada como
intermediária.
6. Classificação simples por limiar (2/2)
7. Classificação com SVM (1/3)
• Support Vector Machine (SVM): encontra um hiperplano que separa os vetores de treino mapeados em um espaço de dimensão mais alta.
• 45 imagens de treino, 15 de cada classe.• 45 imagens de teste, 15 de cada classe.• Kernel RBF (radial basis function): relação não-linear.• 9 características:
– # paralelogramos– # linhas– # paralelogramos / # linhas– # linhas ≥ 40 / # linhas– # linhas ≥ 50 / # linhas– # linhas ≥ 60 / # linhas– # linhas ≥ 70 / # linhas– # linhas ≥ 80 / # linhas– # linhas ≥ 100 / # linhas
7. Classificação com SVM (2/3)
• Resultado: 62% (28/45)
7. Classificação com SVM (3/3)
8. Conclusões
• Resultados precisam ser melhorados, características escolhidas só possibilitam 62% de acerto na classificação.
• Deve-se incluir mais características no modelo, principalmente levando-se em conta o posicionamento dos paralelogramos.
9. Trabalhos futuros
• Selecionar novas características, por exemplo um histograma de orientações dos paralelogramos.
• Utilizar um conjunto maior de imagens para treinamento e testes.
• Testar outros filtros para melhorar qualidade das imagens.
Referências principais
• Q. Iqbal and J. Aggarwal. Retrieval by classification of images containing large manmade objects using perceptual grouping. Pattern Recognition, 35(7):1463–1479, July 2002.
• C. Jung and S. Rosito. Parallelogram detection using the tiled hough transform. In Proceedings of 13th International Conference on Systems, Signals and Image Processing, volume I, pages 177–180, 2006.
• C. Chang and C. Lin. LIBSVM : a library for support vector machines, 2001. Software available athttp://www.csie.ntu.edu.tw/~cjlin/libsvm .