novo método para normalização da iluminação em ... · novo método para normalização da...

5
Novo método para normalização da iluminação em imagens de face Michelle M. Mendonça 1 , Juliana G. Denipote 2 , Ricardo A. S. Fernandes 3 , Maria Stela V. Paiva 4 , Escola de Engenharia de São Carlos – EESC. Universidade de São Paulo – USP {chelle.3m 1 , ricardo.asf 3 }@gmail.com , {judeni 2 , mstela 4 }@sel.eesc.usp.br Abstract Normalização da iluminação é uma tarefa bastante complexa no reconhecimento de faces. Este artigo descreve o método GamaAdapt desenvolvido para amenizar a má influência da iluminação em imagens faciais além de descrever três métodos (LogAbout, filtro homomórfico e wavelet) e comparar suas contribuições para posterior reconhecimento de faces. Análise de Componente Principal (PCA) foi utilizada para o reconhecimento facial. 1. Introducão Reconhecimento de faces tem sido considerado um problema desafiador na comunidade de visão computacional. Variações em relação à mudança de pose, expressão, ou distribuição da iluminação, fazem com que a detecção de face seja uma tarefa extremamente difícil. Dentre essas variações, mudanças de pose e iluminação são consideradas os fatores mais críticos para um reconhecimento de face robusto. Algoritmos de realce de contraste bem conhecidos, tais como equalização do histograma são métodos globais e não consideram detalhes na imagem que são muito importantes para o reconhecimento facial [1]. Transformações logarítmicas aumentam os baixos níveis de cinza e comprimem os altos, são úteis para imagens não uniformes e com sombras, entretanto não são úteis para imagens com brilho [2]. O filtro homomórfico proporciona simultaneamente intervalo dinâmico de compressão e realce de contraste, este algoritmo é limitado ao tamanho da imagem 2 n x2 n [2]. Shan et al. [3] investigou diversos métodos de normalização da iluminação e propôs novas soluções, tais como Correção de Intensidade Gama (GIC), Estratégia Baseada em Região combinando GIC e Equalização do Histograma (HE) e o método Quotient Illumination Relighting (QIR). Chen et al. [4] utilizou a transformada do Cosseno Discreta (DCT) para compensar variações da iluminação no domínio logarítmico. Este método não requer nenhum passo de modelagem e pode ser facilmente implementado em sistema de reconhecimento facial em tempo real. Zhu et al. [5] propôs um método para correção de iluminação normalizando o contraste da imagem por meio de uma transformação afim efetuando uma estimação de fundo e ganho. Foi proposta uma comparação entre método desenvolvido (GamaAdapt) com outros métodos de normalização de imagens de face encontrados na literatura, tais como o método LogAbout [2], filtro homomórfico modificado [6] e método baseado em wavelet [1] para tarefas de reconhecimento facial. Este artigo está organizado da seguinte forma: na seção 2 é descrita uma breve introdução da fundamentação teórica. Métodos utilizados para normalização de iluminação são descritos na seção 3. Na seção 4 é introduzido o método GamaAdapt. É apresentada uma breve introdução de reconhecimento de faces utilizando PCA na seção 5. As seções 6 e 7 mostram resultados e conclusões. 2. Fundamentação teórica Nesta seção será apresentada uma breve descrição de transformações logarítmicas, filtro homomórfico Butterworth e wavelet, uma vez que estas técnicas foram utilizadas nos métodos de compensação de iluminação que serão apresentadas na próxima seção. 2.1 Transformações não lineares Transformações não lineares são usadas freqüentemente em visão computacional, os tipos mais comuns de funções de transferências estão ilustradas na figura 1. A curva da função logarítmica tem como objetivo aumentar níveis de cinza baixos e comprimir níveis de cinza altos, o que pode melhorar iluminações deficientes. Transformações logarítmicas são úteis em imagens com sombra e iluminação não-uniforme. Uma função gama tem a finalidade clarear imagens escuras e escurecer imagens claras, esta função é dada pela equação 1 [7]: γ cr s = (1) onde c é uma constante, geralmente 1, r é a imagem original e s é a imagem final. A transformação gama com valor de γ < 1 tende a reduzir a intensidade luminosa, enquanto as

Upload: trankiet

Post on 12-Jan-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Novo método para normalização da iluminação em ... · Novo método para normalização da iluminação em imagens de face ... inverso, ou seja, ... agrupadas para reconstruí-la

Novo método para normalização da iluminação em imagens de face

Michelle M. Mendonça1, Juliana G. Denipote2, Ricardo A. S. Fernandes3, Maria Stela V. Paiva4, Escola de Engenharia de São Carlos – EESC. Universidade de São Paulo – USP

{chelle.3m1, ricardo.asf3}@gmail.com , {judeni2, mstela4}@sel.eesc.usp.br

Abstract

Normalização da iluminação é uma tarefa bastante complexa no reconhecimento de faces. Este artigo descreve o método GamaAdapt desenvolvido para amenizar a má influência da iluminação em imagens faciais além de descrever três métodos (LogAbout, filtro homomórfico e wavelet) e comparar suas contribuições para posterior reconhecimento de faces. Análise de Componente Principal (PCA) foi utilizada para o reconhecimento facial.

1. Introducão

Reconhecimento de faces tem sido considerado um problema desafiador na comunidade de visão computacional. Variações em relação à mudança de pose, expressão, ou distribuição da iluminação, fazem com que a detecção de face seja uma tarefa extremamente difícil. Dentre essas variações, mudanças de pose e iluminação são consideradas os fatores mais críticos para um reconhecimento de face robusto.

Algoritmos de realce de contraste bem conhecidos, tais como equalização do histograma são métodos globais e não consideram detalhes na imagem que são muito importantes para o reconhecimento facial [1]. Transformações logarítmicas aumentam os baixos níveis de cinza e comprimem os altos, são úteis para imagens não uniformes e com sombras, entretanto não são úteis para imagens com brilho [2]. O filtro homomórfico proporciona simultaneamente intervalo dinâmico de compressão e realce de contraste, este algoritmo é limitado ao tamanho da imagem 2nx2n [2].

Shan et al. [3] investigou diversos métodos de normalização da iluminação e propôs novas soluções, tais como Correção de Intensidade Gama (GIC), Estratégia Baseada em Região combinando GIC e Equalização do Histograma (HE) e o método Quotient Illumination Relighting (QIR). Chen et al. [4] utilizou a transformada do Cosseno Discreta (DCT) para compensar variações da iluminação no domínio logarítmico. Este método não requer nenhum passo de modelagem e pode ser facilmente implementado em sistema de reconhecimento facial em tempo real. Zhu et al. [5] propôs um método para correção de iluminação normalizando o contraste da

imagem por meio de uma transformação afim efetuando uma estimação de fundo e ganho.

Foi proposta uma comparação entre método desenvolvido (GamaAdapt) com outros métodos de normalização de imagens de face encontrados na literatura, tais como o método LogAbout [2], filtro homomórfico modificado [6] e método baseado em wavelet [1] para tarefas de reconhecimento facial.

Este artigo está organizado da seguinte forma: na seção 2 é descrita uma breve introdução da fundamentação teórica. Métodos utilizados para normalização de iluminação são descritos na seção 3. Na seção 4 é introduzido o método GamaAdapt. É apresentada uma breve introdução de reconhecimento de faces utilizando PCA na seção 5. As seções 6 e 7 mostram resultados e conclusões.

2. Fundamentação teórica Nesta seção será apresentada uma breve descrição de

transformações logarítmicas, filtro homomórfico Butterworth e wavelet, uma vez que estas técnicas foram utilizadas nos métodos de compensação de iluminação que serão apresentadas na próxima seção. 2.1 Transformações não lineares

Transformações não lineares são usadas freqüentemente em visão computacional, os tipos mais comuns de funções de transferências estão ilustradas na figura 1. A curva da função logarítmica tem como objetivo aumentar níveis de cinza baixos e comprimir níveis de cinza altos, o que pode melhorar iluminações deficientes. Transformações logarítmicas são úteis em imagens com sombra e iluminação não-uniforme.

Uma função gama tem a finalidade clarear imagens escuras e escurecer imagens claras, esta função é dada pela equação 1 [7]:

γcrs= (1)

onde c é uma constante, geralmente 1, r é a imagem

original e s é a imagem final. A transformação gama com valor de γ < 1 tende a

reduzir a intensidade luminosa, enquanto as

Page 2: Novo método para normalização da iluminação em ... · Novo método para normalização da iluminação em imagens de face ... inverso, ou seja, ... agrupadas para reconstruí-la

transformações com valores maiores que 1 fazem o inverso, ou seja, tornam a imagem mais clara.

Figura 1: Transformações não-lineares [7]

2.2 Filtro Homomórfico Butterworth

O filtro homomórfico é um filtro utilizado para realçar as altas freqüências e atenuar as baixas freqüências, a figura 2 mostra em corte um exemplo da função de transferência H(u,v) em função de D(u,v) (distância a partir da origem do par de coordenadas (u,v)). Um resumo deste método pode ser encontrado na figura 3, onde DFT é a transformada discreta de Fourier e (DFT)-1 é sua transformada inversa [6].

Figura 2: Filtro Butterworth passa-alta

Figura 3: Passos filtro homomórfico

Um filtro passa-alta normalmente usado para este

procedimento é o filtro Butterworth definido como [7]:

n

vuDD

vuH2

0),(1

1),(

+

= (2)

onde n define a ordem do filtro. D0 é a distância da

freqüência de corte do centro e D(u,v) é dado por:

[ ] 2/122 )2/()2/(),( NvMuvuD −+−= (3)

onde M é o número de linhas e N o número de colunas

da imagem original. 2.3 Wavelets

A Transformada de Wavelets bi-dimensional para sinais discretos é definida como [1]:

∑ ∑∑+=k j k

k,jk,jk,k, )x(d)x(a)x(f ψΦ 00 (4)

ondeΦ são funções scaling na escala j e k,jψ são

funções wavelet na escala j . ajk , djk são coeficientes scaling e wavelet.

Para transformação Wavelet Discreta 2D (DWT), uma

imagem é representada em termos de translações e dilatações das funções scaling e wavelet. Os coeficientes scaling e wavelet podem ser facilmente computados utilizando um banco de filtros 2D consistindo de filtros passa-alta e passa-baixa. Após um nível de decomposição 2D, a imagem é dividida em quarto sub-bandas: LL (passa-baixa passabaixa), que é gerada pelos coeficientes de aproximação; LH (passa-baixa passa-alta), HL (passa-alta passa-baixa), e HH (passa-alta passa-alta), que são gerados pelos coeficientes de detalhe [1]. 3. Métodos de normalização da iluminação

Nesta seção será apresentada uma breve discussão dos métodos utilizados para compensação da iluminação. 3.1 LogAbout

O método LogAbout proposto por Liu et al. [2] consiste da aplicação de um filtro passa-alta seguida de uma transformação logarítmica. A transformação logarítmica utilizada foi:

Page 3: Novo método para normalização da iluminação em ... · Novo método para normalização da iluminação em imagens de face ... inverso, ou seja, ... agrupadas para reconstruí-la

cb

yxfayxg

ln

)1),(ln(),(

++= (5)

onde f(x,y) é a imagem original, a, b e c são parâmetros

que controlam a localização e forma da curva logarítmica.

Figura 4: Máscara

O filtro passa-alta utilizado neste processo encontra-se

na figura 4, resultados estão ilustrados na figura 5.

Figura 5: (1) Imagem original (2) Depois da

transformação Log (3) Depois do método LogAbout [2]

3.2 Adaptação do Filtro Homomórfico

Neste método a imagem é dividida verticalmente em duas metades (obtendo-se duas sub-imagens da imagem original) (figura 6) e aplicado o filtro em cada metade individualmente. Neste método foi utilizado filtro Buttherwort com freqüência de corte Do = 0.25 e n = 1. Seguindo esta idéia, a imagem original é dividida horizontalmente e novamente é aplicado o filtro em cada metade individualmente [6].

Após a divisão da imagem e aplicação do pré-processamento em cada metade, as sub-imagens são agrupadas para reconstruí-la. A imagem de saída, IHMMOD(x,y), é dada por:

)],(.75.0),(.[21),( yxIyxIyxI HMHHMVHMMOD += (6)

onde IHMV(x,y) é a imagem dividida verticalmente,

depois da aplicação do filtro homomórfico, e IHMH(x,y) é a imagem dividida horizontalmente.

Figure 6: Variação do filtro homomórfico [6]

3.3 Wavelets

A imagem é decomposta em altas (sub-bandas LH, HL e HH da figure 7) e baixas freqüências (LL2). Equalização do histograma é aplicada nos coeficientes de aproximação, e ao mesmo tempo são acentuados os detalhes (alta freqüência) multiplicando cada elemento da matriz dos coeficientes de detalhe por um escalar > 1 [1].

Figura 7: Estrutura multi-resolução

A imagem é reconstruída dos coeficientes de

aproximação e detalhes em todas as 3 direções usando a transformada wavelet inversa, resultando na imagem normalizada.

Figura 8: Decomposição wavelet da imagem de face [1]

4. Método GamaAdapt

No novo método desenvolvido (figura 11) foi aplicado inicialmente na imagem um filtro da média com máscara 3x3 com a finalidade de diminuir a influência de pixels isolados com valores muito altos ou muito baixos, logo

Page 4: Novo método para normalização da iluminação em ... · Novo método para normalização da iluminação em imagens de face ... inverso, ou seja, ... agrupadas para reconstruí-la

depois foi aplicado a equalização do histograma para melhorar o contraste da imagem.

Foi observado que pixels muito escuros das imagens estavam no intervalo [0,60], pixels escuros no intervalo [61,120], pixels claros estavam no intervalo [121,189] e muito claros no intervalo [235,255]. Então foi efetuada a média total de pixels da imagem para encontrar em qual intervalo a imagem se enquadraria, para finalmente utilizar a correção gama com valores adequados, conforme pode ser observado na figura 9. Após a aplicação da transformação gama obtém-se a imagem normalizada.

Figura 9: Estrutura do método GamaAdapt

5. Reconhecimento de face utilizando PCA

PCA é um método para reconhecimento de padrão numa determinada base de dados e expressa as similaridades e diferenças a respeito de uma imagem alvo [8]. O espaço PCA tem dimensionalidade reduzida sem muita perda de informação. O método PCA consiste em calcular a média dos valores do conjunto de treinamento, a matriz de covariância e seus auto-vetores e auto-valores. A média dos valores de cada classe de imagem é calculada e projetada no espaço PCA, compondo assim os dados de entrada para a rede neural.

Após o treinamento, a rede neural LVQ (Learning Vector Quantization) é capaz de identificar se uma imagem de face pertence ou não ao banco de dados.

6. Resultados

Foi utilizado um subconjunto do banco Yale Face Database B [9] contendo imagens em tons de cinza de 10 pessoas, cada uma sobre 10 diferentes condições de iluminação. Exemplos de imagens de três indivíduos do banco utilizado encontram-se na figura 10.

O resultado da taxa de reconhecimento do PCA sem aplicar normalização de iluminação foi de 77%. A tabela 1 mostra os resultados obtidos após aplicação dos métodos de compensação da iluminação antes do uso do PCA, e na figura 11 é possível observar resultados obtidos após utilização dos métodos de normalização da iluminação.

Tabela 1: Taxa de reconhecimento de cada método

Método Taxa de reconhecimento Sem normalização da iluminação

77%

Adaptação do filtro homomórfico

79%

LogAbout 91% Wavelet 93% Método GamaAdapt 96%

Figura 10: Amostra de 3 faces utilizadas

Page 5: Novo método para normalização da iluminação em ... · Novo método para normalização da iluminação em imagens de face ... inverso, ou seja, ... agrupadas para reconstruí-la

7. Conclusão Neste trabalho foram comparados quatro métodos de

normalização da iluminação. Todos os métodos analisados obtiveram melhores resultados no reconhecimento facial do que a não utilização de algum tipo de pré-processamento.

O método GamaAdapt desenvolvido obteve melhores resultados, devido este analisar a imagem como um todo para verificar se esta é escura ou clara e assim poder efetuar correção de contraste na imagem. A utilização de wavelet obteve segundo melhor resultado, este fato ocorre porque a imagem resultante não tem apenas realce de contraste, mas também realce de bordas e detalhes o que facilita futuras tarefas de reconhecimento de faces [1].

Para se obter uma melhor taxa de acerto no reconhecimento será proposta para uma próxima etapa uma técnica de amenização da iluminação que além de avaliar a imagem globalmente também analisará a influência de cada pixel da imagem. Também serão comparados outros métodos de reconhecimento facial, uma vez que é possível obter resultados diferentes com cada método de correção de iluminação.

Figura 11: a) Imagem original, b) Adaptação do filtro

homomórfico, c) LogAbout, d) Método proposto Agradecimentos

Os autores gostariam de agradecer a "Yale Face Database B" pelas imagens, e Juliana G. Denipote gostaria de agradecer ao CNPq pelo suporte financeiro.

Referências [1] S. Du and R. Ward, “Wavelet-Based Illumination Normalization For Face Recognition”, Proc. of IEEE International Conference on Image Processing, vol. 2, 2005, pp. 954-957. [2] H. Liu, W. Gao, J. Miao, D. Zhao, G. Deng and J. Li , “Illumination Compensation and Feedback of Illumination Feature in Face Detection” , Proc. IEEE International Conferences on Info-tech and Info-net, vol. 23, 2001, pp. 444-449. [3] S. Shan, W. Gao, B. Cao and D. Zhao, “Illumination Normalization for Robust Face Recognition Against Varying Lighting Conditions”, Proc. of the IEEE International Workshop on Analysis and Modeling of Faces and Gestures, vol. 17, 2003, pp. 157-164. [4] W. Chen, M. J. Er and S. Wu, “Illumination Compensation and Normalization Using Logarithm and Discret Cosine Transform”, Proc. of IEEE Internacional Conference on Control, Automation, Robotics and Vision, vol. 1, 2004, pp. 380-385. [5] J. Zhu, B. Liu, S and C. Schwartz, “General Illumination Correction and its Application to Face Normalization”, IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 3, 2003, pp. 133-6. [6] K. Delac, M. Grgic and T. Kos, “Sub-Image, Homomorphic Filtering Techniques for Improving Facial Identification under Difficult Illumination Conditions”. Internacional Conference on System, Signals and Image Processing. Budapest, 2006. [7] R. C. Gonzales and R. E. Woods, Digital Image Processing, Prentice Hall, 2002. [8] M. A. Turk, A. P. Pentland, “Face Recognition Using Eigenfaces”, IEEE Computer Society Conference, 1991 pp. 586-591. [9] A. S. Georghiades, P. N. Belhumeur and D. J. Kriegman, “From Few To Many: Generative Models For Recognition Under Variable Pose and Illumination”, IEEE Int. Conf. on Automatic Face and Gesture Recognition, 2000, pp. 277-284.