reconhecimento de pessoas pela marcha usando … cabral mendes reconhecimento de pessoas pela marcha...

59
U NIVERSIDADE F EDERAL DE G OIAS I NSTITUTO DE I NFORMÁTICA WEDER C ABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Goiânia 2016

Upload: vuanh

Post on 07-Feb-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

UNIVERSIDADE FEDERAL DE GOIAS

INSTITUTO DE INFORMÁTICA

WEDER CABRAL MENDES

Reconhecimento de Pessoas pelaMarcha usando Redução de

Dimensionalidade de Contornos noDomínio da Frequência

Goiânia2016

Page 2: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

UNIVERSIDADE FEDERAL DE GOIAS

INSTITUTO DE INFORMÁTICA

AUTORIZAÇÃO PARA PUBLICAÇÃO DE DISSERTAÇÃO

EM FORMATO ELETRÔNICO

Na qualidade de titular dos direitos de autor, AUTORIZO o Instituto de Infor-mática da Universidade Federal de Goias – UFG a reproduzir, inclusive em outro formatoou mídia e através de armazenamento permanente ou temporário, bem como a publicar narede mundial de computadores (Internet) e na biblioteca virtual da UFG, entendendo-seos termos “reproduzir” e “publicar” conforme definições dos incisos VI e I, respectiva-mente, do artigo 5o da Lei no 9610/98 de 10/02/1998, a obra abaixo especificada, sem queme seja devido pagamento a título de direitos autorais, desde que a reprodução e/ou publi-cação tenham a finalidade exclusiva de uso por quem a consulta, e a título de divulgaçãoda produção acadêmica gerada pela Universidade, a partir desta data.

Título: Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidadede Contornos no Domínio da Frequência

Autor(a): Weder Cabral Mendes

Goiânia, 31 de Março de 2016.

Weder Cabral Mendes – Autor

Dr. Gustavo Teodoro Laureano – Orientador

Dr. Anderson da Silva Soares – Co-Orientador

Page 3: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

WEDER CABRAL MENDES

Reconhecimento de Pessoas pelaMarcha usando Redução de

Dimensionalidade de Contornos noDomínio da Frequência

Dissertação apresentada ao Programa de Pós–Graduação doInstituto de Informática da Universidade Federal de Goias,como requisito parcial para obtenção do título de Mestre emPrograma de Pós-Graduação em Ciência da Computação.

Área de concentração: Ciência da Computação.

Orientador: Prof. Dr. Gustavo Teodoro Laureano

Co-Orientador: Prof. Dr. Anderson da Silva Soares

Goiânia2016

Page 4: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

WEDER CABRAL MENDES

Reconhecimento de Pessoas pelaMarcha usando Redução de

Dimensionalidade de Contornos noDomínio da Frequência

Dissertação defendida no Programa de Pós–Graduação do Instituto deInformática da Universidade Federal de Goias como requisito parcialpara obtenção do título de Mestre em Programa de Pós-Graduação emCiência da Computação, aprovada em 31 de Março de 2016, pela BancaExaminadora constituída pelos professores:

Prof. Dr. Gustavo Teodoro LaureanoInstituto de Informática – UFG

Presidente da Banca

Prof. Dr. Anderson da Silva SoaresInstituto de Informática – UFG

Prof. Dr. Clarimar José CoelhoPontifícia Universidade Católica de Goiás - PUCGO

Prof. Dr. Ronaldo Martins da CostaInstituto de Informática - UFG

Page 5: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Todos os direitos reservados. É proibida a reprodução total ou parcial dotrabalho sem autorização da universidade, do autor e do orientador(a).

Weder Cabral Mendes

Graduou-se em Ciência da Computação na UFG - Universidade Federal deGoiás/Campus Jataí. Durante o Mestrado, na UFG - Universidade Federal deGoiás, foi bolsista da CAPES e teve como trabalho desenvolvido, um métodode reconhecimento de pessoas baseado na marcha humana.

Page 6: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

À minha mãe, por todo amor, dedicação e por ser a base para que eu conseguissealcançar todos meus objetivos.

Page 7: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Agradecimentos

Agradeço a minha mãe Cleusa, meus irmãos Udson, Udenys e Wendel porsempre estarem presentes me apoiando e ajudando, principalmente nas horas difíceis.

À minha namorada Celita pelo carinho, respeito, amor, companheirismo e paci-ência em todos os momentos.

Ao meu orientador Prof. Dr. Gustavo Teodoro Laureano pela oportunidade,amizade, dedicação, ensino e paciência.

Ao meu co-orientador Prof. Dr. Anderson da Silva Soares pela oportunidade etodo apoio e incentivo prestado à pesquisa realizada.

Aos meus amigos Douglas Zanuzzi, Douglas Fernandes, Márcio Lima, MatheusUllmann, Maycon Douglas, Rafael Tomaz, Thyago Carvalo e Tiago Nogueira pela ami-zade, ajuda e momentos compartilhados de alegria e dificuldade.

Aos meus padrinhos Edson e Cleusa por todo carinho e atenção.Aos meus tios Alan e Adriane pela receptividade, carinho e ajuda.Aos meus primos/irmãos Alan, Lorrany e Pedro pelo companheirismo, amizade

e momentos compartilhados.Por último, agradeço a CAPES que financiou a bolsa e possibilitou a atividade

exclusiva e focada no trabalho.

Page 8: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

"Pensar é o trabalho mais difícil que existe. Talvez por isso tão poucos sedediquem a ele."

Henry Ford.

Page 9: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Resumo

Mendes, Weder Cabral. Reconhecimento de Pessoas pela Marcha usando Re-dução de Dimensionalidade de Contornos no Domínio da Frequência. Goiâ-nia, 2016. 57p. Dissertação de Mestrado. Instituto de Informática, UniversidadeFederal de Goias.

O reconhecimento de pessoas através da marcha humana via visão computacional temganhado destaque por ser uma técnica biométrica não invasiva e principalmente por suavantagem de reconhecer pessoas à distância. O reconhecimento é realizando extraindocaracterísticas contidas na marcha de cada pessoa, essas características são extraídas desequências de imagens da pessoa caminhando. Os principais desafios dessa técnica bio-métrica está em extrair as características com informações que consigam diferenciar umapessoa da outra, além disso, o uso de acessórios e vestimentas dificultam o processo de ex-tração de características. Este trabalho propõe um método de reconhecimento baseado namarcha humana utilizando informações dos contornos das pessoas transformados para odomínio da frequência por meio da Transformada Discreta de Fourier. Como são geradasmuitos dados a partir dos contornos, três técnicas diferentes de redução de dimensiona-lidade CDA (Class Discrimination Ability), PCA (Principal Component Analysis) e PLS(Partial Least Squares) são empregadas para reduzir a quantidade de dados e gerar ca-racterísticas que sejam relevantes para o sistema de reconhecimento. Dois classificadores,KNN (K-Nearest Neighbor) e LDA (Linear Discriminant Analysis) classificam as carac-terísticas retornadas pelos métodos de redução de dimensionalidade. As taxas de acuráciasão obtidas pelos resultados gerados entre a combinação dos métodos de redução de di-mensionalidade e os classificadores, a maior taxa de acurácia foi de 92,67%, a qual foialcançada com a combinação entre o LDA e PCA (LDAPCA). Dessa forma, conclui-se queas informações contidas no contorno da silhueta no domínio da frequência são discrimi-nantes para reconhecer pessoas através da marcha.

Palavras–chave

marcha humana, biometria, baseado em silhueta, reconhecimento da marchahumana, redução de dimensionalidade, domínio da frequência

Page 10: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Abstract

Mendes, Weder Cabral. Human Gait Recognition using Dimensionality Re-duction of Contours in the Frequency Domain. Goiânia, 2016. 57p. MSc.Dissertation. Instituto de Informática, Universidade Federal de Goias.

Gait recognition via computer vision attracted increasing interest for its noninvasive cha-racteristic and mainly for your advantage of recognizing people at distance. Recognitionis performing extracting features included in gait, this features are extracted from imagessequence of people walking. The main challenges of gait recognition is to extract cha-racteristics with unique information for each person, in additional, the use of accessoriesand clothes difficult the feature extraction process. This paper proposes a gait recognitionmethod using information of people’s contours transformed in domain frequence by Dis-crete Fourier Transform. A lot of data are generated from the contours, thereby, three dif-ferent techniques for dimensionality reduction CDA (Class Discrimination Ability), PCA(Principal Component Analysis) and PLS (Partial Least Squares) are employed to reducethe dimensionality of data and generate characteristics that are relevant to the recongni-tion system. Two classifiers, KNN (K-Nearest Neighbor) and LDA (Linear DiscriminantAnalysis) classify the characteristics that are returned by the dimensionality reductionmethods. The accuracy are achieved by the combination of the dimensionality reductionmethods and classifiers, the highest accuracy was 92.67%, which was achieved with thecombination between the LDA and PCA (LDAPCA). Therefore, the results show that theinformation contained in the contours of silhouette are discriminant to recognize peopleby their gait.

Keywords

human gait, biometry, silhuette based, gait recognition, dimensionality reduction,frequency domain

Page 11: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Sumário

Lista de Figuras 11

Lista de Tabelas 13

1 Introdução 141.1 Objetivo Geral 17

1.1.1 Objetivos Específicos 181.2 Organização do Trabalho 18

2 A Marcha Humana na Biometria 192.1 A Marcha Humana 19

2.1.1 Ciclo da Marcha 192.2 Representação Digital da Marcha Humana 212.3 Transformada de Fourier 222.4 Redução de Dimensionalidade 23

2.4.1 Habilidade de Discriminação por Classe 232.4.2 Análise de Componentes Principais 242.4.3 Mínimos Quadrados Parciais 25

2.5 Reconhecimento 272.5.1 K-Vizinhos Mais Próximos 272.5.2 Análise Discriminante Linear 28

3 Metodologia 293.1 Considerações Iniciais 293.2 Extração de Características 31

3.2.1 Detecção do Ciclo da Marcha 313.2.2 Extração e Normalização do Contorno 323.2.3 Representação da silhueta no domínio da frequência 35

3.3 Redução de Dimensionalidade 373.4 Reconhecimento 37

4 Resultados 394.1 Considerações Iniciais 394.2 Metodologia para Avaliação dos Resultados 39

4.2.1 Base de Dados 414.3 Avaliação dos Resultados 42

4.3.1 Teste 1 424.3.2 Teste 2 444.3.3 Teste 3 47

Page 12: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3.4 Teste 4 48

5 Conclusão e Trabalhos Futuros 515.0.1 Conclusão 515.0.2 Trabalhos Futuros 525.0.3 Publicação 52

Referências Bibliográficas 53

Page 13: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Lista de Figuras

2.1 Representação de um ciclo da marcha com a ilustração de suas fases deapoio e balanço. 20

2.2 Ciclo da marcha representada por passos (PERRY, 2005). 212.3 Imagem binária com o fundo preto e uma silhueta, retornada por um

método de segmentação de fundo. 222.4 Sequência de silhuetas da marcha humana para um sujeito. 22

3.1 Diagrama da metodologia proposta para o Reconhecimento de Pessoasatravés da Marcha Humana. 30

3.2 Largura da silhueta em função da sequência de frames da marcha de umapessoa. A largura W apresenta um comportamento oscilatório correspon-dente aos ciclos de uma marcha. 32

3.3 Representação do contorno de uma silhueta. Adaptado de (MU; YU;WANG, 2009). 34(a) Contorno em 2D da silueta de uma pessoa para um frame, uma

distância d1 entre um pixel do contorno e o Centro de Massa. 34(b) Sinal d j. 34

3.4 Matriz de contornos C duas pessoas diferentes, ilustrando as diferençasinter-classe geradas pelo sinal unidimensional do contorno. 35(a) Pessoa 1 35(b) Pessoa 2 35

3.5 Matrizes F. 36(a) Matriz F com as altas frequências no centro. 36(b) Matriz F com as baixas frequências no centro. 36

4.1 Exemplos de silhuetas com blocos desconectados e espaços vazios emseu interior. 42

4.2 Acurácia do KNN para variações de K e a quantidade de componentesobtidos via CDA. Resultados obtidos considerando a magnitude, fase e oproduto de ambas as características. 43(a) Magnitude 43(b) Fase 43(c) Produto 43

4.3 Acurácia do KNN para variações de K e a quantidade de componentesobtidos via PCA. Resultados obtidos considerando a magnitude, fase e oproduto de ambas as características. 43(a) Magnitude 43(b) Fase 43(c) Produto 43

Page 14: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.4 Acurácia do KNN para variações de K e a quantidade de componentesobtidos via PLS. Resultados obtidos considerando a magnitude, fase e oproduto de ambas as características. 44(a) Magnitude 44(b) Fase 44(c) Produto 44

4.5 Acurácias obtidas com o classificar KNN (K = 3) para magnitude, fase eproduto entre magnitude e fase para vários componentes dos seguintesmétodos de redução de dimensão: CDA; PCA; e PLS. 45(a) CDA 45(b) PCA 45(c) PLS 45

4.6 Acurácias obtidas com o classificar LDA para magnitude, fase e produtoentre magnitude e fase para vários componentes dos seguintes métodosde redução de dimensão: CDA; PCA; e PLS. 46(a) CDA 46(b) PCA 46(c) PLS 46

4.7 Gráfico comparativo das acurácias obtidas entre as técnicas de reduçãode dimensionalidade com o classificador LDA usando a magnitude. 47

4.8 Gráfico comparativo das acurácias obtidas entre as técnicas de reduçãode dimensionalidade com o classificador KNN usando a magnitude. 48

4.9 Curvas CMS para LDA e KNN utilizando os métodos de redução dedimensionalidade CDA, PCA e PLS. 49

Page 15: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Lista de Tabelas

4.1 Comparativo entre as melhores acurácias, considerando classificador,método de redução de dimensionalidade e quantidade de características. 48

4.2 CMS para os métodos propostos neste trabalho e métodos de outrostrabalhos. 50

Page 16: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

CAPÍTULO 1Introdução

O reconhecimento de pessoas pela marcha consiste em determinar a identidadede uma pessoa pela forma que ela caminha, utilizando características únicas contídasna marcha. O reconhecimento de pessoas pela marcha é uma método de identificaçãobiométrica que tem sido alvo de muitos estudos recentes (LI et al., 2007; WANG et al.,2010; CHAI et al., 2011), com grande potencial de aplicações em segurança, controleautomático de acesso de pessoas e análise forense (BOULGOURIS; HATZINAKOS;PLATANIOTIS, 2005; DERAWI et al., 2010; BOUCHRIKA et al., 2011).

A marcha humana é uma característica biométrica física e comportamental, quepode ser entendida como o processo de locomoção rítimica e única de uma pessoa, geradopelo ato de caminhar ou de correr (PATAKY et al., 2012). Quando a marcha é registradapor sequências de imagens, esse dado biométrico apresenta as vantagens de poder sercapturado à distância, sem a necessidade de cooperação e consentimento do indivíduo,por câmeras de baixa resolução e quando o corpo está parcialmente ocluso (NIXON;CARTER, 2006).

Os métodos tradicionais de identificação de pessoas são baseados em o que apessoa possui, tais como cartões, chaves e outros objetos identificadores, e o que vocêse lembra, como por exemplo, senhas e outras informações que podem ser memorizadas(JAIN; FLYNN; ROSS, 2008). No entanto, os métodos tradicionais lidam com problemasfrequentes de falsificação e com as limitações naturais de memória das pessoas. Por outrolado, os métodos biométricos são baseados em quem a pessoa é, pela quantificação detraços físicos, biológicos e comportamentais que são únicos para cada pessoa. Dentreas principais biometrias, destacam-se DNA (Ácido Desoxirribonucleico), face, geometriadas mãos, impressão digital, íris, marcha humana etc.

A biometria da marcha humana é estudada há décadas (ROSE; GAMBLE,1994; WHITTLE, 1996), inicialmente com o propósito médico, para a padronizaçãode normalidade da marcha, como ferramenta de auxílio ao diagnóstico de desordens dasaúde e avaliação da capacidade de movimentação (DAVIS et al., 1991). Na medicina eanálise forense, a marcha é usada como método de identificação de pessoas (DIMAGGIO;VERNON, 2011; BOUCHRIKA et al., 2011).

Page 17: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

15

O reconhecimento automático por imagens da marcha possui vantagens em re-lação a outros métodos biométricos existentes, por ser um método não invasivo e princi-palmente por conseguir reconhecer pessoas a distância (BOULGOURIS; HATZINAKOS;PLATANIOTIS, 2005; GAFUROV, 2007).

Os desafios de sistemas de visão computacional para o reconhecimento basea-dos em marcha humana estão ligados a fatores que podem influenciar o resultado do re-conhecimento, tais como vestimentas, velocidade da marcha, tipo de calçado, superfícies(grama, terra, concreto), variações no ângulo de visão da câmera, embriaguez, pessoacarregando algum objeto (mochila, bolsa). Também é um desafio extrair característicasdiscriminantes da marcha, afim de torna-la única para cada individuo.

As metodologias usadas no reconhecimento de pessoas pela marcha são dividasem duas abordagens principais de extração de características: baseadas em silhueta ebaseadas em modelo.

As abordagens baseadas em silhueta tratam as informações contidas na formae/ou no movimento da silhueta em vídeo. O contorno da silhueta é uma das característi-cas mais importantes em abordagens baseadas em silhueta (BOULGOURIS; HATZINA-KOS; PLATANIOTIS, 2005). O contorno da silhueta pode ser usado diretamente comocaracterística ou transformado para o domínio da frequência. O contorno no domínio dafrequência é comumente obtido usando a Transformada Discreta de Fourier, a qual trans-forma um sinal no domínio do tempo e/ou espaço para o domínio da frequência. Um dosprimeiros trabalhos usando abordagens baseada em silhueta é o de (BENABDELKADERet al., 2001), o qual utiliza uma imagem de auto-similaridade para representar as mudan-ças temporais em uma sequência de silhuetas. A imagem de auto-similaridade é a somada diferença de todos pixels em uma região retangular que cerca a silhueta entre um frame

da sequência de silhuetas e todos os frames.Os trabalhos (MOWBRAY; NIXON, 2003; MU; YU; WANG, 2009; LEE; TAN;

TAN, 2013) também adotam abordagem baseada em silhueta e utilizam as informaçõesdo contorno da silhueta de uma sequência de vídeo para extrair características da marchae reconhecer pessoas. Após extraído o contorno, este é transformado para o domínio dafrequência utilizando a Transformada de Fourier. Depois de transformado para o domínioda frequências, são aplicadas técnicas diferentes de redução de dimensionalidade emcada trabalho, afim de reduzir a quantidade de características oriundas do contorno,obtendo um número menor de características mais discriminantes. As característicasresultantes da redução de dimensionalidade são utilizadas para reconhecer pessoas usandoo classificador KNN (K-Nearest Neigbhor). A vantagem desses métodos está no fato deusarem os descritores de Fourier de baixas frequências, já que esses descritores são menossensíveis a rotação, translação e a ruídos contidos na silhueta. Apesar das vantagens de seutilizar o contorno no domínio da frequência, esses trabalhos obtém em torno de 70% de

Page 18: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

16

taxa de acerto.Também em uma abordagem baseada em silhueta, (HAN; BHANU, 2006) utiliza

uma representação espaço-temporal que ele denomina de GEI (Gait Energy Image), umaimagem energia1 em tons de cinza é criada a partir de uma sequência de silhuetas. AGEI gerada contém informações das mudanças temporais da marcha, onde as menoresintensidades da GEI representam as partes da silhueta que mais se movimentaram e asmaiores intensidades as partes mais estáticas da silhueta durante o andar.

Abordagens baseadas em modelo visam extrair a dinâmica dos movimentoscontidos em partes do corpo humano (torso, pernas, braços) e omite as informações daforma da silhueta (JOHNSON; BOBICK, 2001; CUNADO; NIXON; CARTER, 2003;YOO et al., 2008). Para extrair a dinâmica dos membros, um modelo de corpo humanoé ajustado na silhueta. O modelo é criado a partir de formas geométricas (linas, elipses,retângulos). As abordagens baseadas em modelo são menos sensíveis a ruídos na silhuetae mudanças na aparência, contudo, possuem alto custo computacional. Um dos trabalhosprecursores em abordagens baseada em modelo foi o (JOHNSON; BOBICK, 2001), ondea silhueta é divida em seções para encontrar quatro pontos chaves (cabeça, cintura, péesquerdo e pé direito). As características extraídas para representar a marcha humanasão distâncias entre esses quatro pontos chaves, gerando um vetor de característicascom quatro distâncias. No trabalho (CUNADO; NIXON; CARTER, 2003), utilizou-sea técnica Velocity Hough transform (VHT) para criar uma estrutura (linha) para modelara coxa humana, esta estrutura é utilizada para extrair um sinal periódico do movimento dacoxa em todo caminhar da pessoa. Após isso, a transformada de Fourier é aplicada paratransformar o sinal obtido para o domínio frequência. O sinal no domínio da frequência éutilizado como característica.

Já no trabalho de (YOO et al., 2008), medidas antropométricas são empregadaspara estimar a posição vertical dos membros do corpo em relação a altura da silhueta.Assim, os autores computam a posições verticais do pescoço, ombro, cintura, pélvis, joe-lho e calcanhar. Após estimar as posições verticais dos membros, as posições horizontaispara cada membro são calculadas a partir da média entre a posições horizontais de bordamais a esquerda e mais a direta da altura de cada membro. As coordenadas obtidas sãoconectadas por linhas de forma hierárquica, com o intuito de criar um modelo esqueléticodo corpo humano.

O corpo humano é modelado com onze cilindros conectados por articulaçõespara representar os membros do corpo humano em (KRZESZOWSKI et al., 2013). Omodelo final gerado é tridimensional e possui 26 graus de liberdade. Porém, um ajustedo modelo é feito para cada silhueta em 2D com ângulos de visão diferentes e depois

1Uma média da intensidade dos pixels em todos os frames de uma sequência de silhuetas.

Page 19: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

1.1 Objetivo Geral 17

reconstruídos no espaço tridimensional. Os modelos são ajustados com o Annealed

Particle Swarm Optimization (APSO), o qual seleciona de forma iterativa o melhorconjunto de parâmetros do modelo.

Outro passo importante no reconhecimento de pessoas pela marcha é reduçãode dimensionalidade das características, pois não se sabe em várias ténicas de extração,quais e/ou quantas características possuem informações discriminantes para representarde forma única uma pessoa (BOULGOURIS; HATZINAKOS; PLATANIOTIS, 2005).A redução de dimensionalidade transforma um conjunto de características com altadimensão para um conjunto com menor dimensão e mais representativo. A redução dedimensionalidade é utilizada com o objetivo de reduzir a dimensionalidade (quantidadede características que representam um padrão) e também para selecionar característicasmais discriminantes em um conjunto de dados.

1.1 Objetivo Geral

Com o intuito de aumentar a taxa de reconhecimento obtidas pelos métodos nostrabalho (MOWBRAY; NIXON, 2003; MU; YU; WANG, 2009; LEE; TAN; TAN, 2013),o objetivo deste trabalho é reconhecer pessoas através da marcha humana, utilizandoas informações temporais contidas nos contornos no domínio da frequência, de umasequência de silhuetas. Porém, diferentemente dos métodos citados acima, são utilizadostrês métodos de redução de dimensionalidade e dois tipos de classificadores.

A abordagem de extração de características deste trabalho é baseado em silhuetae utiliza o contorno da silhueta como fonte de características. As informações do contornosão transformadas para o domínio da frequência e descritores de baixas frequências sãoselecionadas para amenizar a influência de ruídos contidos na silhueta que são oriundosde métodos de segmentação de fundo. Os descritores de baixas frequências selecionadospossuem alta dimensionalidade, com isso, métodos de redução de dimensionalidade sãousados para reduzir a dimensão dos descritores. Os dados oriundos dos métodos deredução de dimensionalidade são usados para representar as características da marcha,e assim, reconhecer pessoas.

Como o propósito de aumentar a taxa de reconhecimento obtido por trabalhoscitados acima, este trabalho emprega três métodos de redução de dimensionalidade, erealiza uma comparação entre os resultados de reconhecimento obtidos usando cada umdos métodos. Isso é realizado com a finalidade de descobrir qual dos métodos gerammelhores resultados para a metodologia adotada neste trabalho. Também são consideradosdois classificadores diferentes para reconhecer pessoas, o K-Vizinhos Mais Próximos(KNN) usado pelos trabalhos (MOWBRAY; NIXON, 2003; MU; YU; WANG, 2009;LEE; TAN; TAN, 2013) e o Análise Discriminante Linear (LDA) que não é utilizado

Page 20: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

1.2 Organização do Trabalho 18

por estes método, porém é comumente usado na literatura. É realizada uma comparaçãoentre os resultados obtidos com o KNN e o LDA.

1.1.1 Objetivos Específicos

Reprodução do trabalho de (MU; YU; WANG, 2009) e três formas de representa-ção dos dados das características extraídas para representar a marcha humana. Compara-ção entre as três formas de representação e escolha da melhor para o problema abordado.

Utilização e comparações entre três técnicas de redução de dimensionalidadepara encontrar características com baixa dimensão, que consigam representar de formadiscriminante a marcha humana. Os métodos utilizados são: o método de seleção de ca-racterísticas CDA (proposto por (MU; YU; WANG, 2009)) e os métodos de transformaçãolinear, PCA e PLS.

Melhora na taxa de reconhecimento de pessoas através da marcha humanautilizando informações no domínio da frequência dos contornos.

1.2 Organização do Trabalho

Este trabalho está dividido em seis capítulos. O segundo capítulo apresenta osprincipais conceitos sobre a marcha humana e sua utilização na biometria para reconhecerpessoas. No Capítulo 3 são abordados os métodos usados para extrair característicasda marcha, reduzir a dimensionalidade e realizar o reconhecimento. No Capítulo 4 sãoapresentados os resultados obtidos com a metodologia proposta no Capítulo 3. O Capítulo5 apresenta as considerações finais sobre este trabalho, bem como trabalhos futuros.

Page 21: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

CAPÍTULO 2A Marcha Humana na Biometria

2.1 A Marcha Humana

A marcha emprega uma sequência de movimentos repetitivos dos membrosinferiores para movimentar o corpo à frente, enquanto mantém-se estável utilizando umdos membros como apoio. De acordo com que o corpo move-se à frente, um dos membrosserve de apoio para que o outro avance pelo ar. Os movimentos dos membros invertemseus papeis de forma cíclica à cada passo. O intervalo de tempo em que um único membroserve de apoio e depois esse mesmo avança no ar até atingir novamente o solo, é conhecidocomo ciclo da marcha (PERRY, 2005).

2.1.1 Ciclo da Marcha

Ciclo da marcha é definido como o período entre o primeiro contato de um dospés ao solo, até um próximo contato do mesmo pé (SAAD, 1997). O contato é consideradoquando o calcanhar atinge o solo. O ciclo é divido em duas fases, apoio e balanço. Na fasede apoio, o pé que iniciou o ciclo se mantém fixo no solo, enquanto o outro move-se noar. Já a fase de balanço, o pé que iniciou o ciclo move-se no ar e o outro pé fica fixo nochão.

O intervalo de tempo do ciclo da marcha e consequentemente de suas fases, estãodiretamente relacionados à velocidade da marcha de cada pessoa. Em uma velocidadecomum da marcha, cerca de 1,3 m/s, a fase de apoio representa por volta de 60% dociclo da marcha, à medida que a fase de balanço corresponde a aproximadamente 40%(PERRY, 2005). O ciclo da marcha também é conhecido como passada. A passada écomposta por dois passos. Um passo é o intervalo entre o contato de um dos pés no soloaté o contato do outro pé (WHITTLE, 2014). A Figura 2.2 ilustra um exemplo de passadae passos.

O ciclo da marcha é dividido em sete etapas principais (PERRY, 2005). As seteetapas são listadas a seguir e estão ilustradas na Figura 2.1.

Page 22: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.1 A Marcha Humana 20

Ciclo da Marcha

Apoio (60% do ciclo) Balanço (40 % do ciclo)

ContatoIncial

ApoioMédio

ApoioTerminal

BalçançoInicial

BalançoMédio

BalançoTerminal

Fase do Ciclo da Marcha

ApoioInicial

Figura 2.1: Representação de um ciclo da marcha com a ilustra-ção de suas fases de apoio e balanço.

1. Contato Inicial: Os dois membros estão no solo a uma distância de um passo, éo inicio da fase de apoio para o membro que se encontra à frente, o qual é usadocomo referência para definir o ciclo da marcha. Na Figura 2.1 a perna direita (emvermelho) está sendo usado como referencia.

2. Apoio Inicial: Etapa em que o membro contrário ao membro de apoio perdetotalmente o contato com o solo.

3. Apoio Médio: Nesta etapa, o membro que está servindo como apoio, deve suportartodo o peso corporal, enquanto o outro membro avança à frente.

4. Apoio Terminal: O pé que se encontrava avançando no ar encosta no solo, enovamente os dois membros se encontram em contato com o solo. O intervalo entreo contato inicial e o apoio terminal é denominado passo, como ilustra a Figura 2.2.

5. Balanço Inicial: O membro que anteriormente realizava o apoio começa a perdercontato com o solo para avançar à frente.

6. Balanço Médio: O membro referência perde totalmente o contato com o soloenquanto avança no ar, à medida que o membro oposto sustenta todo o corpo.

7. Balanço Terminal: Novamente os dois membros inferiores se encontram em contatocom o solo. E o membro de referência se encontra novamente à frente do outromembro. O intervalo entre o apoio terminal e o balanço terminal também é chamadode passo. Já o intervalo entre o contato inicial e o balanço terminal é denominadociclo da marcha, mas também de passada (dois passos), Figura 2.2.

Page 23: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.2 Representação Digital da Marcha Humana 21

Balanço Esquerdo

Passo Esquerdo

Passo Direito

Balanço Direito

Ciclo da Marha: Passada

Apoio Médio (pé direito)

Apoio Médio (pé esquedo)

Apoio TerminalContao Inicial Balanço Terminal

Figura 2.2: Ciclo da marcha representada por passos (PERRY,2005).

2.2 Representação Digital da Marcha Humana

O reconhecimento de pessoas por meio da marcha humana na visão computacio-nal é realizada analisando a marcha em uma sequência de imagens capturadas utilizandouma câmera de vídeo. Cada frame da sequência de imagens representa uma pose da mar-cha.

As imagens capturadas contém outros objetos em cena que não estão relaciona-dos a marcha humana, por exemplo, carros, móveis, plantas etc. Dessa forma, é necessá-rio realizar uma segmentação de fundo (PICCARDI, 2004), que é um método empregadopara encontrar e separar o objeto de interesse (pessoa) da cena. O método de segmentaçãode fundo é aplicado para cada frame da sequência de imagens da marcha. O resultado dométodo de segmentação de fundo é uma imagem binária, onde as informações (objetos)não importantes em cena são os pixels pretos (fundo) e a pessoa (objeto de interesse) érepresentada por um conjunto S de pixels brancos, denominado silhueta. A Figura 2.3apresenta um exemplo de uma imagem retornada por um método de segmentação defundo.

A Figura 2.3 apresenta apenas um frame gerado pelo método de segmentaçãode fundo de uma sequência de imagens da marcha humana. como cada frame deve sersegmentado, é gerada uma sequência de silhuetas que representam a marcha de formadigital. A sequência de silhuetas é determinada por S j, onde S é o conjunto de pixel

pertencentes a silhueta e j é o frame que se encontra a silhueta. A Figura 2.4 ilustra umexemplo de sequência de silhueta com alguns frames omitidos para melhor visualização.No caso da 2.4 teria-se 1≤ j ≤ 11.

Uma das características mais importantes para se extrair informações da silhuetasobre a marcha é o contorno (BOULGOURIS; HATZINAKOS; PLATANIOTIS, 2005). O

Page 24: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.3 Transformada de Fourier 22

Figura 2.3: Imagem binária com o fundo preto e uma silhueta,retornada por um método de segmentação de fundo.

Figura 2.4: Sequência de silhuetas da marcha humana para umsujeito.

contorno é um conjunto de pontos bidimensionais que contém informações de mudançastemporais da silhuet. Neste trabalho o contorno é definido como o conjunto C j de pontospertencentes a silhueta S j que possui pelo menos um pixel de fundo (pixels pretos) comovizinho.

2.3 Transformada de Fourier

A Transformada de Fourier pode ser usada para representar um sinal qualquerusando uma soma ponderada de senos e cossenos e é utilizada para transformar um sinalno domínio do espaço e/ou tempo para o domínio da frequência. A Transformada deFourier de um sinal discreto n[i] é uma função complexa, obtida pela Equação (2-1)

F(u) =Z−1

∑i=0

n[i]e− j2πui

Z (2-1)

onde u = {0,1,2, . . . ,Z− 1} é uma discretização na frequência, i = {0,1,2, . . . ,Z− 1} éuma discretização no espaço e Z é o comprimento do sinal n[i].

A Transformada de Fourier também é utilizada em sinais bidimensionais, comoimagens. Dada um matriz MW×T qualquer, ela é transformada para domínio da frequência

Page 25: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.4 Redução de Dimensionalidade 23

utilizando a Transformada Discreta de Fourier aplicando a Equação (2-2)

F(u,v) =W−1

∑u=0

T−1

∑v=0

M(i, j)e− j2π( uiW + v j

T ) (2-2)

O resultado da transformação é uma matriz de descritores de Fourier compostospor números complexos FW×T . Na parte central da matriz F estão armazenadas osdescritores de alta frequências, ou seja, que representam as informações dos detalhes eruídos do sinal 2D, enquanto nos cantos estão as informações dos descritores de baixafrequência que representam a forma geral, ou seja, com menos detalhes e ruídos do sinal2D.

2.4 Redução de Dimensionalidade

Dimensionalidade é um termo usado para expressar o número de característicasusadas para representar um padrão. Segundo (JAIN; DUIN; MAO, 2000) existem duas ra-zões principais para representar o padrão de um objeto com a quantidade mínima possívelde características: custo computacional e desempenho do classificador. A redução de di-mensionalidade neste trabalho é utilizada para descartar características com informaçõesnão úteis (variância pequena), reduzindo a multicolinearidade e permitindo uma melhorrepresentação dos dados e consequentemente melhorando o desemepenho dos classifica-dores (JAIN; DUIN; MAO, 2000; SORZANO; VARGAS; MONTANO, 2014).

A redução de dimensionalidade pode acarretar uma piora no desempenho dosclassificadores, removendo características discriminantes. Por isso, é importante a esco-lha correta do método de redução de dimensionalidade e da quantidade de característicasusadas após a redução. Nesta seção são utilizados três métodos de redução de dimensi-onalidade. O método Habilidade de Discriminação por Classe, proposto por (MU; YU;WANG, 2009), o método de Análise de Componentes Principais e o Mínimos Quadra-dos Parciais. Estes três métodos tem como objetivo principal maximizar a variância dosdados, porém a metodologia que eles utilizam para alcançar esse objetivo se diferem.

2.4.1 Habilidade de Discriminação por Classe

O Habilidade de Discriminação por Classe (Class Discrimination Ability - CDA)é um método de redução de dimensionalidade que visa selecionar os atributos queaumentam a variância inter-classe e reduzem a variância intra-classe do conjunto de dados(MU; YU; WANG, 2009). O CDA da k-ésima variável é obtida pela Equação (2-3)

CDAxk =∑

Li=1 Pi(xik− xk) · con j(xik− xk)

∑Li=1 PiUik

, k = 1,2, · · · ,κ (2-3)

Page 26: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.4 Redução de Dimensionalidade 24

onde L é a quantidade de classes no conjunto de treinamento, κ é a quantidade de variáveisno conjunto de dados, xk é a média da k-ésima variável, Pi a probabilidade a priori da i-ésima classe, xik é média intra-classe da k-ésima variável, U i

k é variância intra-classe econ j(·) significa o conjugado de um número complexo. As variáveis xk, Pi, xik e U i

k sãocalculadas respectivamente pela Equações (2-4), (2-5), (2-6) e (2-7).

xk =1L

L

∑i=1

xik. (2-4)

Pi = Ni/L. (2-5)

xik =1Ni

Ni

∑i=1

xik. (2-6)

Uik =Ni

∑i=1

(xik− xik) · con j(xik− xik). (2-7)

Nas equações acima, Ni é a quantidade de amostras de treinamento pertencentesa classe i. O CDA é calculado para cada variável separadamente, as variáveis quealcançarem o maior valor de CDA são selecionadas e usadas para representar de formadiscriminante o dados.

A maior habilidade de discriminação relaciona-se com o valor de CDA dasvariáveis. Quanto maior o valor de CDA, melhor a capacidade de representação davariável para o conjunto de dados em questão. Para a redução de dimensionalidadesão consideradas as r melhores variáveis em relação ao valor de CDA, de modo quer < κ. Dessa forma é criado um novo vetor de características x′ = {x′1,x′2,x′3, · · · ,x′r} ondeCDAx′1

≥CDAx′2≥CDAx′3

≥ ·· · ≥CDAx′r .

2.4.2 Análise de Componentes Principais

A Análise de Componentes Principais (Principal Component Analysis - PCA) éuma método de redução de dimensionalidade que realiza uma transformação linear em umconjunto de variáveis, a fim de obter um conjunto de variáveis menos correlacionadas, ouseja, ortogonais (ABDI; WILLIAMS, 2010; JOLLIFFE, 2002). O PCA tem como objetivoencontrar o menor conjunto de combinações lineares ortogonais que melhor explica avariância das variáveis originais.

A partir de p variáveis x1,x2,x3, · · · ,xp, obtêm-se as variáveis não correlaciona-das z1,z2,z3, · · · ,zp através de uma transformação linear que maximiza a variância dosdados, onde zi é a i-ésima componente principal. As variáveis z, são ordenadas de formaque var(z1)≥ var(z1)≥ var(z1)≥ ·· · ≥ var(zp) e var(·) é a variância.

Page 27: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.4 Redução de Dimensionalidade 25

A transformação linear empregada pelo PCA para maximizar a variância dosdados é realizada utilizando os autovetores da matriz de covariância S, dada pela Equação(2-8),

S( j,k) =1

L−1

L

∑i=1

(xi j− x j)(xik− xk) j = 1,2, · · · ,κ, k = 1,2, · · · ,κ (2-8)

Seja S a matriz de covariância de X, w os autovetores e λ os autovalores, tem-seque:

Sw = λw (2-9)

Os componentes principais são os autovetores da transformação, cujos autovalo-res correspondentes estabelecem a ordem de significância, de modo que λ1 ≥ λ2 ≥ λ3 ≥·· · ≥ λκ. A redução de dimensionalidade é atingida escolhendo somente os primeiros r

autovetores w associados aos r autovalores que apresentam maior variância no espaçotransformado. Os autovetores são organizados em um matriz de autovetores Wκ×r onde r

é a quantidade de autovetores considerados para transformação que irá resultar na reduçãode dimensionalidade. Dessa forma, a transformação linear para a redução de dimensiona-lidade é realizada pela Equação (2-10)

x′ = WT (x−x) (2-10)

2.4.3 Mínimos Quadrados Parciais

O Mínimos Quadrados Parciais (Partial Least Squares - PLS) é um métodoque modela a relação entre um conjunto de variáveis de amostras X e suas variáveis deresposta y, afim de maximizar a variâncias entre as mesmas (GUO; MU, 2011).

De modo semelhante ao PCA, o PLS realiza uma transformação linear nosdados, porém o PCA leva em consideração a variância das variáveis independentes X,já o PLS maximiza a covariância entre as variáveis indenpendentes XL×χ e as variáveisdependentes YR×τ. É importante realizar uma normalização nas variáveis, centrando-asna média (ROSIPAL; KRÄMER, 2006). As variáveis X e Y podem ser decompostas daseguinte maneira

X = TPT +E (2-11)

Y = UQT +F (2-12)

Page 28: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.4 Redução de Dimensionalidade 26

onde TL×r e UL×r são as matrizes com r vetores de scores (componentes), já Pχ×r e Qτ×r

são as matrizes de loadings (matriz de transformação), enquanto EL×χ e FL×τ são asmatrizes de resíduos (erros). O método PLS geralmente é computado usando o algorítimoNonlinear Iterative Partial Least Squares (NIPALS) (WOLD, 1975), que encontra osvetores de peso w e q, de modo que maximize a covariância entre t e u. A covariânciaentre t e u e sua relação com os vetores de pesos w e q é expressa pela Equação (2-13)

cov(t,u) = cov(Xw,Yq) (2-13)

O pseudo-código 1 descreve o algorítimo PLS1, o qual considera somente umavariável de saída.

Algorithm 1 PSEUDOCÓDIGO DO ALGORÍTIMO NIPALS PARA O PLS1.Entrada: X,y, centrados em suas respectivas médias.Saída: w, tinício

u← ypara cada componente r faça

w← XT u/(uT u)w← w/‖w‖t← Xwq← yT t/(tT t)q← q/‖q‖u← yq

fimfimretorna w, t

O vetor de w corresponde ao autovetor do componente computado, de forma que

XT yyT Xw = λw (2-14)

A redução de dimensionalidade a partir de algorítimo de NIPALS é geradaescolhendo a quantidade de componentes r < κ. Dessa forma, serão gerados r vetoresw, que são organizados em uma matriz de pesos Wκ×r. Assim, o vetor de descritores xpode ter sua redução de dimensão realizada pela Equação (2-15).

x′ = WT (x−x) (2-15)

Page 29: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.5 Reconhecimento 27

2.5 Reconhecimento

O reconhecimento de pessoas pela marcha consiste em determinar a identidadede um sujeito em função das características extraídas do seu ciclo da marcha. Neste tra-balho, o reconhecimento é realizado empregando dois métodos de classificação, o K-

Nearest Neighbor (KNN) e o Análise Discriminante Linear (Linear Discriminant Analy-

sis - LDA). Nos trabalhos de reconhecimento de pessoas pela marcha, os métodos KNNe LDA são frequentemente adotados pela sua simplicidade de implementação e por apre-sentarem boa performance em vários problemas de classificação (JAIN; DUIN; MAO,2000; THEODORIDIS; KOUTROUMBAS, 2008; DUDA; HART; STORK, 2008).

O processo de reconhecimento é dividido em duas etapas, a construção domodelo matemático a partir dos dados de treinamento e a validação do modelo a partirde dados de teste. A construção do modelo (treinamento) consiste na criação de ummodelo matemático que separa amostras de uma determinada classe das demais classes. Oconjunto de amostras que são usadas para a construção do modelo formam uma partiçãodo conjunto de amostras original, sendo denominado conjunto de treinamento. O conjuntode teste é a partição de amostras, com seus respectivos rótulos, que é usada para testar ométodo de classificação.

2.5.1 K-Vizinhos Mais Próximos

O algorítimo K-Vizinhos Mais Próximos (K-Nearest Neighbor - KNN) é um al-gorítimo supervisionado introduzido por (AHA; KIBLER; ALBERT, 1991). O KNN clas-sifica uma amostra desconhecida baseando-se nos seus vizinhos, os quais são definidospor uma métrica de distância. O KNN computa a distância entre uma amostra desconhe-cida e todas as amostras do conjunto de treinamento e os K vizinhos mais próximos sãoconsiderados para realizar a classificação. A amostra é classificada pertencente a classecom maior proporção de amostras no conjunto de K vizinhos. O pseudo-código 2 apre-senta o algorítimo do KNN.

Algorithm 2 PSEUDOCÓDIGO DO ALGORÍTIMO KNN.Entrada: X: conjunto de treinamento,y: classe de X, x: amostra desconhecida.início

para cada amostra de X façadi← dist(Xi,x), (i = 1,2, · · · ,R)

fimfimretorna Classe y associado as amostras com maior proporção entre os K menores valores

de di

Page 30: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

2.5 Reconhecimento 28

A formulação do método KNN exige a definição de uma medida de distânciae a quantidade de vizinhos K que será usado na classificação. A distância euclidiana écomumente utilizada, enquanto que K é definido empiricamente (ANKERST et al., 1999;JAIN; DUIN; MAO, 2000; ERTOZ; STEINBACH; KUMAR, 2002).

2.5.2 Análise Discriminante Linear

A Análise Discriminante Linear (Linear Discriminant Analysis - (LDA) apre-senta bom desempenho em um grande conjunto de aplicações, e é considerado um dosclassificadores mais populares (THEODORIDIS; KOUTROUMBAS, 2008). O LDA éum método paramétrico pois necessita de parâmetros, a média e a matriz de covariância.e foi introduzido por (FISHER, 1936).

O LDA considera que a distribuição da dispersão das amostras de diferentesclasses são próxima à distribuição normal, apresentando médias distintas, porém com amesma matriz de covariância S. A matriz S pode ser calculada pela Equação (2-8) ondexk é a média da classe k. O classificador LDA atribui à amostra x’ a classe y que minimizaa Equação (2-16).

y = argmink(x′−xk)T S−1(x′−xk) (2-16)

Page 31: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

CAPÍTULO 3Metodologia

3.1 Considerações Iniciais

Neste capítulo são apresentados os métodos desenvolvidos nesta pesquisa. Oreconhecimento de pessoas através da marcha humana é divida em três etapas: extraçãode características, redução de dimensionalidade e reconhecimento (classificação) (WANGet al., 2010). Essas três etapas estão ilustradas na Figura 3.1.

A extração de características tem como objetivo extrair informações contidas damarcha para representar pessoas através de atributos. Este trabalho adota a abordagembaseada em silhueta para extrair informações das mudanças temporais do contorno dosujeito durante a marcha. As informações temporais contidas no contorno são transfor-mados para o domínio da frequência utilizando a Transformada Discreta de Fourier. Issoé realizado pois as informações transformadas para o domínio da frequência são menossensíveis a rotação e a translação (ZHAO et al., 2004; GONZALEZ; WOODS, 2007).O domínio da frequência também é utilizado para selecionar os descritores de Fourier debaixa frequência, pois estes possuem informações gerais do formato do contorno da silhu-eta. Já os descritores de Fourier de alta frequência são desconsiderados, pois estes contêminformações de pequenas mudanças no contorno e também ruídos oriundos da imprecisãodos métodos de segmentação de fundo (MOWBRAY; NIXON, 2003). Ao desconsideraras altas frequências ocorre também uma redução de dimensionalidade.

Neste trabalho a extração de características está dividida em três etapas:

1. Extração Contornos: Os contornos são extraídos a partir de uma sequência desilhuetas de um ciclo da marcha. Para cada silhueta da sequência, extrai-se seucontorno bidimensional. O contorno bidimensional é transformado para um sinalunidimensional. Os sinais unidimensionais gerados para um ciclo da marcha sãoarmazenados em uma matriz de contornos.

2. Transformada de Fourier: Os contornos armazenados na matriz de contornos sãotransformados para o domínio da frequência aplicando a Transformada Discreta deFourier. Com isso, é obtida uma matriz com descritores de Fourier com a mesma

Page 32: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.1 Considerações Iniciais 30

dimensão da matriz de contornos, que representa um ciclo da marcha domínio dafrequência.

3. Seleção das Baixas Frequências: A partir da matriz com os descritores de Fou-rier são selecionados os descritores de Fourier de baixa frequência aplicando umafunção de filtro passa-baixa. Um filtro passa-baixa é uma função que deixa passardados com baixas frequências e elimina as altas frequências (GONZALEZ; WO-ODS, 2007). O filtro passa-baixa é aplicado na matriz de descritores para reduzira quantidade de descritores de Fourier e também para normalizar a dimensão dasmatriz de descritores para todo sujeito.

Matriz deDescritoresno Domínio

da Frequência

Sequência de Silhuetas

Base de Dados

SilhuetasCiclo

da Marcha

Detecção do Ciclo

da Marcha

Detecção do Ciclo

da Marcha

ExtraçãoContornos Matriz

Contornos

Transformadade Fourier

Filtro Passa-Baixa

Redução deDimensionalide

Matriz deDescritores

de BaixaFrequência

Vetor deCaracterísticas

Classificador

Teste

Treinamento

ReconhecimentoClassificação

Matriz deDescritoresno Domínio

da Frequência

Sequência de Silhuetas

Base de Dados

SilhuetasCiclo

da Marcha

ExtraçãoContornos Matriz

Contornos

Transformadade Fourier

FiltroPassa-Baixa

Redução deDimensionalide

Matriz deDescritores

de BaixaFrequência

Vetor deCaracterísticas

Extração de Características

Extração de Características

Figura 3.1: Diagrama da metodologia proposta para o Reconhe-cimento de Pessoas através da Marcha Humana.

Ao selecionar as baixas frequências ocorre uma redução de dimensionalidade.Porém, os descritores de Fourier com baixas frequências selecionados ainda possuemuma alta dimensão. A alta dimensão dos dados, faz com que seja necessário tratar umamaior quantidade de dados e as amostras tendem a ficarem muito esparsas. Por isso,são usados três métodos para reduzir de dimensionalidade dos dados, com o intuito dedescartar os descritores com informações não útil dos dados, gerando uma representaçãomais compacta e discriminante do ciclo da marcha.

Após redução de dimensionalidade é realizada a etapa de reconhecimento. Naetapa de reconhecimento são usados dois classificadores para modelar matematicamentede forma única cada pessoa, usando para isso os descritores com dimensões menores. Asamostras dos descritores do ciclo da marcha são separados em treinamento e teste.

Page 33: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 31

A Figura 3.1 ilustra um diagrama das etapas adotadas neste trabalho para oreconhecimento de pessoas através da marcha, as quais são descritas detalhadamente nasseções seguintes.

A seção 3.2 descreve a metodologia de extração de características, cujo objetivoé extrair informações da marcha a partir de uma sequências de silhuetas de uma pessoa.A seção 3.3 apresenta a descrição dos métodos de redução de dimensionalidade que sãoadotados neste trabalho para reduzir e selecionar o subconjunto de características commaior capacidade representativa dos dados da marcha humana. A seção 3.4 descreve osmétodos de classificação empregados no treinamento e classificação da marcha humana.

3.2 Extração de Características

Esta etapa tem como objetivo extrair as características que representam digital-mente as informações dinâmicas e temporais da marcha humana. As características sãoextraídas a partir do contorno da silhueta de cada sujeito em um ciclo de marcha, e depois,transformadas para o domínio da frequência aplicando a Transformada de Fourier. Comessa transformação, obtêm-se descritores de Fourier, que são considerados característicasque representam um sujeito em um ciclo da marcha.

Os contornos são extraídos a partir de uma sequência de silhuetas. As silhuetassão obtidas aplicando métodos de segmentação de fundo de uma sequências de imagensde uma pessoa caminhando. Existem vários métodos de segmentação de fundo, os quaispodem ser encontrados em (PICCARDI, 2004). A segmentação de fundo não faz parte doobjetivo deste trabalho, por isso sua explicação não é considerada.

A metodologia de extração dos descritores de Fourier a partir do contorno dasilhueta é baseada no trabalho de (MU; YU; WANG, 2009).

3.2.1 Detecção do Ciclo da Marcha

Como mencionado no Capítulo 2, a marcha humana possui um padrão cíclico,redundante. Dessa forma, não há necessidade de extrair características de sequências desilhuetas com mais de um ciclo da marcha, já que após um ciclo o padrão da marcharepete. Entretanto, em sequências menores que um ciclo, o padrão cíclico da marcha estaráincompleto, podendo haver perda de características temporais. Com isso, a primeira etapado sistema de reconhecimento deste trabalho é encontrar em uma sequência de silhuetasum subconjunto de frames que pertençam a apenas um ciclo.

O método adotado para encontrar o ciclo da marcha em uma sequência desilhuetas utiliza-se de um sinal gerado pela largura da silhueta para cada frame dasequência de silhuetas. Dado o conjunto de pixels S j representando a silhueta de um

Page 34: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 32

sujeito no frame j, a largura é a diferença das coordenadas x entre o pixel mais à esquerdae o mais à direita. A largura W é calculada pela Equação (3-1) e o sinal gerado pela largurapara cada frame está ilustrado na Figura 3.2.

W j = max x j−min x j (3-1)

Frames

Lar

gura

(em

pixel

)

0 5 10 15 20 25 30 35 40 45 5030

40

50

60

70

80

largura

Figura 3.2: Largura da silhueta em função da sequência de framesda marcha de uma pessoa. A largura W apresenta umcomportamento oscilatório correspondente aos ciclosde uma marcha.

A Figura 3.2 apresenta a largura W em função dos frames de uma sequência desilhuetas. A o sinal de largura gerado é periódico, os picos representam o valor máximode largura (maior distância entre os dois pés) e o vales são os menores valores de largura(os dois pés estão juntos).

A partir do sinal da largura é possível identificar os frames de contato inicial ebalanço terminal, que são respectivamente os frames inicial e final do ciclo da marcha.Na Figura 3.2 o primeiro pico no frame 7 representa o contato inicial, enquanto o terceiropico no frame 30 é o balanço terminal. Dessa forma, as silhuetas pertencentes ao ciclo damarcha neste caso estão presentes nos nos frames de 7 até 30.

3.2.2 Extração e Normalização do Contorno

Este trabalho visa extrair as informações de mudanças temporais da forma dasilhueta em um ciclo da marcha. As principais informações de mudanças no formato dasilhueta estão presentes no contorno (NIYOGI; ADELSON, 1994; LAM; LEE; ZHANG,2007; MU; YU; WANG, 2009). Com isso, as informações das mudanças temporaiscontidas nas silhuetas são extraídas do contorno neste trabalho.

O contorno C j é um conjunto de pixels pertencentes a silhueta S j que tem pelomenos um pixel de fundo como vizinho. Dado uma silhueta S j, um algorítimo paraencontrar o contorno C j, consiste nos seguintes passos (GONZALEZ; WOODS, 2007).

Page 35: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 33

1. Dado um pixel inicial, c0, sendo o pixel mais ao topo da silhueta. Marque como b0

o vizinho ao norte de c0. O pixel b0 pertencerá ao fundo e não a silhueta. Faça umvarredura nos vizinhos 8-conectados de c0 de forma anti-horária, começando por b0.Seja c1 o primeiro vizinho de c0 que pertença a silhueta, e b1 o pixel imediatamenteanterior a c1 na sequência de varredura. Armazene a posição dos pixels c0 e c1.

2. Atribua c = c1 e b = b1.3. Faça uma varredura anti-horária nos vizinhos 8-conectados de c, começando por b,

onde os vizinhos 8-conectados são denotados por p1, p2, · · · , p8, e p1 = b. Encontreo primeiro vizinho pk pertencente a silhueta.

4. Atribua c = pk e b = pk−1.5. Repita os passos 3 e 4 até c = c0 e o próximo píxel de contorno encontrado seja c1.

A sequência de pixels c encontrados após o fim do algorítimo constituem o conjuntode pixels de contorno, ou seja, C j.

O contorno obtido é um conjunto de pontos bidimensionais que contém asinformações na mudança da forma da silhueta. Após obtido o contorno, foi adotado ummétodo para representa-lo como um sinal unidimensional. Para isso, é calculado o Centrode Massa da silhueta. O sinal unidimensional do contorno é gerado calculando a distânciaentre o Centro de Massa e cada ponto do contorno. O Centro de Massa é calculado a partirda Equação (3-2).

xe =1D

D

∑i=1

xi, ye =1D

D

∑i=1

yi. (3-2)

onde (xe,ye) é a posição do centro de massa, D é o tamanho do contorno e (xi,yi) é oi-ésimo pixel pertencente ao contorno.

Obtidos contorno e Centro de Massa, é possível calcular a representação unidi-mensional do contorno d j = {d1,d2,d3, ...,dN}, onde di é a distância entre o Centro deMassa e o i-ésimo ponto do contorno, e é obtido pela Equação (3-3).

di =√

(xi− xe)2 +(yi− ye)2 (3-3)

Embora haja uma mudança na representação do contorno, as informações de mu-danças temporais permanecem preservadas na representação unidimensional do contorno(WANG et al., 2003; MU; YU; WANG, 2009). E esta representação tem uma grandevantagem de reduzir um problema bidimensional para um unidimensional (GONZALEZ;WOODS, 2007).

A Figura 3.3(a) apresenta um exemplo do contorno de silhueta de um único

Page 36: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 34

d1

Centrode

Massa

(a) Contorno em 2D da si-lueta de uma pessoapara um frame, umadistância d1 entre umpixel do contorno e oCentro de Massa.

Pontos Contorno

Dis

tânc

ia

0 50 100 150 200 250 3000

10

20

30

40

50

60

70

80

90

(b) Sinal d j.

Figura 3.3: Representação do contorno de uma silhueta. Adaptadode (MU; YU; WANG, 2009).

frame, seu Centro de Massa e a distância d11. Já a Figura 3.3(b) apresenta a representação

unidimensional textb f d j obtida pela distância entre o Centro de Massa e todos os pixels

do contorno.O tamanho do contorno pode variar para cada frame capturado, o que acarreta

em sinais d j de tamanhos diferentes. Para adequar o sinal aos cálculos, é necessárioa normalização do comprimento de d j. A normalização é atingida usando o métodode reamostragem por interpolação cúbica do sinal em intervalos igualmente espaçados,totalizando 2702 posições.

O sinal d j é computado para cada frame do ciclo da marcha. Com isso, sãogerados N sinais d j de comprimento M = 270, onde N é a quantidade de silhuetas (frames)para um ciclo da marcha de uma pessoa. Afim de armazenar as características do contornopara cada pessoa em um ciclo de marcha, os sinais de contorno d j de um ciclo da marchasão dispostos como uma matriz CN×M. A matriz C contém um conjunto de distâncias decontorno para cada indivíduo.

A Figura 3.4 ilustra a matriz C para um ciclo da marcha de duas pessoas distintas.As cores na Figura 3.4 representam os valores do sinal d j, ou seja, as distâncias di.

1A distância entre o Centro de Massa e o primeiro pixel do contorno.2O mesmo utilizado no trabalho de (MU; YU; WANG, 2009)

Page 37: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 35

25

20

15

10

5

80

70

60

50

40

30

20

10

50 100 150 250200

Pontos Contorno

Fra

mes

(a) Pessoa 1

25

20

15

10

5

Fra

mes

50 100 150 250200

Pontos Contorno

80

70

60

50

40

30

20

10

(b) Pessoa 2

Figura 3.4: Matriz de contornos C duas pessoas diferentes, ilus-trando as diferenças inter-classe geradas pelo sinalunidimensional do contorno.

Observando as duas imagens 3.4(a) e 3.4(b), é possível notar um padrão periódico nasimagens, isso ocorre devido a natureza cíclica da marcha humana. Apesar de um padrãoperiódico semelhante em ambas imagens, é possível notar padrões e intensidades de coresque se diferenciam de uma pessoa para outra. Como pode ser visto nas imagens 3.4(a) e3.4(b), a quantidade de linhas das imagens, ou seja, a quantidade de frames para um cicloda marcha varia de pessoa para pessoa.

3.2.3 Representação da silhueta no domínio da frequência

O contorno é um sinal que representa o formato característico da silhueta, sendodefinido no espaço de pixels de uma imagem. Mesmo com a normalização do tamanho doconjunto de pontos, o perfil do contorno está sujeito a grande variabilidade, uma vez quedepende da aplicação de métodos pouco precisos de segmentação de fundo (PICCARDI,2004) sob imagens digitais de baixa resolução. A silhueta pode variar localmente porconta de ruído presente no sinal e a imprecisão da segmentação.

Neste trabalho, o conjunto de distâncias do contorno, a matriz C, é transformadopara o domínio da frequência, a fim de ter acesso as variações globais do contorno eeliminar a interferência de variações locais e de menor intensidade. Uma das maneiras dese trabalhar com dados no domínio da frequência é a partir da aplicação da Transformadade Fourier (OPPENHEIM; SCHAFER; BUCK, 1989; GONZALEZ; WOODS, 2007).

Page 38: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.2 Extração de Características 36

Essa transformação tem sido utilizada em trabalhos com o intuito de representar a marchahumana no domínio da frequência (MOWBRAY; NIXON, 2003) (ZHAO et al., 2004)(MU; YU; WANG, 2009) (KRZESZOWSKI et al., 2013).

As informações obtidas com o domínio da frequência são menos sensíveis a rota-ção e a translação (ZHAO et al., 2004; GONZALEZ; WOODS, 2007). Além disso, usandodescritores de Forrier para representar a marcha humana no domínio da frequência, é pos-sível obter características macroscópicas (a características gerais da forma da silhueta),que estão presentes nas baixas frequências e características microscópicas (os detalhes eruídos do contornos da silhueta) que estão presentes nas altas frequências (MOWBRAY;NIXON, 2003).

Como explicado anteriormente, o ciclo total da marcha é formado por umconjunto de contornos que compõem a matriz C, configurando um sinal bidimensionalC(i, j), que depende do frame e da posição dos elementos do contorno. A matriz C serátransformada para o domínio da frequência aplicando a Transformada Discreta de Fourier2D, a qual é dada pela Equação (2-2). O resultado da transformação é a matriz de númeroscomplexos FN×M que contém a representação de um ciclo de marcha no domínio dafrequência. A parte central da F estão armazenadas os descritores de alta frequências, ouseja, que representam as informações dos detalhes e ruídos do ciclo da marcha, enquantoos cantos estão as informações dos descritores de baixa frequência que representam aforma geral, ou tendência do ciclo da marcha. A Figura 3.5(a) ilustra a magnitude de Fde um sujeito. As baixas frequências possuem magnitude maiores e as altas frequênciasmagnitudes menores.

12

10

8

6

4

2

(a) Matriz F com as altas frequências no cen-tro.

12

10

8

6

4

2

(b) Matriz F com as baixas frequências nocentro.

Figura 3.5: Matrizes F.

Para um ciclo com K frames, a matriz de descritores de Fourier possui K×270elementos. Para um exemplo de ciclo com 25 frames, tem-se 25× 270 elementos, ouseja, 6750 descritores de Fourier para o ciclo. Destes descritores, são considerados os

Page 39: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.3 Redução de Dimensionalidade 37

descritores com baixa frequência, que detém as informações do formato geral do contornoda silhueta. Foram desconsiderados os descritores de alta frequência principalmenteporquê eles modelam ruído e variações provocadas pela imprecisão dos métodos desegmentação de fundo. Além disso, ao selecionar descritores com baixa frequência,haverá uma redução de dimensionalidade dos descritores usados para representar umciclo da marcha. A redução de dimensionalidade é melhor explicada na seção 3.3 e temcomo objetivo reduzir o custo computacional e melhorar o desempenho do sistema dereconhecimento.

Como a quantidade de frames diferentes sujeitos em ciclo da marcha de marcha,os descritores com baixa frequências foram selecionados a partir de F de modo que cadaciclo possua a mesma quantidade de descritores. Isso foi realizado movendo as baixasfrequências para o centro da matriz F, ou seja, o elemento do centro da matriz é o descritorcom menor frequência. A Figura 3.5(b) ilustra uma matriz F com as baixas frequênciasno centro. O método de filtragem das baixas frequências é o mesmo utilizado por (MU;YU; WANG, 2009), que retira do centro desta matriz uma submatriz F′ com dimensão9× 81. A submatriz F′ possui a mesma dimensão para cada ciclo, com uma quantidadede 729 descritores de Fourier que representam um ciclo da marcha.

3.3 Redução de Dimensionalidade

Com a transformação para o domínio da frequência, o ciclo da marcha é repre-sentado por um vetor de 6750 descritores, sendo reduzido para 729 descritores após afiltragem passa-baixa. Dessa forma, a filtragem proposta na seção 3.2 reduz significati-vamente a quantidade de descritores usados para representar o ciclo da marcha de umsujeito.

No entanto, o valor de 729 descritores, caracteriza um problema de alta dimen-sionalidade (SORZANO; VARGAS; MONTANO, 2014). Além disso, não sabe-se quaisdesses 729 descritores contidos na matriz F′ são discriminantes, ou seja, apresentam pa-drões distintos para cada sujeito. Por isso é realizada uma redução de dimensionalidadeaplicando na matriz F′ os métodos de redução de dimensionalidade CDA, PCA e PLS,com a finalidade de encontrar o menor número de descritores que sejam discriminantes eque representem de forma única a marcha humana.

3.4 Reconhecimento

O reconhecimento de pessoas pela marcha consiste em determinar a identidadede um sujeito em função das características extraídas do seu ciclo da marcha. Nestetrabalho, o reconhecimento é realizado empregando dois classificadores, o K-Nearest

Page 40: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

3.4 Reconhecimento 38

Neighbor (KNN) e o Análise Discriminante Linear (Linear Discriminant Analysis -LDA). Nos trabalhos de reconhecimento de pessoas pela marcha, os métodos KNN e LDAsão frequentemente adotados pela sua simplicidade de implementação e por apresentaremboa performance em vários problemas de classificação (JAIN; DUIN; MAO, 2000;THEODORIDIS; KOUTROUMBAS, 2008; DUDA; HART; STORK, 2008). Os dadospassados para os classificadores, são os dados retornados pelos métodos de redução dedimensionalidade.

Page 41: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

CAPÍTULO 4Resultados

4.1 Considerações Iniciais

Neste capítulo são apresentados os resultados obtidos pela execução da metodo-logia descrita no Capítulo 3. A metodologia de reconhecimento de pessoas pela marcha,proposta neste trabalho, considera o uso de sequência de imagens do deslocamento na-tural e lateral de uma pessoa como os dados de entrada. O método é dividido em trêsetapas, a detecção/extração, a redução de dimensionalidade e a classificação das carac-terísticas. A avaliação do método proposto foi conduzida pela investigação de métricaspara encontrar a melhor quantidade de vizinhos para o método de classificação KNN.O desempenho do sistema de classificação é avaliado para três tipos de características:magnitude, fase e produto entre as mesmas. A capacidade de distinção das característicasé avaliada a partir do emprego de três métodos de redução de dimensionalidade seguidoda avaliação de desempenho dos classificadores usando curvas CMS (Cumulative Match

Scores). A Seção 4.2 apresenta a metodologia de avaliação dos resultados. Na Seção 4.2.1encontra-se a descrição das bases de dados utilizadas e dos equipamentos utilizados paraa geração dos resultados. A Seção 4.3.1 mostra as métricas utilizadas para encontrar o nú-mero de vizinhos do classificador KNN. Na Seção 4.3.2 são realizados comparações entrea performance dos classificadores LDA e KNN utilizando os dados de magnitude, fase eproduto. Na Seção 4.3.3 é avaliado o melhor conjunto de características obtidos pelos mé-todos de redução de dimensionalidade. Já a Seção 4.3.4 apresenta as curvas CMS geradaspelo o uso de diferentes classificadores e também a comparação com outros métodos doestado-da-arte.

4.2 Metodologia para Avaliação dos Resultados

A avaliação da metodologia proposta é realizada utilizando as seguintes métricas:Matriz Confusão e Cumulative Match Scores (CMS).

Page 42: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.2 Metodologia para Avaliação dos Resultados 40

1. Matriz de Confusão: É usada para medir o desempenho de classificadores. Exibe onúmero de classificações corretas e incorretas dada a classe real (linha da matriz) ea classe estimada (coluna da matriz) pelo classificador. Esta matriz é L×L, onde L éa quantidade de classes. As classificações corretas para cada classe se localizam nadiagonal principal e os demais dados da matriz representam erros na classificação.A Matriz Confusão é formada por quatro métricas, que são:

• Verdadeiros Positivos (True Positive - TP): Quantidade de amostras classifi-cadas como i e realmente são da classe i. O TP localiza-se na posição i, i damatriz de confusão.• Falsos Positivos (False Positive - FP): Número de amostras classificadas como

classe i, mas pertencem a outra classe. São todos os elementos da coluna i damatriz de confusão, exceto o da posição i, i.• Verdadeiros Negativos (True Negative - TN): Quantidade de amostras classifi-

cadas corretamente que não pertencem a classe i. O TN localiza-se na diagonalprincipal, exceto na posição i, i da matriz de confusão.• Falsos Negativos (False Negative - FN): Número de amostras estimadas como

classe j, mas que são da classe i. São todos os elementos da linha i da matrizde confusão, exceto o da posição i, i.

A partir da tabela de confusão é possível calcular a acurácia do classificador, queé dada pela razão entre a quantidade de amostras classificadas corretamente e onúmero total de amostras. A acurácia ACR é gerada pela Equação (4-1).

ACR =T P+T N

T P+FP+T N +FN(4-1)

A acurácia será usada para medir o desempenho do sistema em testes apresentadosna Seção 4.3.

2. Cummulative Match Score - CMS: Protocolo criado originalmente por (PHILLIPSet al., 2000) para avaliar métodos de reconhecimento facial que passou a serusado como um método padrão de avaliação de desempenho de outros métodosbiométricos. O CMS é a probabilidade acumulada da classe real de uma amostra deteste estar presente em um Rank R 1 das classes retornadas pelo classificador. Se R= 1, então o valor de CMS é a própria acurácia. Geralmente a pontuação cumulativade acertos é expressa em gráficos, onde o eixo das abscissas representa o Rank,enquanto o eixo das ordenadas representa o valor de CMS.

Os testes foram realizados empregando os classificadores LDA e KNN, utili-

1O classificador retorna R classes prováveis para uma amostra de teste, se a amostra teste pertencer aumas das R classes é contabilizado como acerto.

Page 43: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.2 Metodologia para Avaliação dos Resultados 41

zando o método de validação cruzada Leave-one-out, afim de verificar a capacidade degeneralização do sistema (JAIN; DUIN; MAO, 2000; DUDA; HART; STORK, 2008). Osdados passados para os classificadores são provenientes da redução de dimensionalidadedo CDA, PCA ou PLS. Dessa forma, foram usadas seis combinações possíveis para ostestes, as quais são LDACDA, LDAPCA, LDAPLS, KNNCDA, KNNPCA e KNNPLS. A partirdisso são realizados testes para aferir a performance da metodologia proposta para cadauma dessas seis combinações. A seguir é apresentado um breve resumo sobre os testesrealizados.

• Teste 1: Avaliação e escolha da quantidade de vizinhos (K) para o classificadorKNN. A quantidade K que produz o melhor valor de acurácia é usada para ascomparações com os demais classificadores usados neste trabalho.• Teste 2: Avaliação do melhor tipo e conjunto de características a ser usado pelos

classificadores. Neste teste observou-se a acurácia obtida em função da magnitude,fase e produto (magnitude e fase) dos coeficientes de Fourier dos contornos dasilhueta.• Teste 3: A avaliação do desempenho dos classificadores, KNN e LDA, em relação à

quantidade de características usando três técnicas de redução de dimensionalidade,CDA, PCA e PLS.• Teste 4 Tem como objetivo avaliar o desempenho do método proposto a partir de

curvas CMS. Comparando curvas CMS geradas pelos classificadores LDA e KNNjuntamente com os métodos de redução de dimensionalidade.

4.2.1 Base de Dados

Para avaliação da metodologia proposta, utilizou-se a base de dados CasiaDataset B (CASIA, 2016). Esta base de dados possui sequências de silhuetas de 124sujeitos. Para cada sujeito existem dez sequências de silhueta, onde, seis são do sujeitocaminhando normalmente, duas com acessórios (mochila e bolsa) e duas com o sujeitousando casaco. Para cada uma das dez sequências existem onze variações de ângulos,de 0 a 180 em incrementos de 18, onde 0o é a visão frontal, 90o visão lateral e 180o

visão posterior, totalizando 110 sequências por sujeito e 13.640 sequências para a basecompleta.

Apesar da grande quantidade de sequências de silhueta, várias delas são for-madas por silhuetas com blocos desconectados, espaços vazios em seu interior e outrassequências com o ciclo de marcha incompleto. A Figura 4.1 apresenta exemplos de silhu-etas com os problemas relatados. Foram selecionados 50 sujeitos desta base de dados queatendem as restrições impostas pela metodologia desenvolvida, que são: pelo menos umciclo de marcha completo, e silhueta conectada e sem espaços vazios.

Page 44: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 42

Figura 4.1: Exemplos de silhuetas com blocos desconectados eespaços vazios em seu interior.

Este trabalho leva em consideração as sequências de silhuetas do sujeito cami-nhando naturalmente, sem o uso de acessórios e com o ângulo de 90o, ou seja, visão late-ral. Para os testes foram usadas seis sequências de cada sujeito, totalizando 300 sequênciasde marcha.

4.3 Avaliação dos Resultados

4.3.1 Teste 1

O objetivo deste teste é encontrar o valor de K para o classificador KNN, ou seja,a quantidade de vizinhos utilizados para classificar uma nova amostra. O teste consideraas acurácias obtidas variando o valor de K em 1,3 e 5. O melhor valor de K é aqueleque apresenta maior acurácia dos classificadores. O teste é realizado separadamenteusando os métodos CDA, PCA e PLS para a redução de dimensionalidade e levandoem consideração os dados de magnitude, fase e produto.

A Figura 4.2 apresenta os valores de acurácia produzidos pela variação do valorde K em função da quantidade de componentes obtidos pelo método CDA. A Figura4.2(a) ilustra acurácia atingida considerando a magnitude, 4.2(b) a fase e 4.2(c) o produtoentre magnitude e fase. Para esse teste, o valor de K = 3 apresentou melhores valores deacurácia.

A Figura 4.3 ilustra variações na acurácia com o método PCA para representa-ções distintas dos dados. As acurácias estão divididas em gráficos por magnitude, fase eproduto, que estão ilustrados respectivamente nas Figuras 4.3(a), 4.3(b) e 4.3(c). Para oPCA variando a representação dos dados, o K = 3 alcançou acurácias maiores que K = 1e K = 5.

Já a Figura 4.4 exibe acurácias obtidas com o KNN e o método de redução dedimensão PLS. As Figuras 4.4(a) e 4.4(c) que representam as acurácias para magnitudee produto respectivamente, apresentam maiores acurácias para K = 3. Já a Figura 4.4(b)com acurácias obtidas com K = 3 e K = 5 utilizando a fase, apresentam valores similares.

Os resultados considerando os tipos dados e a redução de dimensão são descritosde forma separada e mais detalhada em testes posteriores. Portanto, a realização do Teste

Page 45: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 43

Acu

ráci

a (%

)

Componentes0 200 400 600 800

50

60

70

K=1 K=3 K=5

(a) Magnitude

40

60

Acu

ráci

a (%

)

Componentes0 200 400 600 800

K=1 K=3 K=5

(b) Fase

Acu

ráci

a (%

)

Componentes0 200 400 600 800

40

50

60

K=1 K=3 K=5

(c) Produto

Figura 4.2: Acurácia do KNN para variações de K e a quantidadede componentes obtidos via CDA. Resultados obtidosconsiderando a magnitude, fase e o produto de ambasas características.

60

70

Acu

ráci

a (%

)

Componentes0 200 400 600 800

K=1 K=3 K=5

(a) Magnitude

Acu

ráci

a (%

)

Componentes0 200 400 600 800

40

60

K=1 K=3 K=5

(b) Fase

Acu

ráci

a (%

)

Componentes0 200 400 600 800

40

50

60

K=1 K=3 K=5

(c) Produto

Figura 4.3: Acurácia do KNN para variações de K e a quantidadede componentes obtidos via PCA. Resultados obtidosconsiderando a magnitude, fase e o produto de ambasas características.

Page 46: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 44

Acu

rácia

(%

)

Componentes0 200 400 600 800

50

60

70

(a) Magnitude

40

60

Acu

ráci

a (%

)

Componentes0 200 400 600 800

K=1 K=3 K=5

(b) Fase

40

50

60A

curá

cia

(%)

Componentes0 200 400 600 800

K=1 K=3 K=5

(c) Produto

Figura 4.4: Acurácia do KNN para variações de K e a quantidadede componentes obtidos via PLS. Resultados obtidosconsiderando a magnitude, fase e o produto de ambasas características.

1 teve como objetivo destacar as acurácias obtidas variando o valor de K. Pelos resultados,pode-se concluir que o valor de K = 3 obteve êxito nos resultados apresentados, emrelação aos valores de K = 1 e K = 5. No gráfico 4.4(b), os valores de acurácia para K = 3não foi superior em toda variação do número de componentes, no entanto, apresentouvalores similares aos obtidos com K = 5. Dadas essas observações, os resultados dostestes seguintes com o KNN serão realizados empregando K = 3.

4.3.2 Teste 2

Como explicitado na Seção 3.3, o vetor de características é formado pelos coefi-cientes da transformada de Fourier. Neste conjunto de testes, é avaliado o comportamentodos classificadores em função da quantidade de componentes, resultantes dos métodosde redução de dimensionalidade, em função do tipo de característica: magnitude, fase eproduto de ambas.

A Figura 4.5 ilustra os resultados usando magnitude, fase e produto para oclassificador KNN. Nota-se que a magnitude e a fase alcançam acurácias similares parao CDA e PCA, Figuras 4.5(a) e 4.5(b) respectivamente, porém, a magnitude mostrou-semais estável em relação a fase. Já para o PLS, ilustrado na Figura 4.5(c), as acuráciasobtidas com a magnitude são em torno de 10% superiores à fase e ao produto.

Page 47: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 45

0 100 200 300 400 500 600 700 800

Acu

ráci

a (%

)

40

50

60

70

Componentes

Mag. Fase Produto

(a) CDA

0 100 200 300 400 500 600 700 800

Acu

ráci

a (%

)

40

50

60

70

Componentes

Mag. Fase Produto

(b) PCA

45

50

55

60

65

70

0 100 200 300 400 500 600 700 800Componentes

Acu

ráci

a (%

)

Mag. Fase Produto

(c) PLS

Figura 4.5: Acurácias obtidas com o classificar KNN (K = 3) paramagnitude, fase e produto entre magnitude e fase paravários componentes dos seguintes métodos de reduçãode dimensão: CDA; PCA; e PLS.

As acurácias usando PCA, Figura 4.5(b), e PLS Figura 4.5(c) comportam-sede modo semelhante com o incremento da quantidade de componentes na composiçãodos vetores de características. Pois, mantém-se estáveis para magnitude, fase e produtoa partir 280 e 300 componentes respectivamente para o PCA e PLS. Isso ocorre pois oPCA e o PLS ordenam seus componentes de acordo com a variância e covariância dosdados, respectivamente, as quais tendem a um valor próximo de zero com o aumento decomponentes. Com isso, a partir de um determinado número de componentes, o ganho deinformação e a representatividade dos dados tende a diminuir. Como o KNN emprega adistância euclidiana como métrica de distância, os componentes que possuem variânciapróxima a zero não influenciam o resultado da distância. Dessa forma, o valor da acurácianão se altera a partir dos componentes que possuem variância próximas de zero. Já com oCDA Figura 4.5(a) a acurácia não se estabiliza, pois os dados não são transformados, masordenados considerando variância inter-classe e intra-classe.

Os resultados usando o classificador LDA para a magnitude, fase e produto estãoapresentados na Figura 4.6. Pelo gráfico, pode ser observado que a magnitude provêmaiores valores de acurácia em torno de 10% em relação a fase a ao produto para ostrês métodos de redução de dimensionalidade. O comportamento da acurácia em relação

Page 48: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 46

Componentes0 50 100 150 200 250 300

Acu

ráci

a (%

)

0

20

40

60

80

100

MagnitudeFaseProduto

(a) CDA

Componentes0 50 100 150 200 250 300

Acu

ráci

a (%

)

0

20

40

60

80

100

MagnitudeFaseProduto

(b) PCA

Componentes0 50 100 150 200 250 300

Acu

ráci

a (%

)

0

20

40

60

80

100MagnitudeFaseProduto

(c) PLS

Figura 4.6: Acurácias obtidas com o classificar LDA para magni-tude, fase e produto entre magnitude e fase para várioscomponentes dos seguintes métodos de redução de di-mensão: CDA; PCA; e PLS.

à quantidade de componentes é semelhante para os três tipos de características.Os resultados de acurácias alcançados com o LDA apresentam comportamentos

diferentes em relação ao KNN para a quantidade de componentes usados na classificação.Usando PCA, Figura 4.6(b) a acurácia tende a decrescer lentamente. O mesmo efeitopode ser observado nos resultados obtidos com CDA, Figura 4.6(a). Utilizando o PLS,Figura 4.6(c), as acurácias da magnitude, fase e produto tendem a decrescer abruptamenterespectivamente após 40, 10 e 50 componentes. Em comparação com os resultadosobtidos via KNN, o desempenho do LDA é afetado com o acréscimo de componentesmenos representativos (variância próxima a zero), o que sugere uma redução do valor deacurácia.

Os resultados usando fase e a magnitude mostraram-se semelhantes para o clas-sificador KNN, usando os métodos CDA e PCA, porém a magnitude obteve estabilizaçãodos valores com uma quantidade menor de componentes, e superou em 10% a fase com oPLS. Já com o LDA, a magnitude mostrou-se superior em torno de 10% em relação a fasepara os três métodos de redução de dimensionalidade. Dadas estas constatações, os testesseguintes serão realizados empregando a magnitude, afim de comparar o desempenho dosmétodos de redução de dimensionalidade e também, os classificadores.

Page 49: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 47

4.3.3 Teste 3

O objetivo deste teste é realizar um comparativo entre as técnicas de redução dedimensionalidade CDA, PCA e PLS, avaliando, a partir das respostas dos classificadoresLDA e KNN, qual destes três métodos geram melhores acurácias de classificação.Também é considerada a quantidade de componentes que cada método de redução dedimensionalidade necessita para alcançar o maior valor de acurácia.

Componentes0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300

Acu

ráci

a (%

)

0

10

20

30

40

50

60

70

80

90

100

CDAPCAPLSPico CDAPico PCAPico PLS

Figura 4.7: Gráfico comparativo das acurácias obtidas entre astécnicas de redução de dimensionalidade com o clas-sificador LDA usando a magnitude.

A Figura 4.7 exibe os resultados com o LDA usando os três métodos de reduçãode dimensionalidade. Observa-se que o PCA obteve melhor acurácia (representada pormarcadores de pico no gráfico) no geral, utilizando 110 características, seguido do CDAcom 100 características e o PLS com a menor taxa de acurácia com 30 características.Apesar de conseguir os picos de acurácias com 110 e 100 características, os métodosPCA e CDA alcançam acurácias próximas aos picos com 40 características.

Já a Figura 4.8 expõe a performance do KNN, dado as três técnicas de redução dedimensionalidade. Neste caso, o CDA e PCA obtiveram picos de acurácia bem próximos,porém, o PCA alcança esta acurácia com 40 características, enquanto que o CDA necessitade 310 componentes para obter resultados similares. O PLS obteve resultados inferiores,se comparado aos outros dois métodos.

A Tabela 4.1 ilustra as melhores acurácias que estão representadas como os picosnos gráficos nas Figuras 4.7 e 4.8. A primeira coluna da tabela relaciona o método deredução de dimensionalidade. A segunda coluna apresenta a quantidade de característicasusadas na classificação após a redução de dimensionalidade. A terceira coluna apresenta

Page 50: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 48

Componentes0 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800

Acu

ráci

a (%

)

50

55

60

65

70

75

CDAPCAPLSPico CDAPico PCAPico PLS

Figura 4.8: Gráfico comparativo das acurácias obtidas entre astécnicas de redução de dimensionalidade com o clas-sificador KNN usando a magnitude.

os métodos de classificação utilizados. A quarta coluna apresenta as acurácias obtidascom os métodos de redução, de classificação e a quantidade de características para cadalinha da tabela.

Tabela 4.1: Comparativo entre as melhores acurácias, conside-rando classificador, método de redução de dimensio-nalidade e quantidade de características.

Redução Dimens. Qtd. Caract. Classificador ACC (%)PCA 110 LDA 92,67CDA 100 LDA 89,00PLS 30 LDA 78,67CDA 310 KNN 70,67PCA 40 KNN 70,33PLS 70 KNN 67,33

Utilizou-se os resultados apresentados na Tabela 4.1 para guiar os testes seguin-tes, haja vista que utilizou-se nestes testes as combinações geraram as melhores acurácias,as quais estão ilustradas na tabela.

4.3.4 Teste 4

Este teste visa avaliar a performance dos classificadores LDA e KNN compa-rando curvas CMS entre estes. A Figura 4.9 mostra as curvas CMS geradas pelos resul-tados dos classificadores com suas respectivas técnicas de redução de dimensionalidade.

Page 51: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 49

Observa-se nas curvas CMS que a performance do LDA é superior ao KNN para o mé-todo proposto neste trabalho, uma vez que, o valor de CMS para o KNN é inferior ao LDApara todos os Ranks. Outro fato importante que nota-se nesse gráfico é que o LDA con-segue um desempenho em torno de 90% já no Rank 1, enquanto o KNN atinge o mesmoresultado no Rank 20.

KNNCDA

KNNPCA

LDACDA

LDAPCA

LDAPLS

KNNPLS

Rank0 2 4 6 8 10 12 14 16 18 20

65

70

75

80

85

90

95

100

CM

S (

%)

Figura 4.9: Curvas CMS para LDA e KNN utilizando os métodosde redução de dimensionalidade CDA, PCA e PLS.

Além de analisar os classificadores, a Figura 4.9 também propicia uma análisesobre as técnicas de redução de dimensionalidade utilizadas neste trabalho. Constata-seque as curvas CMS em relação ao CDA e o PCA se comportam de forma similar, tantono LDA quanto no KNN. O PLS se comporta semelhante ao CDA e PCA apenas noclassificador KNN. Já no LDA, o PLS apresenta resultados abaixo dos 10% até o Rank 5em relação ao CDA e o PCA.

Nos testes usando o classificador KNN, o CDA apresentou uma vantagem emtorno de 1% em relação ao PCA e de 3% em relação ao PLS, verificando a curvaCMS na Figura 4.9. No entanto, o PCA e o PLS necessitaram respectivamente de 40e 70 componentes para alcançar este desempenho, enquanto o CDA precisou de 310componentes para alcançar desempenho similar.

Outro dado observado nas curvas CMS é o fato de que para o Rank 1 noclassificador LDA, o PCA apresenta ganho em relação ao CDA. A partir do Rank 2 oCDA mostra-se superior, em torno de 1,5% de acurácia a mais que o PCA. Já o CMSdo PLS é inferior ao CDA e ao PCA para todos o Ranks. Diferentemente do que ocorreuno KNN, a quantidade de características resultantes tanto do CDA quanto do PCA sãopróximas, 100 e 110 respectivamente.

Page 52: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

4.3 Avaliação dos Resultados 50

A partir dos resultados encontrados, comparou-se estes com outros trabalhosque utilizam a mesma base de dados e também usam descritores de Fourier comocaracterísticas. Desse modo, a Tabela 4.2 ilustra um comparativo entre os métodospropostos neste trabalho e outros dois métodos. Percebe-se pela tabela que os métodosLDACDA e LDAPCA possuem uma maior capacidade de reconhecimento em relação aosoutros métodos avaliados. Os métodos propostos neste trabalho superam os métodopropostos por (MU; YU; WANG, 2009) e (LEE; TAN; TAN, 2013) observando os valoresde CMS.

Tabela 4.2: CMS para os métodos propostos neste trabalho e mé-todos de outros trabalhos.

CMS (%)Método Rank 1 Rank 2 Rank 3 Rank 4 Rank 5KNNCDA 70,66 79,00 79,33 80,33 81,33KNNPCA 70,33 78,00 78,33 79,33 80,33KNNPLS 67,33 77,00 77,00 78,33 79,00LDACDA 89,00 95,33 96,67 97,00 97,33LDAPCA 92,67 94,33 95,67 96,00 96,33LDAPLS 78,67 85,00 88,67 90,67 92,33

(MU; YU; WANG, 2009) 67,00 75,66 81,00 83,67 85,33(LEE; TAN; TAN, 2013) 62,03 77,22 84,81 87,34 88,61

Page 53: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

CAPÍTULO 5Conclusão e Trabalhos Futuros

5.0.1 Conclusão

Este trabalho apresentou uma metodologia para a elaboração de um sistemabiométrico que visa reconhecer pessoas pela sua maneira de caminhar. A metodologia usatécnicas de visão computacional para extrair características da marcha humana atravésde sequências de imagens. Uma abordagem baseada em silhueta foi usada para extraircaracterísticas, as quais foram extraídas dos contornos de sequências de silhuetas decada pessoa. O contorno possui informações de mudanças temporais ocorridas na silhuetadurante a marcha.

A metodologia de extração de características adotada foi baseada na metodologiado trabalho (MU; YU; WANG, 2009). Onde as informações temporais do contorno sãotransformadas para o domínio da frequência por meio da Transformada de Fourier. Porém,a representação dos dados neste trabalho difere da utilizada por (MU; YU; WANG, 2009).

Como as informações do contorno no domínio da frequência geram dados comgrande dimensionalidade, os métodos de redução de dimensionalidade CDA, PCA e PLSforam usados para reduzir a dimensão dos dados. Os resultados entre esses três métodosde redução de dimensionalidade foram comparados a partir da acurácia obtida, levandoem consideração a quantidade de características com que cada método conseguiu seumaior valor de acurácia.

Após a redução de dimensionalidade, dois classificadores KNN e LDA foramutilizados para classificar os dados oriundos da redução de dimensionalidade. O métodode validação cruzada leave-one-out foi utilizada no processo de classificação. Os resul-tados gerados foram oriundos da combinação entre os métodos de redução de dimensi-onalidade e os classificadores, gerando seis combinações KNNCDA, KNNPCA, KNNPLS,LDACDA, LDAPCA, LDAPLS.

A partir dessas seis combinações foram realizados testes para encontrar o valorde K do KNN que gerasse o maior valor de acurácia. Também foi realizado um teste paraverificar quais das representações de dados que são magnitude, fase ou produto entre osmesmos geraria maior valor de acurácia. E por fim foi realizado uma comparação entre

Page 54: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

52

estas combinações utilizando a CMS afim de comparações entre as performances do KNNe o LDA. O LDA obteve vantagem sobre o KNN, conseguindo acurácia de 92,66% parao LDAPCA para o Rank 1, enquanto o KNNCDA alcançou uma CMS de 70,66% para omesmo Rank. Já para o Rank 5, o melhor desempenho se deu pela combinação LDACDA,obtendo 97,33% de CSM, à medida que, a combinação KNNCDA obteve 81.33% de CSM.

Os testes foram realizado utilizando uma base de dados que já fornece assequências de silhuetas segmentadas, não necessitando assim de utilizar métodos desegmentação de fundo. Todos os testes foram realizado em sequências de silhuetas emque as pessoas caminhavam perpendicularmente à câmera, considerado como angulo de90o da pessoa em relação a câmera.

Os resultados obtidos mostraram que as características temporais do contornono domínio da frequência são discriminantes para reconhecimento de pessoas através damarcha. A aplicação da redução de dimensionalidade combinada com o classificador LDAconseguiu melhorar o desempenho do sistema proposto por (MU; YU; WANG, 2009),além de alcançar resultados superiores à outro método que também utiliza característicasdos contornos no domínio da frequência.

5.0.2 Trabalhos Futuros

O método proposto foi avaliado utilizando a visão perpendicular da pessoa emrelação a câmera. Então é possível realizar um trabalho em que utiliza-se sequências deimagens de pessoas caminhando em outras direções em relação a câmera.

A metodologia de extração de características é baseada em silhueta, afim detentar aumentar a acurácia do sistema, é possível realizar uma fusão entre a abordagemde extração de características proposto por este trabalho e uma abordagem baseada emmodelo.

Como foi utilizada silhuetas bidimensionais, também é possível explorar estametodologia utilizando silhuetas tridimensionais. Já que silhuetas tridimensionais conse-guem eliminar algumas ambiguidades encontradas em silhuetas bidimensionais.

5.0.3 Publicação

A Model and Appearance-based Approach for Gait Recognition using SVM. In:International Conference on Artificial Intelligence - ICAI 2015, Las Vegas.

Page 55: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Referências Bibliográficas

ABDI, H.; WILLIAMS, L. J. Principal component analysis. Wiley Interdisciplinary Reviews:Computational Statistics, v. 2, n. 4, p. 433–459, jul. 2010. ISSN 19395108. Disponível em:<http://doi.wiley.com/10.1002/wics.101>.

AHA, D. W.; KIBLER, D.; ALBERT, M. K. Instance-based learningalgorithms. Machine learning, v. 6, n. 1, p. 37–66, 1991. Disponível em:<http://link.springer.com/article/10.1007/BF00153759>.

ANKERST, M.; KASTENMÃ14LLER, G.; KRIEGEL, H.-P.; SEIDL, T.; others. Nearest

neighbor classification in 3d protein databases. In: ISMB. [s.n.], 1999. v. 99, p. 34–43.Disponível em: <http://www.aaai.org/Papers/ISMB/1999/ISMB99-005.pdf>.

ARIYANTO, G.; NIXON, M. S. Model-based 3d gait biometrics. In: Biometrics(IJCB), 2011 International Joint Conference on. IEEE, 2011. p. 1–7. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6117582>.

BENABDELKADER, C.; CUTLER, R.; NANDA, H.; DAVIS, L. Eigengait: Motion-based recognition of people using image self-similarity. In: Audio-and Video-BasedBiometric Person Authentication. Springer, 2001. p. 284–294. Disponível em:<http://link.springer.com/chapter/10.1007/3-540-45344-X_42>.

BOUCHRIKA, I.; GOFFREDO, M.; CARTER, J.; NIXON, M. On Using Gait inForensic Biometrics: ON USING GAIT IN FORENSIC BIOMETRICS. Journal ofForensic Sciences, v. 56, n. 4, p. 882–889, jul. 2011. ISSN 00221198. Disponível em:<http://doi.wiley.com/10.1111/j.1556-4029.2011.01793.x>.

BOULGOURIS, N. V.; HATZINAKOS, D.; PLATANIOTIS, K. N. Gait recognition:a challenging signal processing technology for biometric identification. signalprocessing magazine, IEEE, v. 22, n. 6, p. 78–90, 2005. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1550191>.

CASIA. Casia Gait Dataset. 2016. Acesso: Janeiro de 2016. Disponível em:<hhttp://www.cbsr.ia.ac.cn>.

CHAI, Y.; REN, J.; HAN, W.; LI, H. Human gait recognition: Approaches, datasets andchallenges. 2011. Disponível em: <http://digital-library.theiet.org/content/conferences/10.1049/ic.2011.0100>.

CUNADO, D.; NIXON, M. S.; CARTER, J. N. Automatic extraction and descriptionof human gait models for recognition purposes. Computer Vision and ImageUnderstanding, v. 90, n. 1, p. 1–41, abr. 2003. ISSN 10773142. Disponível em:<http://linkinghub.elsevier.com/retrieve/pii/S1077314203000080>.

Page 56: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Referências Bibliográficas 54

CUTTING, J. E.; KOZLOWSKI, L. T. Recognizing friends by their walk: Gait perceptionwithout familiarity cues. Bulletin of the Psychonomic Society, v. 9, n. 5, p. 353–356, 2013.ISSN 0090-5054. Disponível em: <http://dx.doi.org/10.3758/BF03337021>.

DAVIS, R. B.; OUNPUU, S.; TYBURSKI, D.; GAGE, J. R. A gait analysisdata collection and reduction technique. Human Movement Science,v. 10, n. 5, p. 575 – 587, 1991. ISSN 0167-9457. Disponível em:<http://www.sciencedirect.com/science/article/pii/016794579190046Z>.

DERAWI, M.; NICKEL, C.; BOURS, P.; BUSCH, C. Unobtrusive user-authentication onmobile phones using biometric gait recognition. In: Intelligent Information Hiding andMultimedia Signal Processing (IIH-MSP), 2010 Sixth International Conference on. [S.l.:s.n.], 2010. p. 306–311.

DIMAGGIO, J. A.; VERNON, W. Forensic podiatry: Principles and methods. In: .Totowa, NJ: Humana Press, 2011. cap. Forensic Gait Analysis, p. 103–115. ISBN978-1-61737-976-5. Disponível em: <http://dx.doi.org/10.1007/978-1-61737-976-5_6>.

DOCKSTADER, S.; BERG, M.; TEKALP, A. Stochastic kinematic modeling andfeature extraction for gait analysis. IEEE Transactions on Image Processing,v. 12, n. 8, p. 962–976, ago. 2003. ISSN 1057-7149. Disponível em:<http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=1217273>.

DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification. [S.l.: s.n.], 2008.

ERTOZ, L.; STEINBACH, M.; KUMAR, V. A new shared nearest neighborclustering algorithm and its applications. In: Workshop on ClusteringHigh Dimensional Data and its Applications at 2nd SIAM InternationalConference on Data Mining. [s.n.], 2002. p. 105–115. Disponível em:<http://www-users.cs.umn.edu/~kumar/papers/siam_hd_snn_cluster.pdf>.

FISHER, R. A. The use of multiple measurements in taxonomic problems.Annals of eugenics, v. 7, n. 2, p. 179–188, 1936. Disponível em:<http://onlinelibrary.wiley.com/doi/10.1111/j.1469-1809.1936.tb02137.x/full>.

GAFUROV, D. A survey of biometric gait recognition: Approaches, security andchallenges. In: Annual Norwegian Computer Science Conference. Citeseer, 2007. p.19–21. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.324.975&rep=rep1&type=pdf>.

GONZALEZ, R. C.; WOODS, R. E. Digital Image Processing (3rd Edition). 3. ed. [S.l.]:Prentice Hall, 2007. Hardcover. ISBN 013168728X.

GUO, G.; MU, G. Simultaneous dimensionality reduction and human age estimation viakernel partial least squares regression. In: Computer Vision and Pattern Recognition(CVPR), 2011 IEEE Conference on. IEEE, 2011. p. 657–664. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5995404>.

HAN, J.; BHANU, B. Individual recognition using gait energy image. Pattern Analysis andMachine Intelligence, IEEE Transactions on, v. 28, n. 2, p. 316–322, 2006. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1561189>.

Page 57: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Referências Bibliográficas 55

JAIN, A. K.; DUIN, R. P.; MAO, J. Statistical pattern recognition: A review. Pattern Analysisand Machine Intelligence, IEEE Transactions on, v. 22, n. 1, p. 4–37, 2000. Disponívelem: <http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=824819>.

JAIN, A. K.; FLYNN, P. J.; ROSS, A. A. Handbook of biometrics. New York, N.Y.: Springer,2008. ISBN 9780387710419 0387710418 9780387710402 038771040X. Disponível em:<http://public.eblib.com/choice/publicfullrecord.aspx?p=371949>.

JOHNSON, A. Y.; BOBICK, A. F. A multi-view method for gait recognitionusing static body parameters. In: Audio-and Video-Based BiometricPerson Authentication. Springer, 2001. p. 301–311. Disponível em:<http://link.springer.com/chapter/10.1007/3-540-45344-X_44>.

JOLLIFFE, I. Principal component analysis. [S.l.]: Wiley Online Library, 2002.

KALE, A.; SUNDARESAN, A.; RAJAGOPALAN, A.; CUNTOOR, N.; ROY-CHOWDHURY,A.; KRUGER, V.; CHELLAPPA, R. Identification of Humans Using Gait. IEEE Transactionson Image Processing, v. 13, n. 9, p. 1163–1173, set. 2004. ISSN 1057-7149. Disponívelem: <http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=1323098>.

KRZESZOWSKI, T.; MICHALCZUK, A.; KWOLEK, B.; SWITONSKI, A.;JOSINSKI, H. Gait recognition based on marker-less 3d motion capture.In: Advanced Video and Signal Based Surveillance (AVSS), 2013 10thIEEE International Conference on. IEEE, 2013. p. 232–237. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6636645>.

LAM, T. H.; LEE, R. S.; ZHANG, D. Human gait recognition by thefusion of motion and static spatio-temporal templates. Pattern Recognition,v. 40, n. 9, p. 2563–2573, set. 2007. ISSN 00313203. Disponível em:<http://linkinghub.elsevier.com/retrieve/pii/S0031320306004894>.

LEE, C. P.; TAN, A. W.; TAN, S. C. Gait recognition via optimally interpolated deformablecontours. Pattern Recognition Letters, v. 34, n. 6, p. 663–669, abr. 2013. ISSN 01678655.Disponível em: <http://linkinghub.elsevier.com/retrieve/pii/S0167865513000172>.

LI, Y.-B.; JIANG, T.-X.; QIAO, Z.-H.; QIAN, H.-J. General methods and developmentactuality of gait recognition. In: Wavelet Analysis and Pattern Recognition, 2007.ICWAPR’07. International Conference on. IEEE, 2007. v. 3, p. 1333–1340. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4421641>.

MOWBRAY, S. D.; NIXON, M. S. Automatic gait recognition via fourierdescriptors of deformable objects. In: Audio-and Video-Based BiometricPerson Authentication. Springer, 2003. p. 566–573. Disponível em:<http://link.springer.com/chapter/10.1007/3-540-44887-X_67>.

MU, H.-b.; YU, X.-C.; WANG, C.-J. A Frequency Domain Analysis Based GaitFeature Representation. In: Computational Intelligence and Software Engineering,2009. CiSE 2009. International Conference on. IEEE, 2009. p. 1–6. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5364468>.

Page 58: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Referências Bibliográficas 56

NIXON, M.; CARTER, J. Automatic Recognition by Gait. Proceedings of the IEEE,v. 94, n. 11, p. 2013–2024, nov. 2006. ISSN 0018-9219, 1558-2256. Disponível em:<http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=4052479>.

NIYOGI, S.; ADELSON, E. H. Analyzing and recognizing walking figures in XYT.In: Computer Vision and Pattern Recognition, 1994. Proceedings CVPR’94., 1994IEEE Computer Society Conference on. IEEE, 1994. p. 469–474. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=323868>.

OPPENHEIM, A. V.; SCHAFER, R. W.; BUCK, J. R. Discrete-time signal processing.[S.l.]: Prentice hall Englewood Cliffs, NJ, 1989.

PATAKY, T. C.; MU, T.; BOSCH, K.; ROSENBAUM, D.; GOULERMAS, J. Y. Gait recognition:highly unique dynamic plantar pressure patterns among 104 individuals. Journal of TheRoyal Society Interface, v. 9, n. 69, p. 790–800, abr. 2012. ISSN 1742-5689, 1742-5662.Disponível em: <http://rsif.royalsocietypublishing.org/cgi/doi/10.1098/rsif.2011.0430>.

PERRY, J. Análise da marcha: marcha normal barueri. SP: Malone, v. 1, p. 3, 2005.

PHILLIPS, P. J.; MOON, H.; RIZVI, S.; RAUSS, P. J.; others. The FERET evaluationmethodology for face-recognition algorithms. Pattern Analysis and MachineIntelligence, IEEE Transactions on, v. 22, n. 10, p. 1090–1104, 2000. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=879790>.

PICCARDI, M. Background subtraction techniques: a review. In: Systems, man andcybernetics, 2004 IEEE international conference on. IEEE, 2004. v. 4, p. 3099–3104.Disponível em: <http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1400815>.

ROSE, J.; GAMBLE, J. G. (Ed.). Human walking. Baltimore: Williams & Wilkins, 1994.ISBN 0-683-07360-5. Disponível em: <http://opac.inria.fr/record=b1084116>.

ROSIPAL, R.; KRÄMER, N. Overview and recent advances in partial least squares. In:Subspace, latent structure and feature selection. Springer, 2006. p. 34–51. Disponívelem: <http://link.springer.com/chapter/10.1007/11752790_2>.

SAAD, M. Análise de marcha: manual do CAMO-SBMFR. [S.l.]: Lemos Editorial, 1997.

SORZANO, C. O. S.; VARGAS, J.; MONTANO, A. P. A survey of dimensionalityreduction techniques. arXiv preprint arXiv:1403.2877, 2014. Disponível em:<http://arxiv.org/abs/1403.2877>.

THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition, Fourth Edition. 4th. ed.[S.l.]: Academic Press, 2008. ISBN 1597492728, 9781597492720.

WANG, J.; SHE, M.; NAHAVANDI, S.; KOUZANI, A. A Review ofVision-Based Gait Recognition Methods for Human Identification. In:. IEEE, 2010. p. 320–327. ISBN 978-1-4244-8816-2. Disponível em:<http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=5692583>.

WANG, L.; TAN, T.; NING, H.; HU, W. Silhouette analysis-based gaitrecognition for human identification. Pattern Analysis and Machine Intelligence,IEEE Transactions on, v. 25, n. 12, p. 1505–1518, 2003. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1251144>.

Page 59: Reconhecimento de Pessoas pela Marcha usando … CABRAL MENDES Reconhecimento de Pessoas pela Marcha usando Redução de Dimensionalidade de Contornos no Domínio da Frequência Dissertação

Referências Bibliográficas 57

WHITTLE, M. W. Clinical gait analysis: A review. Human MovementScience, v. 15, n. 3, p. 369 – 387, 1996. ISSN 0167-9457. Disponível em:<http://www.sciencedirect.com/science/article/pii/0167945796000061>.

WHITTLE, M. W. Gait analysis: an introduction. [S.l.]: Butterworth-Heinemann, 2014.

WOLD, H. Path models with latent variables: The NIPALS approach. QuantitativeSociology: International perspectives on mathematical and statistical model building,1975.

YOO, J.-H.; HWANG, D.; MOON, K.-Y.; NIXON, M. S. Automated human recognitionby gait using neural network. In: Image Processing Theory, Tools and Applications,2008. IPTA 2008. First Workshops on. IEEE, 2008. p. 1–6. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4743792>.

ZHAO, G.; CHEN, R.; LIU, G.; LI, H. Amplitude spectrum-based gait recognition.In: Automatic Face and Gesture Recognition, 2004. Proceedings. SixthIEEE International Conference on. IEEE, 2004. p. 23–28. Disponível em:<http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=1301504>.