pca-acp

Upload: saudade96

Post on 16-Oct-2015

16 views

Category:

Documents


0 download

TRANSCRIPT

  • by: Simone Vasconcelos e P\VHOI

    $QiOLVHGH&RPSRQHQWHV3ULQFLSDLV3&$

    ,QWURGXomR

    A DQiOLVH GRV FRPSRQHQWHV SULQFLSDLV - $&3 ou 3&$ (do ingls 3ULQFLSDO&RPSRQHQW$QDO\VLV) um mtodo que tem por finalidade bsica, a anlise dos dados usados visando sua reduo, eliminao de sobreposies e a HVFROKDGDVIRUPDVPDLVUHSUHVHQWDWLYDVGHGDGRVDSDUWLUGHFRPELQDo}HVOLQHDUHVGDVYDULiYHLVRULJLQDLV.

    tambm chamado de 7UDQVIRUPDGD'LVFUHWDGH.DUKXQHQ/RqYH(KLT) ou ainda 7UDQVIRUPDGD +RWHOOLQJ, em homenagem a Kari Karhunen, Michel Love [1907-1979] e Harold HotellingEla WUDQVIRUPDYDULiYHLVGLVFUHWDVHPFRHILFLHQWHVGHVFRUUHODFLRQDGRV. Foi derivada por +RWHOOLQJe por ele denominada como 0pWRGRGRV&RPSRQHQWHV3ULQFLSDLV

    Anlise de Componentes Principais (PCA) um dos mtodos estatsticos de mltiplas variveis mais simples. A PCA considerada a WUDQVIRUPDomROLQHDUyWLPD, dentre as transformadas de imagens, sendo muito utilizada pela comunidade de reconhecimento de padres.

    &RPSRQHQWHVSULQFLSDLV3&V

    A anlise de componentes principais (PCA) uma maneira de identificar a UHODomRHQWUHFDUDFWHUtVWLFDVH[WUDtGDVGHGDGRV. bastante til quando os vetores de caractersticas tm muitas dimenses, quando uma representao grfica no possvel, mas tambm pode ser til em dimenses menores, como mostra a Figura 1.

    A FRPSRQHQWHSULQFLSDO o arranjo que melhor representa a distribuio dos dados (linha vermelha na Figura 1) e a FRPSRQHQWH VHFXQGiULD perpendicular a componente principal (linha azul na Figura 1).

  • by: Simone Vasconcelos e P\VHOI

    Figura 1 - Linha vermelha mostra a distribuio principal dos dados e a linha azul mostra a componente secundria.

    Os SDVVRV para calcular as componentes principais so:

    REWHU os dados ou as 0 amostras de vetores de dimenso Q; calcular a PpGLD ou o YHWRUPpGLR destes dados;

    VXEWUDLUDPpGLD de todos os itens de dados;

    calcular a PDWUL]GHFRYDULkQFLD usando todas as subtraes. Ela o resultado da mdia do produto de cada subtrao por ela mesma e ter dimenso QxQ;

    calcular os DXWRYDORUHV e DXWRYHWRUHV da matriz de covarincia.

    arranjar os a PDWUL]GD7UDQVIRUPDGDGH+RWHOOLQJ (cujas linhas so formadas a partir dos autovetores da matriz de covarincia arranjados de modo que a primeira linha, o elemento (0,0), seja o auto vetor correspondente ao maior autovalor, e assim sucessivamente at que a ltima linha corresponda ao menor autovalor.

    O DXWR YHWRU com o maior DXWRYDORU associado, corresponde componente principal do conjunto de dados usado. Isso significa que essa o relacionamento mais significativo entre as dimenses dos dados. A Figura 1 ilustra esse ponto.

  • by: Simone Vasconcelos e P\VHOI

    As componentes principais podem ento ser usadas conforme a maneira desejada. Seja apenas para visualizao, para aquisio de imagens de objetos 2D de acordo com o melhor posicionamento da cmera ou reconhecimento das principais caractersticas de medidas a serem usadas.

    0DWUL]GHFRYDULkQFLDEm estatstica, existem vrias anlises que podem ser feitas sobre um conjunto

    de dados, como a PpGLD aritmtica, o GHVYLRSDGUmR e a YDULkQFLD. Os dois ltimos medem o quanto os dados esto afastados em relao a mdia (a varincia igual ao quadrado do desvio padro).

    Todas essas medidas, porm, consideram separadamente cada tipo de dados. Por sua vez, a FRYDULkQFLD sempre medida entre duas dimenses (calcular a covarincia entre uma dimenso e ela mesma resulta na varincia). A frmula da covarincia para dados de dimenso 2 (; e

  • by: Simone Vasconcelos e P\VHOI

    A diagonal principal da matriz contm as varincias e as demais posies a correlao entre as direes. Essa matriz simtrica e real, de modo que sempre

    possvel encontrar um conjunto de autovetores ortonormais (Anton e Rorres,2004).

    Para 0 amostras de vetores em um conjunto qualquer, o YHWRUPpGLR pode ser calculado de:

    =

    =

    [0P 11

    Assim supondo que se tenha 4 amostras de um conjunto de vetores de caractersticas 3D, que correspondem a 3 caractersticas de texturas medidas de 4

    imagens: probabilidade mxima, uniformidade,e momento de diferena de ordem 3. Suponha tambm que estes valores para cada uma dos 4 imagens seja:

    =

    000

    1[ ;

    =

    001

    2[ ;

    =

    011

    3[ ; e

    =

    101

    4[

    O vetor mdio destas medidas ser:

    =

    4/14/14/3

    P

    Para calcular a PDWUL]GHFRYDULkQFLD subtrai-se cada [

    de P . E usando todas as subtraes calcula-se o produto de cada subtrao por ela mesma. A PDWUL] GHFRYDULkQFLD o resultado da mdia desta soma.

    Para os dados acima se tem:

  • by: Simone Vasconcelos e P\VHOI

    =

    4/14/14/3

    1 P[ ;

    =

    4/14/1

    4/1

    2 P[ ;

    =

    4/14/34/1

    3 P[ e

    =

    4/34/1

    4/1

    4 P[

    O produto de cada um destes vetores por ele mesmo resultar cada um em uma matriz 3x3, dada por ([ P ) ([ P ) . No exemplo em questo teremos as seguintes matrizes respectivamente:

    ( )( )

    =

    16/116/116/316/116/116/316/316/316/9

    11

    P[P[ ;

    ( )( )

    =

    16/116/116/116/116/116/116/116/116/1

    22

    P[P[ ;

    ( )( )

    =

    16/116/316/116/316/916/316/116/316/1

    33

    P[P[ e

    ( )( )

    =

    16/916/316/316/316/116/1

    16/316/116/1

    44

    P[P[

    De modo que a PDWUL]GHFRYDULkQFLDdestes valores ser:

    ( )

    =

    16/1216/416/416/416/1216/4

    16/416/416/12

    41

    & ou ( )

    =

    16/316/116/116/116/316/1

    16/116/116/3&

    Neste exemplo todos os elementos da diagonal principal so iguais, o que indica que os 3 elementos do vetor de caracterstica usado tm mesma varincia. Todos os 3 elementos so correlacionados. Os elementos 1 e 3 do vetor de caracterstica usado tm correlao positiva, enquanto que os elementos 2 e 3 so negativamente

    correlacionados.

    Este exemplo numrico da obteno da matriz de covarincia a partir do

    conhecimento de 4 medidas das coordenadas 3D de um objeto apresentado em Gonzalez e Wood (2000) na (seo 3.6).

  • by: Simone Vasconcelos e P\VHOI

    O exemplo de clculo acima pode ser facilmente estendido para o clculo da matriz de covarincia em 3D com qualquer nmero de medidas. Tambm facilmente estendido para casos de vetores com mais de 3 dimenses. Se estes tiverem 4 dimenses a matriz ser 4x4, se tiverem 5 dimenses a matriz ser 5x5, e tiverem Q dimenses a matriz ser Q xQ .

    A matriz de covarincia para 0 amostras de vetores em um conjunto qualquer, com YHWRUPpGLR P pode ser calculado de:

    PP[[0& = =1

    1

    A matriz da covarincia UHDOHVLPpWULFDSendo sempre possvel encontrar um conjunto de Q autovalores e correspondentemente autovetores ortonormais (Anton e Rorres , 2004).

    $XWRHVSDoRVDXWRYHWRUHVHDXWRYDORUHVDiz-se que um vetor Y um DXWRYHWRU de uma matriz quadrada 0 se 0 Y

    (multiplicao da matriz 0 pelo vetor Y) resulta num mltiplo de Y, ou seja, em OY( ou na multiplicao de um escalar pelo vetor). Nesse caso, O o chamado DXWRYDORU de 0 associado ao DXWRYHWRU Y.

    Quando se fala em DXWRYHWRUHV, subentende-se autovetores de comprimento 1, (no nulos) j que a propriedade desejada apenas a direo do vetor.

    Uma propriedade dos autovetores que eles so perpendiculares (ortogonais) entre si. Essa propriedade importante porque torna possvel expressar os dados em termos dos autovetores, em vez de em termos dos eixos [, \ e ].

    Para matrizes de dimenses 2 2 ou tambm 3 3, os autovalores podem ser

    calculados usando a HTXDomRFDUDFWHUtVWLFD de 0:

  • by: Simone Vasconcelos e P\VHOI

    Onde , a matriz identidade, 0 a matriz dada e os escalares no nulos, Oque a solucionam sero os DXWRYDORUHVPor exemplo, no caso de uma matriz 0 2 2:

    Resulta numa equao de 2 grau, cujas razes podem ser calculadas e substitudas no sistema abaixo para encontrar os DXWRYHWRUHV correspondentes a cada DXWRYDORU:

    No caso de dimenses maiores, ou para algoritmos genricos para qualquer nmero de dimenses, o usual aplicar um algoritmo numrico iterativo. O ltimo

    passo ordenar os autovetores de acordo com os autovalores de maior valor (principais).

    Equivalentemente, os DXWRYHWRUHV associados aos DXWRYDORUHV sero os vetores no-nulos no espao soluo de (O,0Y Este espao chamado de DXWRHVSDoR de0associado a OAs bases para cada um destesDXWRYHWRUHVso chamadas deEDVHVGHDXWRHVSDoR

    Como exemplo ilustrativo considere que antes da captura definitiva da imagem

    de um objetos tenha-se pr-capturado FRQMXQWRV GH FRRUGHQDGDV [\] aleatrias deste objeto por VRQDU. Estas coordenadas foram usadas em uma anlise prvia para posicionamento para a captura definitiva das suas coordenadas. Se a matriz de covarincia obtida a partir desta anlise previa :

    301121200

    == &0

  • by: Simone Vasconcelos e P\VHOI

    Qual seria seus auto-espaos associados e suas auto-bases?

    A HTXDomRFDUDFWHUtVWLFD de 0 : O

    O O Ou na IRUPDIDWRUDGD:

    OO De modo que seus autovalores so O eO E, portanto temosDXWRHVSDoRVGH0Por definio vetor Y um DXWRYHWRU da matriz quadrada 0se e somente seY soluo no trivial de :

    (O,0Y Assim neste exemplo teremos que achar as solues de:

    =

    000

    301121

    200

    3

    2

    1

    [[[

    para os dois autovalores O eO

    Para O temos autovetores na forma:

    +

    =

    =

    010

    1012

    1 WVVWV

    Y e como

    010

    101

    H so linearmente independentes formam

    uma EDVHGRDXWRHVSDoR associado a O Para O temos autovetores na forma:

    =

    =

    1122

    2 VVVV

    Y eportanto

    112

    uma EDVHGRDXWRHVSDoR associado a O

  • by: Simone Vasconcelos e P\VHOI

    Dois resultados importantes da OJHEUD /LQHDU VmR (Anton e Rorres,2004, p. 246):

    6H uma matriz Q[Q tem Q autovalores linearmente independentes HQWmR ela GLDJRQDOL]iYHO. Se uma matriz GLDJRQDOL]iYHO ento ela tem Q autovalores linearmente independentes que sero os VHXVHOHPHQWRVGDGLDJRQDOSULQFLSDO.

    Os procedimentos para diagonalizar uma matrizM correspondem a seguir os passos abaixo:

    1- Encontrar seus autovetores linearmente independente:Y Y Y 2-Formar uma Matriz3com estes vetores como colunas. 3- O produto 3 0 3 ser uma matriz diagonal, com elementos iguais aos

    autovalores na diagonal principal.

    Vamos usar estes passos para diagonalizar a 301121200

    == &0 , da qual j

    calculamos os 3 autovetores :

    010

    101

    H associados a O H

    112

    associado a O

    Como os 3 soOLQHUPHQWHLQGHSHQGHQWHVisto no mltiplos ou resultado da soma de uns dos outros, o passo 1, j esta feito.

    A matriz do passo 2 :

    [ ]101110201

    321

    == YYY3 que pode ser usada para diagonalizar M.

    Confira fazendo as contas:

    301121200

    101111201

    1

    = 303

    101110201

    100020002

    =

  • by: Simone Vasconcelos e P\VHOI

    No processo de diagonalizao no existe uma ordem preferencial para as colunas de O, se a ordem dos autovalores fosse outro o resultado seria outro mas ainda diagonalizando a matriz. Mas o mesmo no acontece para a 7UDQVIRUPDGD GH+RWHOOLQJela tem que sempre ser feita em ordem decrescente de autovalores.

    7UDQVIRUPDGDGH+RWHOOLQJComo a matiz da covarincia UHDOHVLPpWULFD, sempre possvel encontrar um

    conjunto de Q auto vetores ortonormais (Anton e Rorres , 2004). Considere que estes Q autovetores sejam arranjados de modo decrescentes de acordo com os valores dos Q auto valores. Isto vamos chamar de H o auto vetor correspondente ao maior autovalor, chamaremos de O e que vamos chamar de H o auto vetor correspondente ao segundo maior autovalor, O ;e assim sucessivamente de modo que vamos chamar de H o auto vetor correspondente ao menor autovalor, que chamaremos de O .

    Considere uma matriz, $, cujas colunas sejam os autovetores de & ordenados como falado no pargrafo anterior. E considere uma transformao definida por esta

    matriz como

    \ $[P Ela vai mapear os valores [, em valores \, cuja mdia ser zero, isto P , e cujaPDWUL[GHFRYDULkQFLDdos\ pode ser obtida de$e& por:

    & $& $ Esta matrix& diagonal e tem elementos ao longo da diagonal principal que

    so os autovalores de& . Assim & ser:

    ( )

    =

    1

    2

    3

    2

    1

    000000.....

    ....

    ......

    000000

    !

    !

    "&

  • by: Simone Vasconcelos e P\VHOI

    Como os elementos fora da diagonal principal de & so zeros, os elementos dos vetores \ so descorrelacionados. Como os elementos da diagonal de uma matriz diagonal so seus autovalores, segue que & e &

    possuem RVPHVPRVDXWRYDORUHV HDXWRYHWRUHV (Anton e Rorres,2004).

    A transformao representada pela equao (1)

    \ $[P chamada de7UDQVIRUPDGDGH+RWHOOLQJA nica diferena entre esta com a matriz$e a3da seo anterior, que diagonaliza a matriz & , a ordenao dos autovetores e autovalores, que esto presentes na7UDQVIRUPDGDGH+RWHOOLQJ

    Assim no exemplo numrico dosSRQWRVGRVRQDUque estamos considerando, o efeito do uso da equao (1) ou da 7UDQVIRUPDGDGH+RWHOOLQJ o estabelecimneto de umQRYRVLVWHPDGHFRRUGHQDGDVcujaRULJHPser oFHQWUyLGHGRconjunto de pontosRYHWRU GH PpGLD e cujos HL[RV estaro na direo dos DXWRYHWRUHV GH & Esta LQWHUSUHWDomR JHRPpWULFD mostra claramente que o HIHLWR GD 7UDQVIRUPDGD GH+RWHOOLQJ a obteno de umDOLQKDPHQWRGRVDXWRYHWRUHVporURWDomRGRVLVWHPDGHHL[RV. Este alinhamento oPHFDQLVPRque GHVFRUUHODFLRQD RV GDGRV. Alm disso, cada autovalor indica a YDULkQFLDdo componente \ # ao longo do autovetor Y # . A idia de alinhar objetos desempenha um papel muito importante na Anlise de Imagens, no Reconhecimento de Padres e objetos e na Viso de Mquina. Depois que os objetos so extrados, ou segmentados das imagens extrai-se caractersticas para seu reconhecimento, a maioria deles muito sensvel ao ngulo que a direo entre os eixos da cmera e os eixos do objeto fazem. A utilizao da direo adequada evita muitos erros posteriores.

    $QiOLVHGH&RPSRQHQWHV3ULQFLSDLV3&$

    A PCA consiste em promover uma transformao linear nos dados de modo que

    os dados resultantes desta transformao tenham suas componentes mais relevantes nas

  • by: Simone Vasconcelos e P\VHOI

    primeiras dimenses, em eixos denominados principais. As figuras abaixo ilustram um conjunto bidimensional e o mesmo conjunto aps a aplicao da PCA.

    Figura 2 - Conjunto de dados

    Figura 3 - Conjunto de dados aps a PCA.

    A matriz de transformao utilizada para o clculo da PCA consiste em uma

    matriz cujas colunas so os autovetores da matriz de covarincia estimada dos dados.

    A matriz de transformao utilizada para o clculo da PCA consiste em uma

    matriz cujas linhas so os autovetores da matriz de covarincia estimada dos dados. A matriz de covarincia p XPD PDWUL] VLPpWULFD H GHILQLGD SRVLWLYD TXH SRVVXLinformao sobre as varincias em todos os eixos onde os dados esto distribudos. Esta pode ser estimada como:

  • by: Simone Vasconcelos e P\VHOI

    onde 1 o nmero de amostras de dados [LH a mdia do conjunto. Os autovetores desta matriz de fato formam uma nova base que segue a variao

    dos dados. A PCA, portanto consiste em uma mudana de base. A PCA e a

    decomposio por autovalor de uma matriz so basicamente a mesma coisa, apenas vem o problema de modos diferentes.

    A aplicao da PCA a uma imagem colorida pode ser realizada com trs passos bsicos: Primeiro gera-VHDPDWUL] DSDUWLUGDRSHUDo descrita abaixo:

    = cov ( [R G B] )

    2 REWLGR QD HTXDo acima uma matriz 3x3, que representa a matriz de covarincia {cov} da imagem colorida, e servir para o clculo da matriz que levar a imagem do RGB para um novo espao, gerado pela PCA. Com a matriz de covarincia SRGH-se, ento, calcular seus autovalores e autovetores, como representado na

    equao: >7DXW@ HLJ

    Obtm-se dessa operao as matrizes T e aut. T a matriz, na qual suas linhas so os autovetores da matriz de covarincia e aut a matriz diagonal, na qual os valores

    presentes em sua diagonal so os autovalores de ( HLJ representa a operao de obteno dos autovalores e autovetores da matrL]

    A equao abaixo mostra a gerao do novo espao chamado de [P1, P2, P3].

  • by: Simone Vasconcelos e P\VHOI

    3&$HP5HFRQKHFLPHQWRGH3DGU}HV

    Segundo a tcnica de PCA, imagens podem ser tratadas como padres em um espao linear para efetuar reconhecimento estatstico. Sendo Ko nmero de linhas de uma imagem e Zo nmero de colunas, pode-se dizer que uma imagem um padro de Kx Zcaractersticas ou um vetor no espao (KxZ) dimensional, o qual chamado de espao de imagens", representado por ,.

    Assim, dada uma imagem representada como uma matriz K x Z, pode-se construir sua representao como um vetor atravs de uma leitura coluna a coluna da imagem, colocando o valor de cada pixel da imagem em um vetor coluna [.

    Em reconhecimento de padres, sempre desejvel dispor de uma representao compacta e de um bom poder de discriminao de classes de padres. Para isso, importante que no haja redundncia entre as diferentes caractersticas dos padres, ou seja, que no haja covarincia entre os vetores da base do espao de caractersticas.

    Para verificar se h covarincia entre as caractersticas (ou variveis), utiliza-se a matriz de covarincia. Um espao vetorial com a propriedade de no haver covarincia entre os vetores da base do espao, possui uma base cuja matriz de covarincia de seus vetores diagonal.

    Para diagonalizar a matriz de covarincia, deve-se efetuar uma mudana de base.

    Assim, as variveis dos padres representados em termos dessa nova base do espao de caractersticas no possuem correlao entre si, seja +essa nova matriz. importante lembrar que no caso de PCA, os autovalores da matriz de covarincia so iguais varincia das caractersticas transformadas. Assim, se um autovetor possui autovalor grande, significa que esse fica em uma direo em que h uma grande varincia dos padres. A importncia disso est no fato de que, em geral, mais fcil distinguir padres usando uma base em que seus vetores apontam para a direo da maior varincia dos dados, alm de no serem correlacionados entre si.

    Logo, se a matriz + for construda de forma que sejam escolhidos somente os autovetores contendo os maiores autovalores, a varincia total dos padres de entrada no sofre grandes alteraes.

  • by: Simone Vasconcelos e P\VHOI

    7UDQVIRUPDGDGH+RWHOOLQJH3&$QDUHFRQVWUXomR

    Outra aplicao importante se relaciona a reconstruo de[, dado\SRU

    \ $[P$

    Como as linhas de$so vetores ortonormais pois$ % & $ ' qualquer vetor[SRGHser recuperado a partir de seu correspondente\pela relao

    [ $ ' \P$

    Se nem todos os autovetores de&$ forem usados mas apenas osNmaiores, formandouma matrix$ ( , tem-se uma matriz de transformao de ordemNxQ, e a reconstruo no ser exata mas uma aproximao.

    6FRUHVH/RDGLQJV

    A anlise de componentes principais (PCA) um mtodo de anlise multivariada utilizado para projetar dados n-dimensionais em um espao de baixa dimenso, normalmente duas ou trs. Isso feito atravs do clculo de componentes principais obtidas fazendo-se combinaes lineares das variveis originais.

    Em uma anlise de componentes principais, o agrupamento das amostras define

    a estrutura dos dados atravs de grficos de VFRUHV e ORDGLQJV cujos eixos so componentes principais (PCs) nos quais os dados so projetados. Os VFRUHVfornecem a composio das PCs em relao s amostras, enquanto os ORDGLQJV fornecem essa mesma composio em relao s variveis. Como as PCs so ortogonais, possvel examinar as relaes entre amostras e variveis atravs dos grficos dos VFRUHVe dos ORDGLQJV. O estudo conjunto de VFRUHVe ORDGLQJVainda permite estimar a influncia de cada varivel em cada amostra.

    Os VFRUHV (th) e ORDGLQJV(ph) podem ser calculados par a par por um processo iterativo, como na equao abaixo.

    X = t1 p'1 + t2 p'2 + .....+ th p'h

  • by: Simone Vasconcelos e P\VHOI

    Figura 4 - Representao da matriz de dados X decomposta em produto de matrizes de posto igual a um

    A figura abaixo fornece a interpretao geomtrica dos valores ORDGLQJe VFRUHpara a observao 1, num grfico a duas dimenses com duas variveis x1 e x2. A

    direo de maior variabilidade das amostras indicada pela reta que representa um componente principal. Os VFRUHV so as projees das amostras na direo dos componenets principais e os ORDGLQJVso os ngulos entre cada componente principal e cada varivel.

    Figura 5- Interpretao geomtrica dos valores ORDGLQJe VFRUH

    &RQVLGHUDo}HV)LQDLVAnlise dos Componentes Principais (PCA) um mtodo estatstico linear que

    encontra os autovalores e autovetores da matriz de covarincia dos dados e, com esse

  • by: Simone Vasconcelos e P\VHOI

    resultado, pode-se realizar a reduo dimensional dos dados e analisar os padres principais de variabilidade presentes.

    PCA um mtodo exploratrio porque auxilia na elaborao de hipteses gerais a partir dos dados coletados, contrastando com estudos direcionados nos quais hipteses

    prvias so testadas. tambm capaz de separar a informao importante da redundante e aleatria.

    A PCA tambm muito utilizada em algoritmos de compresso de imagens. A caracterstica bsica da PCA a reduo do espao necessrio para a representao da imagem, j que a PCA promove uma compactao da energia.

    Com o emprego da PCA a visualizao de diversas variveis em um

    determinado conjunto de dados torna-se mais produtiva, rpida, objetiva e eficiente.

    5HIHUrQFLDV%LEOLRJUiILFDVAndrade, M. C.; Pinto, L. C. M. &ODVVLILFDomR GH )ROKDV SRU 7DPDQKR H )RUPD $WUDYpV GH'HVFULWRUHV *HRPpWULFRV H $QiOLVH GRV &RPSRQHQWHV 3ULQFLSDLV Anais do IV Workshop em Tratamento de Imagens, NPDI/DCC/ICEx/UFMG, p. 54-61 2003.Anton , H., Rorres C., OJHEUD/LQHDUFRP$SOLFDo}HV, Bookman, Porto Alegra, 2004. Farias, M. A. 2SHUDo}HV%RROHDQDVHQWUH2EMHWRV'HOLPLWDGRVSRU6XUIHOV8VDQGR&RQVWUDLQHG%63WUHHV. Dissertao de Mestrado. Cincia da Computao - UFRS. Porto Alegre, 2006. Ferreira, E.C.; Rodrigues, S. H. B. G.; Ferreira, M. M. C.; Nbrega I. J. A.; Nogueira, A. R. A. $QiOLVHH[SORUDWyULD GRV WHRUHV GH FRQVWLWXLQWHV LQRUJkQLFRV HP VXFRV H UHIULJHUDQWHV GH XYD Ecltica Qumica. vol. 27 n.especial. So Paulo, 2002. Silva, C. Y. V. W.; Traina, A. J. M. 5HFXSHUDomR GH ,PDJHQV0pGLFDV SRU &RQWH~GR 8WLOL]DQGR:DYHOHWVH3&$ Anais do X Congresso Brasileiro de Informtica em Sade, 14-18 de outubro de 2006, )ORULDQySROLV6&www.sbis.org.br/cbis/arquivos/897.pdfSouza, G. F. &RPSUHVVmR $XWR$GDSWDWLYDV GH ,PDJHQV &RORULGDV Dissertao de Mestrado em Cincias Universidade Federal do Rio Grande do Norte. Natal -RN, 2005.

    R. C. Gonzalez and R. E. Woods, 3URFHVVDPHQWRGH,PDJHQV'LJLWDLV, Edgard Blucher, So Paulo, 2000 (original :Addison Wesley Pub. Co. 1993) (seo 3.6) Tutorial e exemplo no Scilab : csnet.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf

    Site sobre : Michel Loeve e seu premio (The Loeve Prize) bianual: http://www.stat.berkeley.edu/users/aldous/Research/Loeve.html

    http://sunsite.berkeley.edu/uchistory/archives_exhibits/in_memoriam/catalog/loeve_michel.html