carlos alberto alves varella doutor em engenharia agrícola universidade federal rural do rio de...

29
Análise de Componentes Principais Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA- CS Novembro 2011

Upload: internet

Post on 18-Apr-2015

112 views

Category:

Documents


4 download

TRANSCRIPT

  • Slide 1
  • Carlos Alberto Alves Varella Doutor em Engenharia Agrcola Universidade Federal Rural do Rio de Janeiro Ps-Graduao em Agronomia Cincia do Solo: CPGA-CS Novembro 2011
  • Slide 2
  • Introduo a tcnica mais conhecida da estatstica multivariada; Pode ser utilizada para gerao de ndices e agrupamento de indivduos; Cada componente principal uma combinao linear de todas as variveis originais; So independentes entre si; importante ter uma viso conjunta de todas ou quase todas as tcnicas da estatstica multivariada para resolver a maioria dos problema prticos.
  • Slide 3
  • Construo da matriz de dados (Matriz X) Matriz de dados para p variveis e n indivduos; Caractersticas observadas so : X 1, X 2, X 3,..., X p ; A matriz de ordem n x p.
  • Slide 4
  • Matriz de Covarincia, S Obtida a partir da matriz X de dados de ordem n x p; uma estimativa da matriz de covarincia da populao ; A matriz S simtrica e de ordem p x p.
  • Slide 5
  • Padronizao dos dados Mdia zero e varincia 1 Mdia qualquer e varincia 1
  • Slide 6
  • Variveis Padronizadas A matriz Z igual a matriz de correlao R da matriz de dados X;
  • Slide 7
  • Consideraes sobre a padronizao Normalmente partimos da matriz padronizada; O resultado a partir da matriz S pode ser diferente do resultado a partir da matriz R. A padronizao s dever ser feita quando as unidades das variveis observadas no so as mesmas.
  • Slide 8
  • Determinao dos Componentes Principais Os componentes principais so determinados resolvendo-se a equao caracterstica da matriz S ou R, isto :
  • Slide 9
  • Autovalores da matriz R 1, 2, 3,..., p so as razes da equao caracterstica da matriz R ou S, ento: 1, 2, 3,..., p podem se autovalores da matriz R ou S;
  • Slide 10
  • Autovetores Para cada autovalor i existe um autovetor: ip 2i 1i i a a a a ~
  • Slide 11
  • Componente principal Y i Sendo o autovalor = i, ento o i-simo componente principal dado por: pip22i11ii XaXaXaY
  • Slide 12
  • Propriedades dos Componentes Principais A varincia do componente principal Y i igual ao valor do autovalor i : O primeiro componente o que apresenta maior varincia e assim por diante: ii YarV )Y(arV )Y( V )Y( V p21
  • Slide 13
  • Propriedades dos Componentes Principais Total de varincia das variveis originais = somatrio dos autovalores = total de varincia dos componentes principais: )Y(arV )X( V iii Os componentes principais no so correlacionados entre si: 0Y,YovC ji
  • Slide 14
  • Importncia de cada componente principal Medida pela porcentagem de varincia de cada componente em relao ao total 100 Strao 100 YarV Y V C i p 1i i i p 1i i i i
  • Slide 15
  • Nmero de componentes No existe um modelo estatstico; O nmero de ser aquele que acumula 70% ou mais de proporo da varincia total. pkonde%70100 YarV Y V Y V k 1i i k1
  • Slide 16
  • Interpretao dos componentes Verifica-se o Grau de influncia que cada varivel Xj tem sobre o componente Yi. j j1 1 j 1 j11YXj1,j XarV a X V Y V arYXCorr
  • Slide 17
  • Interpretao dos componentes Verifica-se o peso ou loading de cada varivel sobre o componente p p1 p 2 12 2 1 11 1 XarV a w, X V a w, X V a w
  • Slide 18
  • Escores dos componentes Organizao dos dados Trat (Indiv) Variveis Escores dos componentes principais X1X1 X2X2...XpXp Y1Y1 Y2Y2 YkYk 1X 11 X 12...X 1p Y 11 Y 12...Y 1k 2X 21 X 22...X 2p Y 21 Y 22...Y 2k nX n1 X n2 X np Y n1 Y n2...Y nk
  • Slide 19
  • Escores do primeiro componente para n tratamentos e p variveis O escore o valor da cominao linear; Y n1 =componente 1 do tratamento n para p variveis.
  • Slide 20
  • Exemplo de Aplicao Variveis originais observadas (X1 e X2) e padronizados (Z1 e Z2). Duas variveis para cinco tratamentos (k=5). Tratamentos Variveis originaisVariveis padronizadas X1X1 X2X2 Z1Z1 Z2Z2 110296 24,38276,9554 210487 24,86086,3033 310162 24,14364,4920 49368 22,23134,9268 510077 23,90465,5788 Varincia17,50190,50 11
  • Slide 21
  • Padronizao da Varincia Os dados sero padronizados para varincia 1:
  • Slide 22
  • Matriz de Correlao Elementos da diagonal principal igual a 1. Significa a correlao entre mesmas variveis; Elementos fora da diagonal principal igual a 0,5456. Significa a correlao entre as variveis (X1,X2).
  • Slide 23
  • Autovalores da matriz de correlao So os elementos fora da diagonal principal da matriz. Significa a varincia de cada componente principal. 1 = 1,5456 e 2 = 0,4544
  • Slide 24
  • Trao da matriz de correlao Somatrio dos elementos da diagonal da matriz. Significa o total de varincia. Trao(R) = 1+1=2
  • Slide 25
  • Primeiro autovetor da matriz de correlao So os coeficientes das variveis padronizadas Z1, Z2. Y1 a combinao linear de Z1, Z2 que denominamos de primeiro componente principal
  • Slide 26
  • Resultados da anlise Varincia, ponderao, correlao, % de varincia e % de varincia acumulada dos componentes principais. CPVarincia () PonderaoCorrelao entre Zj eYi % de varincia % de varincia acumulada dos Y i Z1Z1 Z2Z2 Z1Z1 Z2Z2 Y11,54560,707 0,879 77,28 Y20,4544-0,7070,707-0,4760,47622,72100,00
  • Slide 27
  • Escores dos componentes principais Tratamentos Componentes principais Y1Y1 Y2Y2 122,16-12,32 222,04-13,12 320,25-13,90 419,20-12,24 520,85-12,96
  • Slide 28
  • Grfico de disperso Permite visualizar se os componentes principais (Y is ) so capazes de discriminar indivduos da populao ( ) utilizando caractersticas (X i ). 19 20 21 22 23 -14-13.5-13-12.5-12 Segundo componente (Y2) Primeiro componente (Y1)
  • Slide 29
  • Aula prtica com o programa computacional SAS Material didtico: http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm Disciplina: Anlise Multivariada Aplicada as Cincias Agrrias.Aula prtica: 14-17 com SAS.