modelo fatorial ortogonal x é linearmente dependente de poucas variáveis não-observáveis f 1, f...

51
MODELO FATORIAL ORTOGONAL . ) ( , ] [ que tal Seja px1 X Var X E X nearmente dependente de poucas variáveis não-observ , ..., F m , chamadas FATORES COMUNS e de tes adicionais de variação 1 , 2 , ..., p , chamad S ESPECÍFICOS. F L X F l F l F l X F l F l F l X F l F l F l X p m pm p p p p m m m m matricial, notação em ou, 2 2 1 1 2 2 2 22 1 21 2 2 1 1 2 12 1 11 1 1

Upload: internet

Post on 17-Apr-2015

109 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

MODELO FATORIAL ORTOGONAL

.)(,][ que tal Seja px1 XVarXEX

X é linearmente dependente de poucas variáveis não-observáveis F1 , F2 , ..., Fm , chamadas FATORES COMUNS e de

p fontes adicionais de variação 1 , 2 , ..., p , chamadas erros ou FATORES ESPECÍFICOS.

FLX

FlFlFlX

FlFlFlX

FlFlFlX

pmpmpppp

mm

mm

matricial, notação em ou,

2211

2222212122

1121211111

Page 2: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

MODELO FATORIAL ORTOGONAL: suposições adicionais

Assumimos que:

mp

pT

T

FCOV

ECOVE

IFFEFCOVFE

0),(

,,,diag][)(,0

,][)(,0

21

Essas suposições constituem o modelo de análise fatorial ortogonal (ANFAT).

Page 3: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

ESTRUTURA DE COVARIÂNCIA NO MODELO FATORIAL ORTOGONAL

)1(,...,2,1;,...,2,1,

ou ),()2(

),(

e)(

ou )()1(

2211

222

21

pmmkpjl),FCOV(X

LFXCOV

llllllXXCOV

lllXVar

LLXCOV

jkkj

rmjmrjrjsj

jjmjjj

T

Page 4: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

MODELO FATORIAL ORTOGONAL

COMUNALIDADE - porção da variância da j-ésima variável contribuída pelos m fatores comuns.

Variância Específica (uniquenesses) - porção de Var(Xj)=σjj devida ao fator específico.

pjh

lllXVar

jj

j

j

j

jmjjjjj

,...,2,1,

)(

2

específica a variânciésima-decomunalida ésima-

222

21

Page 5: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Métodos de Estimação – usando o R

Componentes Principais – usando a função prcomp (não exige suposições quanto à distribuição geradora das observações).

Máxima-verossimilhança –usando a função factanal (pressupõe normalidade).

Page 6: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Função de verossimilhança sob normalidade

Tp

Ti

n

ii

npn

TTi

n

ii

nnp

xxn

xxxx

xxnxxxxL

)()(2

exp||)2(

))((tr2

1exp||)2(

))(())((tr2

1exp||)2(),(

12

1

2

1

12

)1(

2

)1(

1

122

A f.v. depende de L e através de LLT+. O modelo ainda não está bem definido devido à multiplicidade de

escolhas para L. É desejável impor condição de unicidade:

LLT 1deve ser uma matriz diagonal.

Page 7: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Teste para a verificação do número de fatores

Sob o método da máxima-verossimilhança é possível realizar um teste para verificar o número m de fatores adequados ao modelo.

Trata-se de um teste assintótico usando a estatística da razão de verossimilhança com correção de Bartlett.

Page 8: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Teste para a verificação do número de fatores

definida positiva matriz outraqualquer : versus: 10 HLLH pppmT

mppp

Quando a matriz não apresenta qualquer estrutura especial, seu estima-dor de máxima-verossimilhança é dado pela matriz Sn=(n-1)S/n, tal que o máximo assumido pela verossimilhança é proporcional a

2/2/e npn

nS

Sob H0 , está restrita à forma TLL

Nesse caso o máximo da verossimilhança é dado por

nTT SLLnLL 1)ˆˆˆ(tr

2

1-exp|ˆˆˆ|

Page 9: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Teste para a verificação do número de fatores

Usando resultados apropriados, e chamando a estatística do teste da razão de verossimilhança, temos

||

|ˆ|lnln2

nSn

Bartlett mostrou que a aproximação de Qui-quadrado para a distribuição amostral de -2 ln pode ser melhoradapela inclusão de um fator de correção.

Page 10: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Teste para a verificação do número de fatores

Usando a correção de Bartlett, rejeitaremos a hipóstese nula se:

teste.esseaplicar poder a modo de ),1812(2

1

que segue positivo,ser que temliberdade de graus de número o Como

grandes. mentesuficiente e para

)1(||

|ˆ|ln]6/)542(1[ 2

2/)( 2

ppm

n-pn

Smpn

mpmpn

Page 11: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Exemplo: Medidas físicas

Voltemos a trabalhar com a base de dados referente a 8 medidas físicas de 305 meninas de 7 a 17 anos, tais como, altura, peso, tórax, ante-braço, braço, entre outras, no R: Harman23.cor.

Será que as relações entre essas 8 medidas podem ser explicadas por poucos fatores comuns subjacentes?

Page 12: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Exemplo: Medidas Físicas

height arm.span forearm lower.leg weight bitro.diameter chest.girth chest.width

height 1.00 0.85 0.81 0.86 0.47 0.40 0.30 0.38arm.span 0.85 1.00 0.88 0.83 0.38 0.33 0.28 0.41forearm 0.81 0.88 1.00 0.80 0.38 0.32 0.24 0.34lower.leg 0.86 0.83 0.80 1.00 0.44 0.33 0.33 0.36weight 0.47 0.38 0.38 0.44 1.00 0.76 0.73 0.63bitro.diameter 0.40 0.33 0.32 0.33 0.76 1.00 0.58 0.58chest.girth 0.30 0.28 0.24 0.33 0.73 0.58 1.00 0.54chest.width 0.38 0.41 0.34 0.36 0.63 0.58 0.54 1.00

data(Harman23.cor) no pacote stats.

Harman.FA=factanal(factors=4,covmat=Harman23.cor)

Page 13: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Exemplo: Medidas Físicas

Uniquenesses: height arm.span forearm lower.leg weight bitro.diameter chest.girth chest.width 0.137 0.005 0.191 0.116 0.138 0.283 0.178 0.488

Loadings: F1 F2 F3 F4height 0.879 0.277 -0.115 arm.span 0.937 0.194 0.277 forearm 0.875 0.191 lower.leg 0.887 0.209 0.135 -0.188 weight 0.246 0.882 0.111 -0.109 bitro.diameter 0.187 0.822 chest.girth 0.117 0.729 0.526 chest.width 0.263 0.644 0.141

F1 F2 F3 F4SS loadings 3.382 2.595 0.323 0.165Proportion Var 0.423 0.324 0.040 0.021Cumulative Var 0.423 0.747 0.787 0.808

Test of the hypothesis that 4 factors are sufficient.The chi square statistic is 4.63 on 2 degrees of freedom.The p-value is 0.0988

Page 14: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores Como já vimos, todas as cargas dos fatores obtidas a partir das

cargas iniciais por uma transformação ortogonal têm as mesmas propriedades em reproduzir a matriz de covariância (ou correlação).

Da álgebra matricial, sabemos que uma transformação ortogonal corresponde a uma rotação (ou reflexão) dos eixos coordenados.

Por esta razão, uma transformação ortogonal das cargas dos fatores, e a transformação conseqüente dos fatores, é chamada de rotação dos fatores.

Como as cargas originais dos fatores podem não ser facilmente interpretáveis, uma prática comum é rotacioná-las até que uma estrutura de cargas “mais simples” seja atingida.

Page 15: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores

O ideal é buscar por um padrão de cargas tal que cada variável tenha cargas altas em um único fator e tenha cargas pequenas ou moderadas nos demais fatores.

Porém nem sempre é possível chegar a essa estrutura simples.

Vamos nos concentrar em métodos analíticos e gráficos para a determinação de uma rotação ortogonal para uma estrutura mais simples.

Page 16: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores

Quando m=2 ou os fatores comuns são considerados dois de cada vez, a transformação para uma estrutura mais simples pode freqüentemente ser determinada graficamente. Os fatores comuns não correlacionados são olhados como vetores unitários no plano Cartesiano cujos eixos coordenados correspondem a cada um dos dois fatores. Um gráfico dos pares das cargas dos dois fatores produz p pontos, cada ponto correspondendo a uma variável

Os eixos coordenados podem, então, ser visualizados rotacionando-os de um ângulo .

pkll kk ,...,2,1),ˆ,ˆ( 21

Page 17: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores As novas cargas,

são determinadas pelas relações

horário-anti sentido no rotações para cossen

sen - cosQ

horário sentido no rotações para cossen -

sen cosQ

com

ˆ*ˆ

QLL

*jkl

Page 18: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores

Nesse caso, aglomerações de variáveis são freqüentemente aparentes a olho nu e essas aglomerações permitem-nos identificar os fatores comuns, sem ter que inspecionar as magnitudes das cargas.

Por outro lado, quando m>2, orientações não são facilmente visualizadas e as magnitudes das cargas rotacionadas devem ser verificadas para encontrar uma interpretação útil dos dados originais.

A escolha de uma matriz ortogonal Q que satisfaz uma medida analítica de estrutura simples será considerada.

Page 19: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores: método varimax

Kaiser (1953) sugeriu uma medida analítica de estrutura simples conhecida como critério varimax.

.~~1

maximiza que Q ortogonal ação transforma selecionavarimax

toprocedimen O des.comunalida das quadrada raiz pela corrigidos

rotação a após finais escoeficient os como ˆ

ˆ~ Defina

1 1

2

1

4

**

m

k

p

j

*jk

p

j

*jk

j

jkjk

/pllp

V

h

ll

Efetivamente, maximizar V corresponde a “espalhar” os quadrados dascargas de cada fator o máximo possível. Portanto, espera-se encontrargrupos de coeficientes grandes e coeficientes desprezíveis em qualquercoluna da matriz de cargas rotacionadas.

Page 20: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores: método varimax – usando o R.

No R a função factanal ajusta o modelo fatorial ortogonal usando máxima-verossimilhança e o critério de rotação varimax.

factanal(x, factors, data = NULL, covmat = NULL, n.obs = NA, subset, na.action, start = NULL, scores = c("none", "regression", "Bartlett"), rotation = "varimax", control = NULL, ...)

Argumentos x - Uma fórmula ou uma matriz de números. factors - O número de fatores a serem ajustados.

data - O conjunto de dados em análise, usado somente se x é uma fórmula.

Page 21: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores: método varimax – usando o R.

covmat - Uma matriz de covariância, ou uma lista de covariância como a saída de cov.wt. É claro que, matrizes de correlação são matrizes de covariância.

n.obs - O número de observações, usado se covmat é uma matriz de covariância.

subset - Uma especificação dos casos a serem usados, se x é usada como uma matriz ou fórmula.

na.action - A na.action a ser usada se x é usado como uma fórmula. (Lembre: que atitude tomar em caso de dados não disponíveis.)

start - NULL ou uma matriz de valores iniciais, cada coluna fornecendo um conjunto inicial de uniquenesses.

Page 22: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação de fatores: método varimax – usando o R. scores - Tipo de escores a serem produzidos, se necessários. O

default é none, "regression" fornece os escores pelo método da regressão e "Bartlett“, pelo método dos mínimos quadrados ponderados.

rotation - "none" ou o nome de uma função a ser usada para rotacionar os fatores: ela será chamada tendo como primeiro argumento a matriz de cargas, e deverá retornar uma lista com as cargas componentes fornecidas pelas cargas rotacionadas, ou apenas as cargas rotacionadas.

control - Uma lista de valores de controle: nstart – o número de valores iniciais a serem tentados se start = NULL. Default 1. trace (lógica T ou F). Vai querer todas as informações na saída? Default FALSE. lower O lomite inferior para uniquenesses durante a otimização. Tem que ser > 0. Default 0.005. opt Uma lista de valores de controle a serem passados como argumentos de controle ótimos. rotate - uma lista de argumentos adicionais para a função de rotação.

Page 23: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Loadings: Factor1 Factor2 Factor3 Factor4height 0.879 0.278 -0.115 arm.span 0.937 0.194 0.277 forearm 0.875 0.192 lower.leg 0.887 0.210 0.135 -0.188 weight 0.245 0.882 0.111 -0.109 bitro.diameter 0.186 0.823 chest.girth 0.117 0.729 0.526 chest.width 0.263 0.645 0.141

Factor1 Factor2 Factor3 Factor4SS loadings 3.380 2.597 0.323 0.165Proportion Var 0.422 0.325 0.040 0.021Cumulative Var 0.422 0.747 0.787 0.808

$rotmat [,1] [,2] [,3] [,4][1,] 9.999997e-01 7.025521e-04 8.918855e-05 1.075765e-05[2,] -7.025481e-04 9.999998e-01 -4.573375e-05 1.128348e-05[3,] -8.922036e-05 4.567138e-05 1.000000e+00 -2.699540e-05[4,] -1.075213e-05 -1.128980e-05 2.699495e-05 1.000000e+00

No R o defaul é fornecer as cargas do método varimax. Aseguir temos a saída da função Harman.FAV=varimax(Harman.FA$loadings), também disponível.

Page 24: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Análise dos resultados

Percebe-se que a matriz de rotação resultante é quase a identidade. De fato, o R apresenta as cargas do método varimax de rotação como default.

Ou seja, na saída ele já tenta facilitar a interpretação dos fatores.

Page 25: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Factor1 varimax Factor2 varimax Factor3 varimax Factor4 varimax

height 0,879 0,879 0,277 0,278 -0,115 -0,115

arm.span 0,937 0,937 0,194 0,194 0,277 0,277

forearm 0,875 0,875 0,191 0,192

lower.leg 0,887 0,887 0,209 0,21 0,135 0,135 -0,188 -0,188

weight 0,246 0,245 0,882 0,882 0,111 0,111 -0,109 -0,109

bitro.diameter 0,187 0,186 0,822 0,823

chest.girth 0,117 0,117 0,729 0,729 0,526 0,526

chest.width 0,263 0,263 0,644 0,645 0,141 0,141

Factor1 varimax Factor2 varimax Factor3 varimax Factor4 varimax

SS loadings 3.382 3.380 2.595 2.597 0,323 0,323 0,165 0,165

Proportion Var 0,423 0,422 0,324 0,325 0,04 0,04 0,021 0,021

Cumulative Var 0,423 0,422 0,747 0,747 0,787 0,787 0,808 0,808

As pequenas diferenças em valores devem se justificar por conta do método debusca da solução que é iterativo e envolve muitos arredondamentos.

Page 26: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação ortogonal

Existem outros métodos de rotação ortogonal.

Método quartimax – minimiza o número de fatores necessários para explicar uma variável.

Método equimax – é um compromisso entre os métodos varimax e quartimax.

O método varimax é o mais popular.

Page 27: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores: Rotações oblíquas Rotações ortogonais são apropriadas para um modelo fatorial no qual

os fatores são supostos não correlacionados. Muitos pesquisadores em Ciências Sociais porém consideram rotações oblíquas (não ortogonais), bem como, rotações ortogonais. As primeiras são sugeridas após olhar as cargas estimadas e não partir dos postulados básicos do modelo. Apesar disso, uma rotação oblíqua pode ser útil.

Se olhamos os m fatores comuns como eixos coordenados, o ponto com as coordenadas das cargas da j-ésima variável sobre os m fatores comuns representa a posição dessa variável no espaço fatorial.

Supondo que as variáveis são agrupadas em conglomerados não sobrepostos, uma rotação ortogonal para uma estrutura mais simples corresponde a uma rotação rígida dos eixos coordenados tal que os eixos, após a rotação, passam tão próximos dos conglomerados quanto possível.

Page 28: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores: Rotações oblíquas

Uma rotação oblíqua para simplificar a estrutura das cargas corresponde a uma rotação não rígida do sistema de coordenadas tal que os eixos rotacionados (não mais ortogonais dois a dois) passam (próximos) dos conglomerados.

Uma rotação oblíqua busca expressar cada variável em termos de um número mínimo de fatores, preferivelmente um único fator.

Page 29: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Rotação dos fatores: Rotações oblíquas

Para rotações oblíquas, o método mais popular é o método promax que tem a vantagem de ser rápido e conceitualmente simples.

O método busca ajustar uma matriz alvo que tem uma estrutura simples.

Como um exemplo, use o R para obter a rotação promax no exemplo com os dados Harman23.cor.

Page 30: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método promax: usando o R

Faça Harman.FAP=promax(Harman.FA$loadings) Também é possível via:Harman.FAP2=factanal(factors=4,covmat=Harman23.cor,rotation=“promax”)

Page 31: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Loadings:

  Factor1 Factor2 Factor3 Factor4

height 0,861 0,140    

arm.span 1,026 -0,130   0,385

forearm 0,918     0,177

lower.leg 0,898     -0,110

weight   0,912   -0,103

bitro.diameter   0,904    

chest.girth   0,560 0,553  

chest.width 0,127 0,566 0,167

  Factor1 Factor2 Factor3 Factor4

SS 3.463 2.321 0,344 0,232

Proportion 0,433 0,29 0,043 0,029

Cumulative 0,433 0,723 0,766 0,795

$rotmat        

  [,1] [,2] [,3] [,4]

[1,] 1,1002 -0,2408 -0,0576 0,1019

[2,] -0,3088 1,1093 -0,0018 -0,0157

[3,] 0,1450 -0,4160 1,0653 0,0105

[4,] 0,1740 -0,3600 0,0980 1,0558

Page 32: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

  Factor1 promax Factor2 promax Factor3 promax Factor4 promax

height 0,879 0,861 0,277 0,14     -0,115  

arm.span 0,937 1,026 0,194 -0,13     0,277 0,385

forearm 0,875 0,918 0,191         0,177

lower.leg 0,887 0,898 0,209   0,135   -0,188 -0,11

weight 0,246   0,882 0,912 0,111   -0,109 -0,103

bitro.diameter 0,187   0,822 0,904        

chest.girth 0,117   0,729 0,56 0,526 0,553    

chest.width 0,263 0,127 0,644 0,566   0,141 0,167

  Factor1 promax Factor2 promax Factor3 promax Factor4 promax

SS loadings 3.382 3.463 2.595 2.321 0,323 0,344 0,165 0,232

Proportion Var 0,423 0,433 0,324 0,29 0,04 0,043 0,021 0,029

Cumulative Var 0,423 0,433 0,747 0,723 0,787 0,766 0,808 0,795

Page 33: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Escores dos fatores

Na análise fatorial o interesse está geralmente centrado nos parâmetros do modelo fatorial.

Porém, os valores estimados dos fatores comuns, chamados escores dos fatores, podem também ser requeridos.

Essas quantidades são geralmente usadas para propósitos de diagnóstico bem como entradas para análises subsequentes.

Page 34: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Escores dos fatores

Escores dos fatores não são estimativas de parâmetros no sentido usual. Em vez disso, eles são estimativas dos valores não observados do vetor de fatores Fi, i=1,2,...,n.

Os escores iii

Fff por atingidos , de valoresdos estimativa ˆ

O problema de estimação aqui é mais complicado pelo fato das quantidades não observadas fi e i superarem em número os xi observados.

Page 35: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Escores dos fatores Para superar essa dificuldade, propõe-se algumas abordagens para

o problema de estimação dos valores dos fatores. Aqui vamos trabalhar com duas abordagens: Primeiro: “Tratar as cargas estimadas dos fatores e as variâncias

específicas estimadas como se fossem os valores verdadeiros dos parâmetros correspondentes”.

Segundo: “Incluir transformações lineares dos dados originais, talvez centradas ou padronizadas. Comumente, as cargas rotacionadas estimadas em vez das cargas estimadas são usadas para calcular os escores dos fatores. As fórmulas computacionais, que serão trabalhadas aqui, não mudam quando as cargas rotacionadas são substituídas por cargas não rotacionadas e não faremos diferença entre elas.

Page 36: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método dos mínimos quadrados ponderados

Suponha primeiro que o vetor de média μ, a matriz de cargas dos fatores L, e as variâncias específicas em são conhecidos para o modelo fatorialX- μ=LF+ .

Além disso, olhe os fatores específicos T=[1, 2, ..., p] como erros.

Como Var(j)=j, j=1,2,...,p, e não precisam ser iguais, Bartlett sugeriu usar mínimos quadrados ponderados para estimar os valores dos fatorescomuns.

A soma de quadrados dos erros ponderados pela recíproca de suas variâncias é:

)()( 1

1

12

fLxfLx Tp

j

T

j

j

Page 37: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método dos mínimos quadrados ponderados

Bartlett propôs escolher as estimativas de modo a minimizar a soma de quadrados dos erros ponderada pelas variâncias.

A solução é dada por: Motivados por essa expressão, tomamos as

estimativas como os verdadeiros valores e obtemos os escores dos fatores para o j-ésimo caso como

ff de ˆ

).()(ˆ 111 xLLLf TT

xL e,ˆ,ˆ

.,...,2,1),ˆ(ˆˆ)ˆˆˆ(ˆ 111 nixLLLf iTT

i

Page 38: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método dos mínimos quadrados ponderados

Quando as estimativas de L e são obtidas pelo método da máxima-verossimilhança, essas estimativas devem satisfazer a condição de unicidade: deve ser uma matriz diagonal.

Os escores dos fatores gerados por esse método têm vetor de médias nulo e covariâncias amostrais nulas.

Se as cargas rotacionadas são usadas no lugar das cargas originais, os escores dos fatores subseqüentes serão dados por:

ˆˆˆˆ 1LLT

nifQfi

T

i,...,2,1,ˆ*ˆ

Page 39: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Escores dos fatores obtidos por mínimos quadrados ponderados a partir das estimativas de máxima-verossimilhança

.ˆˆˆ e ),( com

,...,2,1,ˆ)ˆˆˆ(ˆ

,decomposta é correlação de matriz a se ou,

,...,2,1),(ˆ)ˆˆˆ(ˆ

2/1

111

111

zzTzii

izT

zzzT

zi

iTT

i

LLΡxxDz

nizLLLf

nixxLLLf

Page 40: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método de regressão

.ˆˆˆ e ),( com

,...,2,1,ˆˆ

,decomposta é correlação de matriz a se ou,

,...,2,1),(ˆˆ

2/1

1

1

zzTzii

iT

i

iT

i

LLΡxxDz

nizRLf

nixxSLf

Page 41: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Comparação dos dois métodos

Uma medida de concordância entre os escores dos fatores gerados pelos dois métodos é fornecida pelo coeficiente de correlação entre escores de um mesmo fator.

Entre os dois métodos apresentados, nenhum deles é recomendado como uniformemente superior.

Page 42: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Exemplo: Dados sobre porcentagens de empregados nos diferentes setores nos países europeus.

Como não dispomos dos dados originais do exemplo das medidas físicas, vamos trabalhar com outro conjunto de dados.

Trata-se da distribuição percentual de empregados por setor de atividade em países europeus.

Notação: AGR – agricultura, florestal e pesca, MIN – mineração e exploração de pedreiras, FAB – fabricação, FEA – fornecimento de energia e água, COM – construção, SER – serviços, FIN – finanças, SSP – serviços sociais e pessoais, TC – transportes e comunicações.

Page 43: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Exemplo: Dados sobre porcentagens de empregados nos diferentes setores nos países europeus.

Os dados estão em ftindústria.txt, os nomes dos países estão em paises.txt.

ft=read.table(http://im.ufrj.br/~flavia/mad484/ftindustria.txt, header=T) paises=read.table(“http://im.ufrj.br/~flavia/mad484/paises.txt") row.names(ft)=t(paises) ft.FACP=prcomp(ft, center = TRUE, scale = TRUE)

Page 44: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais
Page 45: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Quantos fatores considerar?

Pela análise da saída das componentes principais ficamos entre 3 (71%), 4 (83%) ou 5 (91%) fatores.

É possível ver que a primeira componente principal constrasta os setores agricultura e mineração com os demais setores.

round(ft.FACP$rotation[,1],digits=3) AGR MIN FAB FE COM SER FIN SSP TC 0.511 0.375 -0.246 -0.316 -0.222 -0.381 -0.131 -0.428 -0.205

Page 46: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Quantos fatores considerar?

Já a segunda componente principal contrasta principalmente Fabricação, Transportes e Comunicação com Serviços, Finanças e Construção.

round(ft.FACP$rotation[,2],digits=3) AGR MIN FAB FE CON SER FIN SSP TC 0.024 0.000 -0.432 -0.108 0.242 0.408 0.553 -0.054 -0.517

Page 47: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais
Page 48: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método da Máxima verossimilhança

R=cor(ft) ft.FAMV=factanal(factors=4,covmat=R) Uniquenesses: AGR MIN FAB FE COM SER FIN SSP TC 0.005 0.005 0.005 0.744 0.601 0.173 0.505 0.005 0.468

Factor1 Factor2 Factor3 Factor4 SS loadings 2.025 1.924 1.535 1.006 Proportion Var 0.225 0.214 0.171 0.112 Cumulative Var 0.225 0.439 0.609 0.721

The degrees of freedom for the model is 6 and the fit was 8.047

Page 49: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Método da máxima verossimilhança

Cargas Fator 1 Fator 2 Fator 3 Fator 4

AGR -0,807 -0,247 -0,528 0,056

MIN -0,094 -0,873 -0,096 -0,463

FAB 0,056 0,940 -0,079 -0,318

FEA 0,202 0,411 0,213 -0,028

COM 0,009 0,041 0,627 0,061

SER 0,218 0,150 0,779 0,387

FIN -0,013 -0,062 0,423 0,558

SSP 0,947 0,100 0,072 0,287

TC 0,613 0,089 -0,098 -0,372

Page 50: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Perspectivas e estratégias na Análise Fatorial

1. Realize uma análise fatorial via CP’s. Esse método é particularmente apropriado como um primeiro passo na análise dos dados. (Não é exigido que S ou R sejam não-singulares.)

(a) Investigue observações suspeitas construindo o gráfico de escores dos fatores. Também calcule os escores padronizados de cada observação e as distâncias quadradas.

(b) Tente uma rotação varimax.

2. Realize uma análise fatorial via máxima-verossimilhança incluindo rotação varimax.

Page 51: MODELO FATORIAL ORTOGONAL X é linearmente dependente de poucas variáveis não-observáveis F 1, F 2,..., F m, chamadas FATORES COMUNS e de p fontes adicionais

Perspectivas e estratégias na Análise Fatorial

3. Compare as soluções obtidas.

(a) Os grupos de cargas são semelhantes?

(b) Construa o gráfico dos escores dos fatores obtidos por CP’s versus os obtidos por máxima-verossimilhança.

4. Repita os primeiros três passos para outros números de fatores comuns m. Os fatores extras contribuem necessariamente para a compreensão e interpretação dos dados?

5. Para grandes conjuntos de dados, divida-os em duas metades e realize uma análise fatorial sobre cada parte. Compare as duas soluções entre si e com as soluções obtidas via conjunto de dados completo para verificar estabilidade da solução.