acp teoria&outputs _2014_ (1)

32
ANÁLISE DE COMPONENTES PRINCIPAIS ANÁLISE DE COMPONENTES PRINCIPAIS ISCTE-IUL Helena Carvalho, 2014 Apresentação dos principais conceitos; Interpretação de um exemplo e como reportar os resultados de uma ACP

Upload: joana-e-peixinho

Post on 05-Sep-2015

227 views

Category:

Documents


3 download

DESCRIPTION

SPSS

TRANSCRIPT

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    ANLISE DE COMPONENTES PRINCIPAIS

    I S C T E - I U L H e l e n a C a r v a l h o ,

    2 0 1 4

    Apresentao dos principais

    conceitos; Interpretao de um

    exemplo e como reportar os

    resultados de uma ACP

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 1

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 2

    A ANLISE FACTORIAL engloba um conjunto de mtodos de anlise quantitativa e

    multivariada, os quais permitem identificar a estrutura que subjaz matriz dos dados,

    tendo por base a anlise das inter-relaes entre as mltiplas variveis. O objectivo

    definir um conjunto de dimenses comuns os e que esto inerentes (i.e. FACTORES

    latentes) matriz dos dados.

    Com a Anlise Factorial possvel identificar as diferentes dimenses da estrutura e

    ainda, determinar em quanto cada uma das variveis originais explicada por essas

    dimenses (factores).

    Porque est em causa a anlise das correlaes entre as variveis a Anlise Factorial

    promove a anlise das interdependncias.

    A Anlise Factorial prev dois usos primrios:

    1. Sumariar: porque ao identificar os factores permite descrever os dados segundo

    um menor nmero de conceitos, face dimensionalidade da matriz original;

    2. Reduzir: porque permite calcular os scores para as novas dimenses (factores),

    substituindo os valores das variveis originais;

    Do ponto de vista terico-substantivo, relativamente problemtica em estudo, as

    variveis de input podem admitir uma partio em diversos subgrupos que reflectem

    diferentes dimenses analticas.

    A Anlise Factorial pode permitir por via da definio dos factores a identificao

    dessas dimenses. Trata-se assim de tornar medveis variveis latentes.

    A Anlise Factorial pode ser exploratria quando usada para procurar a estrutura que

    subjaz ao conjunto de variveis em anlise. Neste caso o investigador no tem hipteses

    de partida para testar. Quando efectivamente dispe de suporte terico sobre como

    devem estar agrupadas as variveis originais, bem como sobre o nmero de factores,

    ento deve desenvolver-se a ANLISE FACTORIAL CONFIRMATRIA.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 3

    ALGUNS REQUISITOS PARA REALIZAR UMA ANLISE FACTORIAL

    As variveis de input devem ser variveis mtricas (ou tratadas como tal, i.e., variveis

    em escala tipo likert).

    desejvel que as variveis de input apresentem algum nvel de multicolinearidade (i.e.

    correlaes entre si), na medida em que se pretende identificar conjuntos de variveis. A

    avaliao deste requisito pode ser feito atravs da anlise da matriz de correlaes, da

    estatstica Kaiser-Meyer-Olkin (KMO) e do Teste de Bartlett.

    Outro aspecto importante remete para a dimenso da amostra desejvel para a

    realizao de uma anlise factorial. A literatura faz diversas recomendaes e que

    apontam no sentido de garantir um nmero mnimo de observaes por referncia ao

    nmero de variveis. Algumas vo no sentido de se dispor de pelo menos cinco vezes

    mais casos relativamente ao nmero de variveis.

    ANLISE DA ADEQUABILIDADE DA MATRIZ DE INPUT ATRAVS DA

    ESTATSTICA DE KAISER-MEYER-OLKIN E DO TESTE DE BARTLETT

    Por defeito, o SPSS no apresenta estes resultados; caso se pretenda proceder sua

    interpretao necessrio activar a opo assinalada;

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 4

    1. ESTATSTICA DE KAISER-MEYER-OLKIN (KMO): esta estatstica quantifica o nvel de

    intercorrelaes entre as variveis:

    i j i j

    ijij

    i j

    ij

    ar

    r

    KMO22

    2

    legenda:

    ijr coeficiente de correlao observado entre as variveis i e j;

    ija coeficiente de correlao parcial1 entre as mesmas variveis i e j e que

    simultaneamente, uma estimativa das correlaes entre os factores (Elizabeth

    Reis, 1977:279). Atendendo a que as componentes so ortogonais ento esperar-

    se- que os ija sejam prximos de zero.

    Este ndice varia entre 0 e 1 e pode basear-se a sua interpretao nesta grelha:

    KMO ACP

    1 0,90 Muito Boa

    0,80 0,90 Boa

    0,70 0,80 Mdia

    0,60 0,70 Razovel

    0,50 0,60 M

    < 0,50 Inaceitvel

    in Elizabeth Reis (1997), Estatstica Multivariada, pg:279.

    Resultados do exemplo:

    KMO and Bart lett's Test

    ,692

    307,886

    55

    ,000

    Kaiser-Meyer-Olkin Measure of Sampling Adequacy.

    Approx. Chi-Square

    df

    Sig.

    Bartlett's Test of Sphericity

    1 A correlao parcial entre duas variveis Xi e Xj a correlao entre elas, estando controlada a correlao

    entre essas e as restantes variveis em anlise.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 5

    2. O TESTE DE ESFERICIDADE DE BARTLETT permite testar a hiptese da matriz de correlaes

    na populao ser uma matriz identidade. Nesse sentido interessar rejeitar Ho sob

    pena de no existirem correlaes significativas entre as variveis, pelo menos entre

    algumas variveis;

    R: como p

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 6

    ANLISE DE COMPONENTES PRINCIPAIS

    Numa perspectiva mais terico-matemtica tem-se ento que

    : a Anlise de Componentes Principais permite que a partir de m variveis originais

    correlacionadas entre si sejam definidas p novas variveis [com pm] no

    correlacionadas e que se designam por componentes principais (definindo

    variveis compsitas).

    Porqu p m?

    : considerem-se, por exemplo, trs variveis de input X1, X2 e X3 a partir das quais

    possvel definir trs componentes principais:

    Como o esquema explicita (e lendo no sentido esquerda/direita) cada varivel de input

    vai relacionar-se com cada uma das componentes principais, embora com diferentes

    coeficientes. E, por sua vez, (lendo agora no sentido direita/esquerda) cada componente

    principal vai estar relacionada com cada uma das variveis de input. Cada componente

    explica uma proporo da varincia de cada uma dessas variveis.

    X1 Cp

    1

    X2 Cp

    2

    X3 Cp

    3

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 7

    A ACP pretende definir uma combinao linear das trs variveis X1, X2 e X3 procurando

    extrair o mximo de varincia. Exemplificando as combinaes lineares para Cp1, Cp2 e

    Cp3:

    3312211111 X u X u X u Cp

    3322221122 X u X u X u Cp

    3332231133 X u X u X u Cp

    A matriz que identifica os coeficientes das variveis nas diferentes componentes a

    seguinte:

    321

    333231

    232221

    131211

    3

    2

    1

    C pC pC p

    uuu

    uuu

    uuu

    X

    X

    X

    A definio das componentes principais (em igual nmero relativamente ao nmero de

    variveis originais) obedece a duas restries:

    1. as componentes principais so perpendiculares (ortogonais);

    2. a 1componente tem associada a maior proporo de varincia das variveis

    originais, a 2 ter a maior proporo do que ainda falta e assim sucessivamente,

    at que com a ltima componente toda a varincia ser explicada.

    De notar que quando se realiza uma ACP com o objectivo

    : de identificar as dimenses inerentes s variveis de input;

    : ou de reduzir a multidimensionalidade do input no sentido de definir um novo

    conjunto de variveis (compsitas) de mais fcil operacionalizao;

    est em causa determinar um nmero inferior de componentes, ou seja, obter uma

    soluo do tipo p

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 8

    SELECO DAS COMPONENTES PRINCIPAIS2

    CRITRIOS DE EXTRACO

    1. CRITRIO DE KAISER seleco das componentes com valor prprio superior :

    unidade3 (ver quadro Variance Total Explained). So extradas as componentes com

    valores prprios superiores mdia. Cada componente deve assim contribuir para a

    varincia, pelo menos como se de uma varivel de input se tratasse. Como se poder

    observar no quadro Communalities, a varincia inicial de cada varivel 1 (a explicar

    oportunamente)

    2. : este critrio baseia-se na percentagem de CRITRIO DA PERCENTAGEM DE VARINCIA

    varincia acumulada pelas sucessivas componentes principais. Esse limiar depende

    em grande medida da natureza do fenmeno em anlise. Por exemplo, nas cincias

    naturais habitual considerarem-se um conjunto de componentes que expliquem

    pelo menos 95%, enquanto nas cincias sociais habitual j considerar satisfatria

    uma soluo que explique 60% de varincia total;

    3. : este critrio foi sugerido por Cattell (1966) e concretizado CRITRIO DO SCREE TEST

    a partir da representao grfica dos valores prprios Scree plot para as p

    componentes principais. a partir da forma da curva que se decide sobre o nmero

    de componentes a reter.

    A ideia que subjaz ao scree test consiste em tomar por referncia o ponto (assinalado

    na figura seguinte) a partir do qual a curva tenda a ficar paralela ao eixo das abcissas.

    Esse ponto corresponde ao nmero mximo de componentes a reter, pois, a partir

    da, elas deixam de ser significativas.

    2 Apesar de aqui estar em destaque o mtodo das Componentes Principais, importa referir que estes

    critrios de extraco so tambm extensveis ao mtodo da Anlise Factorial. 3 Este o critrio que o SPSS usa por defeito.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 9

    Scree Plot

    Component Number

    1110987654321

    Eig

    enva

    lue

    4,0

    3,5

    3,0

    2,5

    2,0

    1,5

    1,0

    ,5

    0,0

    Segundo Cattell in the use of the scree test the issue will arise whether the last non-

    trivial factor is that immediately beyond or at the end of the straight scree line

    (Cattell, 1966:250).

    Segundo a proposta de Cattell, neste exemplo reter-se-iam quatro componentes. a

    partir da 4 componente que a curva tende a ficar paralela. No obstante, convm

    referir que a interpretao deste critrio no consensual. Outros autores s retm as

    componentes at ao ponto em que em que a linda tende a ficar paralela e portanto,

    neste caso, apontariam para a extraco de trs componentes.

    Refira-se que normalmente o critrio do scree test sugere uma soluo com mais uma,

    duas ou mesmo trs componentes relativamente ao critrio de Kaiser.

    4. CRITRIO A PRIORI este critrio pode ser usado em situaes nas quais o investigador :

    sabe a priori quantas so as componentes a extrair e assim, poder indicar

    previamente o nmero desejado.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 10

    COMUNALIDADES E VALORES PRPRIOS

    A a varincia de cada varivel explicada por todas componentes COMUNALIDADE INICIAL

    principais. Numa Anlise de Componentes Principais sempre igual a 14, desde que a

    matriz de input para a ACP seja a matriz (R) de correlaes.

    Communalities

    1,000 ,802

    1,000 ,755

    1,000 ,467

    1,000 ,536

    1,000 ,526

    1,000 ,598

    1,000 ,526

    1,000 ,699

    1,000 ,402

    1,000 ,584

    1,000 ,701

    P5A L-se facilmente

    P5B Leitura agradvel

    P5C Assuntos/temas bem arrumados

    P5D Tem boa ilustrao (fotografias/desenhos)

    P5E A 1 pgina sugestiva

    P5F Formato adequado

    P5G Tamanho adequado (n pginas)

    P5H Periodicidade correcta

    P5I Papel de boa qualidade

    P5J Informao actualizada

    P5K Temas tratados de grande interesse

    Initial Extraction

    Extraction Method: Principal Component Analysis.

    A a varincia de cada varivel explicada pelas componentes COMUNALIDADE EXTRADA

    principais que integram a soluo em anlise.

    Como pode verificar-se, a partir do momento em que existe extraco das componentes

    principais (p

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 11

    seguinte. Quando as comunalidades so muito baixas pode admitir-se retirar as variveis

    nessas condies.

    Communalities

    1,000 ,802

    1,000 ,755

    1,000 ,467

    1,000 ,536

    1,000 ,526

    1,000 ,598

    1,000 ,526

    1,000 ,699

    1,000 ,402

    1,000 ,584

    1,000 ,701

    P5A L-se facilmente

    P5B Leitura agradvel

    P5C Assuntos/temas bem arrumados

    P5D Tem boa ilustrao (fotografias/desenhos)

    P5E A 1 pgina sugestiva

    P5F Formato adequado

    P5G Tamanho adequado (n pginas)

    P5H Periodicidade correcta

    P5I Papel de boa qualidade

    P5J Informao actualizada

    P5K Temas tratados de grande interesse

    Initial Extraction

    Extraction Method: Principal Component Analysis.

    O valor prprio (Total do quadro Variance Total Explained) corresponde varincia das

    variveis em anlise que explicada por cada uma das componentes principais.

    A percentagem de varincia explicada a percentagem de varincia explicada por cada

    componente, relativamente ao total da varincia de todas as variveis. As componentes

    principais so determinadas por ordem decrescente de importncia. Isto significa que a

    1 componente explica a percentagem de varincia mais elevada, a 2 explica o mximo

    do que ainda est por explicar e assim sucessivamente:

    pCPVarCPVarCPVar ...21

    sendo a soma dos valores prprios igual a m 1 [m = nmero de variveis originais e

    1=varincia unitria]. Este valor corresponde varincia total das variveis (estan-

    dardizadas).

    Varincia total = 11 variveis x 1 (varincia unitria)

    Baixas comunalidades

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 12

    QUADRO COM OS VALORES PRPRIOS EIGENVALUES DE CADA UMA DAS COMPONENTES, PERCENTAGEM DE VARINCIA TOTAL EXPLICADA POR CADA UMA DELAS E PERCENTAGEM DE

    VARINCIA ACUMULADA

    Trs fases

    Valores prprios

    Cp1 3,406

    Cp2 1,668

    Cp3 1,523

    Cp4 0,931

    Cp5 0,805

    Cp6 0,685

    Cp7 0,496

    Cp8 0,472

    Cp9 0,416

    Cp10 0,324

    Cp11 0,275

    11,000

    Total Variance Explained

    3,406 30,963 30,963 3,406 30,963 30,963 2,795 25,411 25,411

    1,668 15,165 46,128 1,668 15,165 46,128 2,073 18,843 44,253

    1,523 13,845 59,973 1,523 13,845 59,973 1,729 15,719 59,973

    ,931 8,461 68,434

    ,805 7,320 75,754

    ,685 6,227 81,981

    ,496 4,508 86,488

    ,472 4,288 90,776

    ,416 3,778 94,555

    ,324 2,947 97,501

    ,275 2,499 100,000

    Component

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    Total

    % of

    Variance

    Cumulative

    % Total

    % of

    Variance

    Cumulative

    % Total

    % of

    Variance

    Cumulative

    %

    Initial Eigenvalues

    Extraction Sums of Squared

    Loadings

    Rotation Sums of Squared

    Loadings

    Extraction Method: Principal Component Analysis.

    Nmero de componentes = ao nmero de variveis de input.

    As 11 componentes explicam em 100% a varincia total das 11 variveis de input.

    Opcional

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 13

    Um indcio da qualidade da anlise prende-se com a varincia explicada pelas primeiras

    componentes. Repare-se que as trs primeiras componentes s por si explicam cerca de

    60% da varincia total das variveis em anlise.

    A percentagem de varincia explicada por cada componente corresponde ao quociente

    entre cada valor prprio e a varincia total x 100, como se exemplifica para a Cp1:

    % 30,96310011

    3,406

    INTERPRETAO DAS COMPONENTES

    Para proceder interpretao das componentes necessrio ler a matriz das

    componentes Matrix Component. Em cada coluna esto dispostos os pesos factor

    loadings das variveis de input para cada uma das componentes extradas. Esses pesos

    medem as correlaes entre as componentes e as variveis originais estandardizadas5

    (Elizabeth Reis, 1997: 270).

    5 De notar que os loadings so iguais s correlaes somente quando:

    1) as variveis esto estandardizadas e

    2) as componentes so independentes (perpendiculares).

    Component Matrixa

    ,695 ,134 -,186

    .665 .166 -.237

    .628 .040 -.360

    .606 .334 -.347

    .588 .236 .007

    .581 -.193 -.303

    .573 -.442 .244

    .519 -.597 .269

    .445 -.569 .423

    .323 .500 .669

    .367 .539 .575

    Tem boa ilustrao (fotografias/desenhos)

    Tamanho adequado (n pginas)

    A 1 pgina sugestiva

    Formato adequado

    Papel de boa qualidade

    Assuntos/temas bem arrumados

    Informao actualizada

    Periodicidade correcta

    Temas tratados de grande interesse

    L-se facilmente

    Leitura agradvel

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.

    3 components extracted.a.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 14

    Para interpretar as componentes seleccionam-se para cada uma delas as variveis que

    apresentarem pesos mais elevados. QUANTO MAIS PERTO DE |1| MAIS FORTE A ASSOCIAO

    , ou seja, mais representativa a varivel nessa ENTRE CADA VARIVEL E A COMPONENTE

    componente.

    Em relao ao sinal dos pesos tem-se que:

    1. pesos >0 significam a existncia de uma associao positiva entre a varivel e a

    componente;

    2. pesos

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 15

    1. quanto maior a dimenso da amostra, menores podem ser os loadings a

    considerar como significativos;

    2. quanto maior o nmero de variveis em anlise, menores podem ser os loadings

    a considerar como significativos;

    3. quanto maior o nmero de componentes (factores), maiores devem ser os

    loadings, nos ltimas componentes, a considerar como significativos;

    RELAO ENTRE OS LOADINGS DA MATRIZ DAS COMPONENTES (FACTORES) E AS

    COMUNALIDADES E OS VALORES PRPRIOS

    Because factor loading is the correlation of the variable and the factor, the squared

    loading is the amount of the variables total variance accounted for by the factor (Hair,

    Anderson, Tatham e Black, 1998:111).

    Pode ento demonstrar-se que

    1. A soma dos quadrados dos pesos das componentes, para cada varivel soma em

    linha indica a PROPORO DE VARINCIA DE CADA VARIVEL QUE EXPLICADA PELAS

    COMPONENTES NA SOLUO. Esse valor corresponde COMUNALIDADE

    Exemplificando para a varivel Ter boa ilustrao

    0,5360,18637-0,1344770,694995 222

    2. Por sua vez, a soma dos quadrados dos pesos das variveis para cada componente

    soma em coluna corresponde VARINCIA DE CADA COMPONENTE, como se exemplifica

    no quadro seguinte para a componente 1:

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 16

    Variveis Loadings - aij -

    na Cp1 aij

    2

    Var 1 0,6950 0,4830

    Var 2 0,6653 0,4426

    Var 3 0,6284 0,3949

    Var 4 0,6055 0,3666

    Var 5 0,5882 0,3459

    Var 6 0,5811 0,3377

    Var 7 0,5731 0,3284

    Var 8 0,5189 0,2693

    Var 9 0,4451 0,1981

    Var 10 0,3233 0,1045

    Var 11 0,3672 0,1349

    3,4060

    MATRIZ DAS COMPONENTES APS A ROTAO

    Existem situaes nas quais a soluo extrada difcil de interpretar. Isto ocorre quando

    existe alguma ou algumas variveis com pesos relativamente elevados em mais de uma

    componente (como acontece no exemplo em anlise).

    Nesses casos possvel efectuar a rotao das componentes, com o objectivo de obter

    uma estrutura simplificada, facilitando a interpretao. A rotao pode reduzir algumas

    das ambiguidades detectadas na matriz das componentes.

    Existem mtodos de rotao ortogonal e mtodos de rotao oblquos sendo, no

    entanto, os primeiros os mais utilizados. Os mtodos de rotao ortogonal garantem que

    as componentes principais (e os factores) rodados permanecem independentes entre si,

    i.e., mantm-se no correlacionados, enquanto nos mtodos de rotao oblquos as

    componentes (factores) passam a estar correlacionados entre si.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 17

    ROTAO ORTOGONAL VERSUS ROTAO OBLQUA

    Um dos mtodos de rotao mais usado o VARIMAX, proposto por Kaiser. um

    mtodo ortogonal que se centra na simplificao das colunas da matriz. O objectivo

    definir uma soluo na qual cada varivel tenha um loading prximo de 1 ou de 1

    numa nica componente e os restantes sejam prximos de 0;

    Est subjacente a lgica de que a interpretao mais fcil quando a correlao varivel-

    componente est prxima de 1 ou de 1 indicando uma clara associao entre ambas,

    ou quando est prxima de 0 denotando uma ausncia de associao.

    A varincia total explicada pelas componentes extradas mantm-se inalterada aps a

    rotao, ainda que apresente uma nova distribuio pelas componentes. A rotao no

    afecta, obviamente, as comunalidades.

    Nos MTODOS OBLQUOS deixa de ser garantida a independncia entre as componentes,

    estas passam a estar correlacionadas. Como refere Elizabeth Reis permitido s

    componentes que rodem livremente de maneira a simplificarem o agrupamento das

    variveis e a interpretao das componentes (Elizabeth Reis, 1997: 277);

    A opo por um mtodo de rotao oblquo decorre fundamentalmente do problema

    em estudo.

    Componente 1

    Componente 2 Componente 2

    (depois da rotao)

    Componente 1 (depois da rotao)

    --------- rotao ortogonal

    ........... rotao oblqua

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 18

    MTODOS DE ROTAO DISPONVEIS NO SPSS

    MTODOS ORTOGONAIS:

    VARIMAX

    : An orthogonal rotation method that minimizes the number of variables that have

    high loadings on each factor. It simplifies the interpretation of the factors.

    [o mtodo Varimax centra-se na simplificao das colunas da matriz das componen-

    tes (ou factores)]

    QUARTIMAX

    : A rotation method that minimizes the number of factors needed to explain each

    variable. It simplifies the interpretation of the observed variables.

    [o mtodo Quartimax centra-se na simplificao das linhas da matriz das

    componentes (ou factores)]

    Equamax

    : A rotation method that is a combination of the varimax method, which simplifies

    the factors, and the quartimax method, which simplifies the variables. The number of

    variables that load highly on a factor and the number of factors needed to explain a

    variable are minimized.

    [mtodo pouco usado]

    MTODOS NO-ORTOGONAIS:

    Direct Oblimin

    : A method for oblique (nonorthogonal) rotation.

    Promax

    : An oblique rotation, which allows factors to be correlated. It can be calculated more

    quickly than a direct oblimin rotation, so it is useful for large datasets.

    Para o exemplo em anlise, observe-se a matriz das componentes aps a rotao

    ortogonal Rotated Component Matrix segundo o mtodo Varimax. Obteve-se de

    facto uma estrutura mais simplificada, na medida, em que cada varivel tende a ter um

    loading elevado numa nica componente.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 19

    Tomando por referncia o contedo temtico de cada uma das variveis pode ento

    ensaiar-se uma designao para cada uma das trs componentes. Ainda que no seja o

    caso, podem ocorrer situaes nas quais no seja possvel designar uma(s)

    componente(s) em particular. Nesse caso pode optar-se pela designao: indefinida. No

    entanto, quando sistematiza e descreve as componentes da soluo obtida deve fazer-

    lhe(s) referncia, embora no a(s) interprete.

    Quando se realiza uma ROTAO OBLQUA so disponibilizadas duas matrizes de loadings: a

    PATTERN MATRIX e a STRUCTURE MATRIX e a COMPONENT CORRELATION MATRIX. Para o exemplo

    em anlise ter-se-iam estas trs matrizes:

    Rotated Component Matrixa

    ,758 -,099 ,120

    ,711 ,128 -,064

    ,709 ,105 ,115

    ,699 ,165 ,142

    ,586 ,304 -,177

    ,536 ,118 ,317

    ,005 ,832 ,091

    ,139 ,824 -,019

    ,234 ,724 ,073

    ,041 ,073 ,892

    ,135 ,025 ,858

    Formato adequado

    A 1 pgina sugestiva

    Tamanho adequado (n pginas)

    Tem boa ilustrao (fotografias/desenhos)

    Assuntos/temas bem ar rumados

    Papel de boa qualidade

    Temas tratados de grande interesse

    Periodicidade correcta

    Informao actualizada

    L-se facilmente

    Leitura agradvel

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.

    Rotation Method: Varimax with Kaiser Normalization.

    Rotation converged in 5 iterations.a.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 20

    Os loadings desta matriz representam a contribuio nica de

    cada varivel para cada componente (factor). ESTA A MATRIZ QUE

    HABITUALMENTE USADA NA INTERPRETAO DAS COMPONENTES QUANDO SE

    . REALIZA UMA ROTAO OBLQUA

    Esta matriz mostra as correlaes simples entre as variveis e as

    componentes (factores). Estas correlaes (loadings) contm as

    correlaes variveis-componentes mas tambm as correlaes

    entre as componentes. Por esta razo a interpretao da Structure

    Matrix no muito simples.

    Pattern Matrixa

    ,793 ,208 ,059

    ,725 -,031 -,126

    ,713 -,008 ,055

    ,692 -,072 ,082

    ,576 -,230 -,232

    ,518 -,047 ,273

    -,122 -,857 ,080

    ,025 -,829 -,042

    ,133 -,713 ,043

    -,031 -,074 ,895

    ,077 -,010 ,853

    Formato adequado

    A 1 pgina sugestiva

    Tamanho adequado (n pginas)

    Tem boa ilustrao (fotografias/desenhos)

    Assuntos/temas bem arrumados

    Papel de boa qualidade

    Temas tratados de grande interesse

    Periodicidade correcta

    Informao actualizada

    L-se facilmente

    Leitura agradvel

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.

    Rotation Method: Oblimin with Kaiser Normalization.

    Rotation converged in 6 iterations.a.

    Structure Matrix

    ,745 -,012 ,171

    ,724 -,265 ,190

    ,723 -,206 ,163

    ,714 -,225 -,014

    ,604 -,379 -,135

    ,572 -,200 ,353

    ,246 -,835 -,005

    ,125 -,827 ,096

    ,335 -,751 ,093

    ,125 -,102 ,893

    ,209 -,066 ,865

    Formato adequado

    Tem boa ilustrao (fotografias/desenhos)

    Tamanho adequado (n pginas)

    A 1 pgina sugestiva

    Assuntos/temas bem arrumados

    Papel de boa qualidade

    Periodicidade correcta

    Temas tratados de grande interesse

    Informao actualizada

    L-se facilmente

    Leitura agradvel

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.

    Rotation Method: Oblimin with Kaiser Normalization.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 21

    a partir desta matriz que se pode concluir se as componentes esto ou no correlacionadas.

    Component Correlation Matrix

    1.000 -.274 .152

    -.274 1.000 -.041

    .152 -.041 1.000

    Component

    1

    2

    3

    1 2 3

    Extraction Method: Principal Component Analysis.

    Rotation Method: Oblimin with Kaiser Normalization.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 22

    COMO REPORTAR OS RESULTADOS DA ACP?

    Vai comear por se fazer alguma anlise prvia s variveis de input e depois

    sistematizar-se-o os principais resultados da ACP aplicada a essas variveis.

    Exemplo de Relatrio

    No sentido de avaliar as caractersticas dos jornais mais valorizadas pelos indivduos foi

    solicitado a uma amostra de 100 leitores que indicassem o seu grau de concordncia a

    propsito destes onze aspectos:

    L-se facilmente Leitura agradvel Assuntos/temas bem arrumados Tem boa ilustrao (fotografias/desenhos) A 1 pgina sugestiva Formato adequado Tamanho adequado (n pginas) Periodicidade correcta Papel de boa qualidade Informao actualizada Temas tratados de grande interesse

    Sugesto:

    Fazer uma anlise descritiva dos itens, designadamente no que se refere ao nvel

    de concordncia indicado pelos inquiridos, tomando por referncia a informao

    disponvel no Quadro 1.

    No suposto ler todos os resultados; devem destacar-se os mais relevantes.

    claro que a leitura substantivamente sustentada ser a mais interessante.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 23

    Quadro 1 Avaliao das diversas caractersticas dos jornais

    Outra sugesto:

    Interpretao dos nveis de concordncia em funo de medidas de sntese como

    sejam a mdia o desvio-padro. Recorde-se que se est a admitir tratar estas

    escalas como variveis quantitativas;

    Poder acrescentar-se por exemplo a representao grfica das mdias.

    Quadro 2 Nvel de concordncia com as caractersticas dos jornais

    Itens Mdia Desvio-padro

    L-se facilmente 3.43 1.037

    Leitura agradvel 3.65 0.968

    Assuntos/temas bem arrumados 4.13 0.800

    Tem boa ilustrao (fotografias/desenhos) 4.41 0.805

    A 1 pgina sugestiva 3.85 0.989

    Formato adequado 4.12 0.902

    Tamanho adequado (n pginas) 4.04 0.852

    Periodicidade correcta 4.36 0.759

    Papel de boa qualidade 4.40 0.995

    Informao actualizada 4.18 0.821

    Temas tratados de grande interesse 3.87 1.143

    2 2.0 17 17 35 35.0 28 28.0 18 18.0 100 100.0

    4 4.0 7 7.0 25 25.0 48 48.0 16 16.0 100 100.0

    1 1.0 2 2.0 14 14.0 49 49.0 34 34.0 100 100.0

    1 1.0 0 .0 14 14.0 27 27.0 58 58.0 100 100.0

    1 1.0 8 8.0 27 27.0 33 33.0 31 31.0 100 100.0

    0 .0 4 4.0 23 23.0 30 30.0 43 43.0 100 100.0

    1 1.0 4 4.0 16 16.0 48 48.0 31 31.0 100 100.0

    0 .0 1 1.0 14 14.0 33 33.0 52 52.0 100 100.0

    3 3.0 3 3.0 10 10.0 19 19.0 65 65.0 100 100.0

    0 .0 1 1.0 23 23.0 33 33.0 43 43.0 100 100.0

    4 4.0 9 9.0 21 21.0 28 28.0 38 38.0 100 100.0

    L-se facilmente

    Leitura agradvel

    Assuntos/temas bem arrumados

    Tem boa ilustrao (fotografias/desenhos)

    A 1 pgina sugestiva

    Formato adequado

    Tamanho adequado (n pginas)

    Periodicidade correcta

    Papel de boa qualidade

    Informao actualizada

    Temas tratados de grande interesse

    N %

    Discordo

    completamente

    N %

    Discordo

    N %

    Nao concordo

    nem discordo

    N %

    Concordo

    N %

    Concordo

    completamente

    N %

    Total

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 24

    Figura 1 Nvel de concordncia com as caractersticas dos jornais

    Sugesto de interpretao posterior

    Aps diagnosticada a avaliao feita pelos leitores da amostra, a propsito das diversas

    caractersticas dos jornais, vai proceder-se a uma anlise de interdependncia entre elas.

    O objectivo identificar as diferentes dimenses, susceptveis de agregar as

    caractersticas dos jornais.

    Da realizao de uma Anlise em Componentes Principais cujos resultados indicam

    uma adequabilidade razovel/mdia (KMO=0,692)6 foram extradas trs componentes

    que combinam os diferentes aspectos avaliados pelos indivduos, e que explicam cerca

    de 60% da varincia global.

    6 Para informao mais detalhada consultar Anexo (pg..) Exemplo de referncia ao Anexo do Relatrio.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 25

    No Quadro 3 podem identificar-se os itens que mais contribuem para cada uma das trs

    componentes extradas:

    Quadro 3 Avaliao dos jornais: identificao de dimenses

    (Anlise de Componentes Principais com rotao Varimax)

    Itens Componentes

    Imagem Contedos Leitura

    Formato adequado 0,758 -0,099 0,120

    A 1 pgina sugestiva 0,711 0,128 -0,064

    Tamanho adequado (n pginas) 0,709 0,105 0,115

    Tem boa ilustrao (fotografias/desenhos) 0,699 0,165 0,142

    Assuntos/temas bem arrumados 0,586 0,304 -0,177

    Papel de boa qualidade 0,536 0,118 0,317

    Temas tratados de grande interesse 0,005 0,832 0,091

    Periodicidade correcta 0,139 0,824 -0,019

    Informao actualizada 0,234 0,724 0,073

    L-se facilmente 0,041 0,073 0,892

    Leitura agradvel 0,135 0,025 0,858

    Varincia explicada 25,41% 18,84% 15,72%

    Varincia total explicada 59,97

    Em funo dos itens com peso preponderante em cada uma das trs componentes

    (valores assinalados no Quadro 3), pode ento admitir-se a definio de trs dimenses

    tematicamente distintas: imagem, contedos e leitura e de confirmada consistncia

    (com alphas de 0,77, 0,73 e 0,78 respectivamente).

    Outra sugesto:

    Cruzamento das componentes com outros indicadores.

    Isso pressupe a definio das componentes enquanto novas variveis. Explica-o disponvel neste documento nas pgs. 27 a 31)

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 26

    Sugesto de interpretao posterior

    Verifica-se que as dimenses imagem e contedos so as que os indivduos parecem

    valorizar mais, j que assumem nveis mdios de concordncia mais elevados (Quadro 4)

    e tambm as que expressam opinies mais consensuais dado registarem os desvios-

    padro mais baixos.

    Quadro 4 Nvel mdio de concordncia com as dimenses de avaliao dos jornais segundo a

    idade dos leitores

    Veja-se tambm a relao entre o semanrio preferido pelos leitores inquiridos e o nvel

    de concordncia atribudo a cada uma das trs dimenses (Figura 2).

    Figura 2 Nvel mdio de concordncia com as dimenses de avaliao dos jornais

    em funo do Semanrio preferido

    4,2 ,64 4,0 ,83 3,5 1,00

    4,3 ,57 4,1 ,77 3,5 ,92

    3,8 ,74 4,1 ,51 3,6 ,71

    4,3 ,52 4,3 ,81 3,4 1,01

    4,2 ,63 4,1 ,75 3,5 ,92

    25-29

    30-34

    35-39

    40-50

    Total

    Idade

    Mdia Desvio-padro

    Nvel concordncia atribudo

    Imagem

    Mdia Desvio-padro

    Nvel concordncia atribudo

    a Contedos

    Mdia Desvio-padro

    Nvel concordncia atribudo

    Leitura

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 27

    DEFINIO DAS COMPONENTES ENQUANTO NOVAS VARIVEIS

    A) VIA SCORES FACTORIAIS

    possvel determinar para cada indivduo um score factorial para cada uma das

    componentes extradas. Para o clculo dos scores factoriais so usadas:

    a) as respostas dadas pelos indivduos s variveis originais (estandardizadas);

    b) e os coeficientes que ponderam cada uma dessas variveis. Esses coeficientes

    esto sistematizados na matriz COMPONENT SCORE COEFFICIENT MATRIX.

    Refira-se que esta matriz s apresentada pelo SPSS quando solicitada

    E assim definem-se as componentes

    enquanto novas variveis

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 28

    Esta a matriz dos coeficientes para o exemplo em anlise. Refira-se que os coeficientes

    mais elevados correspondem aos pesos tambm mais elevados na matriz das

    componentes (neste caso, aps rotao7).

    Como as variveis esto estandardizadas os scores factoriais sero valores tambm

    estandardizados.

    Tendo em conta a forma como so determinados os scores factoriais, ter-se- ento que

    Valores elevados nas variveis (originais) com pesos elevados numa

    certa componente resultam em scores factoriais elevados.

    Exemplo do clculo do score factorial de um indivduo na Cp1:

    1110987654321 121,0011,0174,0055,0265,0313,0280,0250,0214,0028,0076,0 ZZZZZZZZZZZ

    NOTA: CADA ZI CORRESPONDE A CADA VARIVEL XI ESTANDARDIZADA.

    7 Compare-se os loadings assinalados na matriz da pg. 19 com os coeficientes aqui assinalados.

    Component Score Coefficient Matrix

    -,076 ,011 ,535

    -,028 -,027 ,507

    ,214 ,086 -,169

    ,250 -,012 ,017

    ,280 -,028 -,108

    ,313 -,160 ,005

    ,265 -,044 ,001

    -,055 ,422 -,045

    ,174 -,019 ,139

    -,011 ,352 ,004

    -,121 ,442 ,034

    L-se facilmente

    Leitura agradvel

    Assuntos/temas bem arrumados

    Tem boa ilustrao (fotografias/desenhos)

    A 1 pgina sugestiva

    Formato adequado

    Tamanho adequado (n pginas)

    Periodicidade correcta

    Papel de boa qualidade

    Informao actualizada

    Temas tratados de grande interesse

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.

    Rotation Method: Var imax with Kaiser Normalization.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 29

    B) VIA NDICES (SUMMATED SCALES)

    Relativamente definio das componentes enquanto novas variveis ainda possvel

    usar uma outra alternativa e que consiste em definir NDICES (summated scales). Estas

    definem-se combinando diversas variveis originais.

    Para cada uma dessas novas variveis compsitas so seleccionadas as variveis com

    pesos mais elevados para cada componente e, habitualmente, a nova varivel uma

    mdia das variveis originais, como se exemplifica (via SPSS) para, por exemplo, a

    componente 1:

    Estas so as variveis com loadings mais elevados na componente 1, como evidencia a matriz das componentes aps a rotao

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 30

    Quando se pretende definir por este processo as novas variveis compsitas

    importante analisar a consistncia de cada uma delas, no sentido de aferir se os

    diferentes itens ou indicadores medem o mesmo constructo. Para esse efeito calcula-se

    um COEFICIENTE DE RELIABILIDADE (exemplo, Alpha de Cronbach).

    Se os itens tiverem escalas diferentes ento necessrio calcular o alpha com os itens estandardizados. Para esse efeito escolhe-se a opo assinalada. Veja-se o resultado.

  • ANLISE DE COMPONENTES PRINCIPAIS 2014

    Helena Carvalho, ISCTE-IUL 2014 Pgina | 31

    O quadro seguinte apresenta o valor do alpha considerando os 6 itens:

    Os valores assinalados a negrito no 2 quadro permitem perceber qual ser o alpha admitindo

    que se retiraria cada um dos itens (de per si).

    Se o valor de alpha diminuir com a retirada de algum dos itens ento isso significa que a

    consistncia diminui, logo o item em questo importante para melhorar a consistncia do

    ndice que se pretende construir.

    Neste exemplo qualquer que seja o item que se retirasse o resultado seria sempre o mesmo:

    diminuiria sempre a consistncia.

    Concluso: todos os itens so de reter para a nova varivel compsita.

    Reliability Statistics

    .768 .772 6

    Cronbach's

    Alpha

    Cronbach's Alpha

    Based on Standardized

    Items N of Items