anÁlise das correspondÊncias mÚltiplas · marketing – estudos para o lançamento de novos...

15
CVRM – Centro de Geosistemas do IST, 1989-2002 6.1 ANÁLISE DAS CORRESPONDÊNCIAS MÚLTIPLAS MANUAL DO MÓDULO AFCM (Versão 7.10) OBJECTIVO: A ANÁLISE FACTORIAL DAS CORRESPONDÊNCIAS é uma técnica estatística multivariada, no domínio da Análise Factorial, que permite a visualização e redução de dados contidos em tabelas de grandes dimensões, cruzando um certo número de indivíduos com as variáveis qualitativas que os caracterizam. A Análise Factorial das Correspondências é aplicável a tabelas de input constituídas por números positivos ou nulos e permite encontrar os factores que melhor explicam as similitudes e oposições entre indivíduos e variáveis. Esses factores, hierarquizados por ordem decrescente da sua importância para a explicação da tabela de partida, constituem um sistema de eixos ortogonais onde é possível visualizar, sob a forma gráfica, as projecções dos constituintes da matriz de dados. A interpretação dos gráficos é efectuada com base num conjunto de regras simples e claras, evidenciando as relações mais significativas existentes nas tabelas de input . Habitualmente distingue-se duas variantes da Análise Factorial das Correspondências: Binárias e Múltiplas. A Análise Factorial das Correspondências Binárias (módulo ACOR, descrito no capítulo 3) utiliza-se principalmente quando se pretende tratar tabelas de contingência ou tabelas em que um conjunto de indivíduos é caracterizado por um conjunto de variáveis que tomam valores reais positivos e homogéneos. A Análise Factorial das Correspondências Múltiplas (módulo AFCM, descrito neste capítulo) aplica-se preferencialmente a tabelas de indivíduos caracterizados por variáveis qualitativas e quantitativas, após recodificação apropriada numa tabela disjuntiva completa ou num quadro de Burt 1 . APLICAÇÕES A Análise Factorial das Correspondências é aplicável a tabelas contendo valores numéricos referentes a distintos domínios do conhecimento, tanto na fase de 1 Esta distinção entre Análise de Correspondências Binárias e Múltiplas é introduzida aqui por razões operacionais, que não têm expressão algorítmica. De facto, se após recodificação de um quadro de dados de variáveis quantitativas e qualitativas, submetermos o quadro disjuntivo completo (ou de Burt) ao módulo ACOR os resultados são análogos aos que se obtêm executando o módulo AFCM directamente sobre os dados originais.

Upload: phungdang

Post on 10-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

CVRM – Centro de Geosistemas do IST, 1989-2002 6.1

ANÁLISE DAS CORRESPONDÊNCIAS MÚLTIPLAS

MANUAL DO MÓDULO AFCM(Versão 7.10)

OBJECTIVO:

A ANÁLISE FACTORIAL DAS CORRESPONDÊNCIAS é uma técnica estatísticamultivariada, no domínio da Análise Factorial, que permite a visualização e reduçãode dados contidos em tabelas de grandes dimensões, cruzando um certo número deindivíduos com as variáveis qualitativas que os caracterizam.

A Análise Factorial das Correspondências é aplicável a tabelas de input constituídaspor números positivos ou nulos e permite encontrar os factores que melhor explicamas similitudes e oposições entre indivíduos e variáveis. Esses factores, hierarquizadospor ordem decrescente da sua importância para a explicação da tabela de partida,constituem um sistema de eixos ortogonais onde é possível visualizar, sob a formagráfica, as projecções dos constituintes da matriz de dados. A interpretação dosgráficos é efectuada com base num conjunto de regras simples e claras, evidenciandoas relações mais significativas existentes nas tabelas de input.

Habitualmente distingue-se duas variantes da Análise Factorial das Correspondências:Binárias e Múltiplas.

A Análise Factorial das Correspondências Binárias (módulo ACOR, descrito nocapítulo 3) utiliza-se principalmente quando se pretende tratar tabelas de contingênciaou tabelas em que um conjunto de indivíduos é caracterizado por um conjunto devariáveis que tomam valores reais positivos e homogéneos. A Análise Factorial dasCorrespondências Múltiplas (módulo AFCM, descrito neste capítulo) aplica-sepreferencialmente a tabelas de indivíduos caracterizados por variáveis qualitativas equantitativas, após recodificação apropriada numa tabela disjuntiva completa ou numquadro de Burt1.

APLICAÇÕES

A Análise Factorial das Correspondências é aplicável a tabelas contendo valoresnuméricos referentes a distintos domínios do conhecimento, tanto na fase de

1 Esta distinção entre Análise de Correspondências Binárias e Múltiplas é introduzida aqui por razõesoperacionais, que não têm expressão algorítmica. De facto, se após recodificação de um quadro dedados de variáveis quantitativas e qualitativas, submetermos o quadro disjuntivo completo (ou de Burt)ao módulo ACOR os resultados são análogos aos que se obtêm executando o módulo AFCMdirectamente sobre os dados originais.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.2

Investigação & Desenvolvimento, como na fase de tratamento de rotina dos elementosestatísticos existentes em diferentes Empresas e Instituições que manipulem grandequantidade de informação.

Apresentam-se seguidamente alguns domínios em que a Análise Factorial dasCorrespondências tem sido aplicada:

PSICOLOGIA – escalas de atitudes, orientação escolar

SOCIOLOGIA – tratamento de inquéritos

MEDICINA – investigação clínica, epidemologia, estatística médica

HISTÓRIA – arqueologia, demografia, dados económicos e sociais

GEOGRAFIA – caracterização de unidades espacialmente localizadas

ENGENHARIA – análise exploratória de dados para o estabelecimento de modelos

BIOLOGIA – tipologia de espécies

CIÊNCIAS DO AMBIENTE – dispersão de poluentes no espaço e no tempo

ECONOMIA – quadros de input / output, séries cronológicas, análise de cotações

LINGUÍSTICA – lexicologia, gramáticas comparadas

ESTUDOS DE MERCADO – apuramento de resultados de entrevistas

MANAGEMENT – síntese de dados estatísticos como sistema de apoio à decisão

MARKETING – estudos para o lançamento de novos produtos

CIÊNCIAS DO DESPORTO – análise estatística de performances

VANTAGENS

As grandes massas de dados de que se dispõe são apresentadas por histogramas,tabelas de percentagens, gráficos de correlação. Estas formas de apresentação nãopermitem, em geral, visualizar de uma forma imediata as relações entre osconstituintes da tabela de dados. Só através de um método estatístico de síntese, épossível extrair das tabelas a informação essencial, explicitando o sistema deinterdependências entre as variáveis e os objectos e minimizando simultaneamente aredundância e o ruído.

Quanto aos outros métodos factoriais a Análise Factorial das Correspondênciasapresenta a vantagem de poder tratar qualquer tipo de quadro de input contendonúmeros positivos, sendo especialmente concebido para tabelas de contingência,resultantes de contagens.

EXECUÇÃO

Uma vez lido o ficheiro de dados, cuja estrutura é a referida na página 1.2, paraexecutar o algoritmo de Análise Factorial das Correspondências Múltiplas,selecciona-se a opção Análise das Correspondências Múltiplas na janela principal doprograma ANDAD (Figura 6.1) ou clica-se no ícone correspondente presente na barrade utilitários.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.3

Figura 6.1 – Execução da Análise Factorial das Correspondências Múltiplas

Desencadeada a execução do módulo, são pedidos os valores dos diversos parâmetrosde controlo da Análise Factorial das Correspondências Múltiplas, através do sistemade janelas do programa. Em primeiro lugar deve-se seleccionar, na janelarepresentada na figura 6.2, as colunas que se pretende estudar. Esta selecção dascolunas (activas e suplementares) e dos restantes parâmetros - número de linhas(activas e suplementares) e número de factores – podem ser obtidos através de umficheiro de configuração (extensão ACFG) gravado anteriormente numa das janelasseguintes.

Figura 6.2 – Selecção das colunas para submeter à Análise Factorial das Correspondências Múltiplas

A informação sobre as linhas e colunas do quadro de dados e sobre os resultados aproduzir no relatório deverá ser dada a partir dos botões da janela principalapresentada na figura 5.3. As linhas podem ser identificadas pelo respectivo

CVRM – Centro de Geosistemas do IST, 1989-2002 6.4

identificador (opção de defeito) ou pode-se seleccionar uma variável qualitativa.Nesta janela pode-se também gravar, como referido no parágrafo anterior, umficheiro de configuração, com os parâmetros utilizados.

Figura 6.3 – Janela principal da Análise Factorial das Correspondências Múltiplas

A opção <Linhas> permite apenas verificar o número de linhas (indivíduos) doquadro de dados.

Figura 6.4 – Janela para definição das colunas do quadro de dados.

Na janela da figura 6.4 apresenta-se a informação que é necessário introduzir sobre ascolunas do quadro de dados. A opção <Divisão em Classes> permite seleccionar onúmero de classes em que as variáveis quantitativas serão divididas e o critério autilizar para as classes (igual frequência, igual amplitude ou introdução dos limites)como se pode ver na Figura 6.5. Um duplo click sobre a variável permite aceder àjanela de definição das modalidades de cada variável (Figura 6.6).

CVRM – Centro de Geosistemas do IST, 1989-2002 6.5

Figura 6.5 – Janela para definição do número de classes em que cada variável quantitativa serádividida.

Na janela da figura 6.6, que pode também ser acedida em sequência para todas asvariáveis através da opção <Informação Variáveis>, são fornecidos ou alterados osidentificadores das variáveis 2 (4 caracteres), os identificadores de cada uma dasmodalidades2 (no caso das variáveis quantitativas correspondem às classes) e osvalores tomados pelas modalidades, que devem ser números inteiros compreendidosno intervalo [0, 99]. No caso das variáveis quantitativas os valores das modalidadessão dados pelo número de ordem das classes. Por exemplo, se uma variável foidividida em 3 classes, o valor das modalidades (3) é 1, 2 e 3.

Figura 6.6 – Janela para indrodução da informação sobre as modalidades das várias variáveis(quantitativas, após recodificação, e qualitativas).

2 Esta alteração dos identificadores das linhas e das colunas é apenas local, não influenciando outrasanálises.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.6

Na figura 6.7 apresenta-se a janela onde se deve introduzir informação sobre osresultados do programa. Assim pode-se pedir para incluir no relatório cópia dos dadose alguns gráficos com a projecção das colunas e das linhas nos principais eixosfactoriais. Pode-se também seleccionar o número de factores.

Figura 6.7 – Janela para definição de alguns resultados da AFCM.

O número de factores pretendidos tem que ser igual ou menor que a menor dimensãoda matriz de dados. O número máximo de factores é dado pela diferença entre amenor dimensão da matriz de dados e o número de constrangimentos (no caso dequadros com q variáveis, recodificadas numa tabela disjuntiva completa ou quadro deBurt, há q constrangimentos, etc.)

Após execução do programa, obtém-se, no directório onde está localizado o ficheirode dados, 3 novos ficheiros cujas designações são a do ficheiro de dados com asextensões VPC, LIC e COC e que contêm respectivamente os valores próprios e ascoordenadas das linhas e das colunas nos eixos pedidos (exemplo: se o ficheiro dedados se chamar exemplo.dat, o programa cria os ficheiros exemplo.vpc, exemplo.lic eexemplo.coc). Estes ficheiros podem ser processados por um programa de gráficos(HARVARD GRAPHICS, EXCEL) de modo a projectar as amostras e as variáveisnos principais planos factoriais.

EXEMPLO DE APLICAÇÃO

Considere-se o quadro de dados constituído pelo número absoluto de votos obtidopelos 5 principais partidos (PCP, PS, PSD CDS e PRD) nas eleições legislativas de1987 nos 18 distritos do continente e por um código que indica se o distrito se localizana zona norte ou na zona sul do país. A matriz de dados foi introduzida utilizando umeditor de texto, criando-se um ficheiro designado ELEICOES1.DAT (ver figura 6.8).A Análise Factorial das Correspondências Múltiplas é uma técnica apropriada paratratar quadros deste tipo que contêm simultaneamente variáveis quantitativas equalitativas. As variáveis quantitativas devem ser recodificadas em classes.

PCP PS PSD CDS PRD N/S

CVRM – Centro de Geosistemas do IST, 1989-2002 6.7

-------------------------------------------------------------------------------AVE 15832.00 82230.00 215623.00 18981.00 9517.00 1.00BEJ 39581.00 20730.00 25098.00 2037.00 5869.00 2.00BRA 24600.00 103935.00 214141.00 23737.00 13407.00 1.00BRG 3026.00 17757.00 56413.00 7003.00 1188.00 1.00CBR 9757.00 30848.00 71794.00 6425.00 8189.00 1.00COB 17367.00 69962.00 121640.00 10988.00 8412.00 1.00EVR 39750.00 17002.00 35294.00 2314.00 8474.00 2.00FAR 20734.00 47401.00 88676.00 5901.00 11887.00 2.00GUA 3879.00 25493.00 70069.00 7603.00 2366.00 1.00LEI 14311.00 45270.00 146831.00 14600.00 7569.00 1.00LIS 202917.00 261079.00 563845.00 45419.00 84509.00 2.00PTG 18052.00 21911.00 32520.00 2657.00 5515.00 2.00POR 87341.00 249451.00 475591.00 36999.00 37570.00 1.00SAT 33740.00 57947.00 127870.00 9572.00 19592.00 2.00SET 128973.00 69406.00 128334.00 7411.00 34132.00 2.00VCA 8737.00 28339.00 76107.00 10751.00 6751.00 1.00VIR 5545.00 27542.00 85303.00 6759.00 1838.00 1.00VIS 6538.00 40705.00 144148.00 15662.00 3921.00 1.00-------------------------------------------------------------------------------

PCP PS PSD CDS PRD S/N

Figura 6.8 - Quadro dos dados de partida (5 variáveis quantitativas e 1 qualitativa)

Nas figuras 6.2 a 6.7 apresenta-se os valores dos parâmetros utilizados para executar oprograma AFCM. O número de linhas coincide com o número de distritos e o númerototal de variáveis quantitativas é igual ao número de partidos considerados enquantoexiste apenas 1 variável qualitativa que tem 2 modalidades possíveis (norte e sul dopaís); para recodificar as variáveis quantitativas (votações em cada um dos partidos)usaram-se 3 classes: resultados fracos, baixos e altos, no caso mantendo a mesmaproporção; seleccionaram-se 8 factores, introduziram-se os identificadores dascolunas, pediu-se para criar ficheiro com coordenadas (ficheiro para gráficos).

Após execução do AFCM, o módulo apresenta a janela representada na figura 6.9onde se podem seleccionar os resultados fornecidos pelo programa: informação sobreos eixos factoriais (figura 6.10), o scree plot (figura 6.11), as coordenadas das colunas(figura 6.12) e das linhas nos eixos factoriais, as contribuições absolutas das linhas edas colunas, as contribuições relativas das colunas e das linhas e os gráficos factoriaisdas colunas e das linhas.

Figura 6.9 – Janela de resultados da AFCM.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.8

A análise da figura 6.10 mostra que 2 eixos explicam cerca de 71% da variabilidadetotal presente no quadro de dados. Pode-se assim diminuir a dimensão do problema de17 para 2 dimensões, sem perda significativa de informação (≈29% apenas).

Figura 6.10 – Informação sobre os eixos factoriais resultantes da AFCM.

Na figura 6.11 apresenta-se o scree plot cujo andamento contribui também para aselecção do número de eixos a reter.

Figura 6.11 – Scree plot da AFCM.

Na figura 6.12 pode-se ver as coordenadas da totalidade das variáveis nos eixosfactoriais. O módulo permite, alternativamente, ver apenas as coordenadas dasvariáveis activas ou das variáveis suplementares.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.9

Figura 6.12 – Coordenadas das colunas (variáveis) nos eixos da AFCM.

Na figura 6.13 pode-se ver as contribuições absolutas das colunas nos eixos factoriais,cujos valores permitem explicar os eixos. Verifica-se assim que a variável PS1 é avariável mais importante para a construção do eixo 1 pois explica 14.497% davariabilidade deste eixo.

Figura 6.13 – Contribuições absolutas das colunas (variáveis) nos eixos da AFCM.

Na figura 6.14 apresenta-se os valores das contribuições relativas das linhas nos eixosfactoriais. Verifica-se assim que a linha FAR está mal representada no eixo 1, pois ovalor da contribuição relativa (0.0067) é próximo de 0 (é muito diferente de 1).

CVRM – Centro de Geosistemas do IST, 1989-2002 6.10

Figura 6.14 – Contribuições relativas das linhas nos eixos da AFCM.

Na figura 6.15 pode-se ver a projecção das colunas no 1º plano factorial. O programapermite representar, alternativamente, as colunas activas, as colunas suplementares ouo conjunto total das colunas. Clicando com o botão esquerdo do rato em cada um dospontos do gráfico, o programa permite identificar cada uma das variáveis (existetambém uma opção para identificação de todas as variáveis). Clicando no mesmobotão e mantendo o dedo, pode-se arrastar os identificadores para outras posições,procurando obter um gráfico mais claro. Com o botão do lado direito do rato pode-sevoltar à posição inicial. Clicando no campo esquerdo da janela, pode-se seleccionarum dos outros gráficos factoriais.

Figura 6.15 – Projecção das variáveis no 1º plano factorial da AFCM.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.11

Na figura 6.16 está representado o 1º gráfico factorial das linhas com identificação decada um dos pontos.

Figura 6.16 – Projecção das linhas no 1º plano factorial da AFCM.

O programa apresenta 2 relatórios: o 1º corresponde à recodificação do quadro dedados (ficheiro RECOD.PRN) enquanto o 2º corresponde aos resultados da AnáliseFactorial.

Relativamente ao 1º relatório pediu-se uma cópia da tabela com recoficação dos dadosquantitativos e com a matriz disjuntiva completa. Quanto ao 2º relatório pediu-se umacópia dos dados (quadro de Burt) e 1 gráfico.

Nas figuras seguintes apresenta-se alguma da informação contida nos 2 relatóriosproduzidos no directório de trabalho C:\PROGRAMAS\ANDAD\DADOS (ficheirosRECOD.PRN e AFCM.PRN).

Nas figuras 6.17 a 6.19 apresenta-se, respectivamente, o quadro de dadosrecodificado, o quadro disjuntivo completo e o quadro de Burt.

PCP PS PSD CDS PRD N/S----------------------------------------- AVE 2 3 3 3 2 1 BEJ 3 1 1 1 1 2 BRA 2 3 3 3 3 1 BRG 1 1 1 2 1 1 CBR 1 2 1 1 2 1 COB 2 3 2 2 2 1 EVR 3 1 1 1 2 2 FAR 2 2 2 1 3 2 GUA 1 1 1 2 1 1 LEI 2 2 3 3 2 1 LIS 3 3 3 3 3 2 PTG 2 1 1 1 1 2 POR 3 3 3 3 3 1 SAT 3 2 2 2 3 2 SET 3 3 2 2 3 2 VCA 1 2 2 2 2 1

CVRM – Centro de Geosistemas do IST, 1989-2002 6.12

VIR 1 1 2 1 1 1 VIS 1 2 3 3 1 1-----------------------------------------

PCP PS PSD CDS PRD N/S

Figura 6.17 - Quadro de dados recodificado (5+1 variáveis qualitativas)

PCP1 PCP2 PCP3 PS1 PS2 PS3 PSD1 PSD2 PSD3 CDS1 CDS2 CDS3 PRD1 PRD2 PRD3 Nor Sul ------------------------------------------------------------------------------------------------------------

AVE 0 1 0 0 0 1 0 0 1 0 0 1 0 1 0 1 0 BEJ 0 0 1 1 0 0 1 0 0 1 0 0 1 0 0 0 1 BRA 0 1 0 0 0 1 0 0 1 0 0 1 0 0 1 1 0 BRG 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 1 0 CBR 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 1 0 COB 0 1 0 0 0 1 0 1 0 0 1 0 0 1 0 1 0 EVR 0 0 1 1 0 0 1 0 0 1 0 0 0 1 0 0 1 FAR 0 1 0 0 1 0 0 1 0 1 0 0 0 0 1 0 1 GUA 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 1 0 LEI 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 LIS 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 1 PTG 0 1 0 1 0 0 1 0 0 1 0 0 1 0 0 0 1 POR 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 1 0 SAT 0 0 1 0 1 0 0 1 0 0 1 0 0 0 1 0 1 SET 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 0 1 VCA 1 0 0 0 1 0 0 1 0 0 1 0 0 1 0 1 0 VIR 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0 1 0 VIS 1 0 0 0 1 0 0 0 1 0 0 1 1 0 0 1 0

------------------------------------------------------------------------------------------------------------ PCP1 PCP2 PCP3 PS1 PS2 PS3 PSD1 PSD2 PSD3 CDS1 CDS2 CDS3 PRD1 PRD2 PRD3 Nor Sul

Figura 6.18 – Tabela disjuntiva completa

CVRM – Centro de Geosistemas do IST, 1989-2002 6.13

PCP1 PCP2 PCP3 PS1 PS2 PS3 PSD1 PSD2 PSD3 CDS1 CDS2 CDS3 PRD1 PRD2 PRD3 Nor Sul ----------------------------------------------------------------------------------------------------------

PCP1 6 0 0 3 3 0 3 2 1 2 3 1 4 2 0 6 0 PCP2 0 6 0 1 2 3 1 2 3 2 1 3 1 3 2 4 2 PCP3 0 0 6 2 1 3 2 2 2 2 2 2 1 1 4 1 5 PS1 3 1 2 6 0 0 5 1 0 4 2 0 5 1 0 3 3 PS2 3 2 1 0 6 0 1 3 2 2 2 2 1 3 2 4 2 PS3 0 3 3 0 0 6 0 2 4 0 2 4 0 2 4 4 2 PSD1 3 1 2 5 1 0 6 0 0 4 2 0 4 2 0 3 3 PSD2 2 2 2 1 3 2 0 6 0 2 4 0 1 2 3 3 3 PSD3 1 3 2 0 2 4 0 0 6 0 0 6 1 2 3 5 1 CDS1 2 2 2 4 2 0 4 2 0 6 0 0 3 2 1 2 4 CDS2 3 1 2 2 2 2 2 4 0 0 6 0 2 2 2 4 2 CDS3 1 3 2 0 2 4 0 0 6 0 0 6 1 2 3 5 1 PRD1 4 1 1 5 1 0 4 1 1 3 2 1 6 0 0 4 2 PRD2 2 3 1 1 3 2 2 2 2 2 2 2 0 6 0 5 1 PRD3 0 2 4 0 2 4 0 3 3 1 2 3 0 0 6 2 4 Nor 6 4 1 3 4 4 3 3 5 2 4 5 4 5 2 11 0 Sul 0 2 5 3 2 2 3 3 1 4 2 1 2 1 4 0 7

---------------------------------------------------------------------------------------------------------- PCP1 PCP2 PCP3 PS1 PS2 PS3 PSD1 PSD2 PSD3 CDS1 CDS2 CDS3 PRD1 PRD2 PRD3 Nor Sul

Figura 6.19 – Quadro de Burt

Na figura 6.20 apresenta-se uma cópia de alguns dos parâmetros introduzidos.

ANALISE FACTORIAL DAS CORRESPONDÊNCIAS Versão 7.00CVRM Software - Instituto Superior Técnico (c) CVRMUTL 1986, 2002. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

C:\Programas\Andad\Dados\eleicoes1.and

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

UTILIZAÇÃO DE MEMÓRIA . numérica 1319 . literal 105

N. total de linhas => 35 N. de linhas activas => 17 N. total de colunas => 17 N. de colunas activas => 17

Linhas activas (1) ou ilustrativas (0) 11111111111111111000000000000000000

Colunas activas (1) ou ilustrativas (0) 11111111111111111

N. de factores seleccionados => 8 N. de graficos seleccionados => 1 N. de paginas por grafico => 1 N. de linhas por grafico => 65 N. de desvios padrao => 2.5 Cria ficheiro (1) ou nao (0) => 1 Imprime dados (1) ou nao (0) => 1 Formato de leitura => (a4,19f4.0:/(20f4.0:))

Figura 6.20 – Alguns parâmetros do programa

Na figura 6.21 encontra-se informação relativa aos valores próprios – a importânciarelativa de cada um dos eixos é analisada pela coluna % EXP. Verifica-se, neste caso,que os dois primeiros factores explicam 70.71% da variabilidade contida na matriz dedados.

VAL.PROP % EXP % ACU HISTOGRAMA DOS VALORES

1 0.28708 48.00 48.00 ................................................ 2 0.13580 22.71 70.71 ....................... 3 0.08220 13.75 84.46 .............. 4 0.04470 7.48 91.93 ....... 5 0.02459 4.11 96.04 .... 6 0.01619 2.71 98.75 ... 7 0.00483 0.81 99.56 . 8 0.00212 0.35 99.91 .

Figura 6.21 – Valores próprios e percentagem de explicação dos factores

CVRM – Centro de Geosistemas do IST, 1989-2002 6.14

Na figura 6.22 apresenta-se o output principal do módulo AFCM. Contém ascoordenadas, as contribuições absolutas e as contribuições relativas dos indivíduos edas modalidades nos eixos.

NOMES MASSAS DIST/O* COORDENADAS * CONTRIBUICOES ABSOLUTAS * CONTRIBUICOES RELATIVAS * ************************************************************************************************************************** * F1 F2 F3 F4 F5 F6 * F1 F2 F3 F4 F5 F6 * F1 F2 F3 F4 F5 F6 * **************************************************************************************************************************Pontos-coluna activos

PCP1 0.056 0.69 * -0.54 -0.53 -0.18 -0.23 0.17 -0.02 * 5.7 11.3 2.1 6.4 6.3 0.1 * 0.43 0.40 0.05 0.07 0.04 0.00 * PCP2 0.056 0.45 * 0.39 -0.16 0.07 0.38 -0.24 0.25 * 2.9 1.0 0.3 17.5 12.8 21.0 * 0.34 0.05 0.01 0.32 0.13 0.14 * PCP3 0.056 0.58 * 0.16 0.68 0.11 -0.15 0.07 -0.23 * 0.5 19.0 0.8 2.7 1.1 18.2 * 0.04 0.80 0.02 0.04 0.01 0.09 * PS1 0.056 0.87 * -0.87 0.08 0.30 -0.08 -0.12 0.04 * 14.5 0.3 6.0 0.9 3.1 0.5 * 0.86 0.01 0.10 0.01 0.02 0.00 * PS2 0.056 0.42 * 0.08 -0.22 -0.39 0.25 0.38 -0.03 * 0.1 1.9 10.3 7.9 31.8 0.3 * 0.01 0.11 0.37 0.15 0.34 0.00 * PS3 0.056 0.75 * 0.79 0.14 0.09 -0.17 -0.26 -0.01 * 12.0 0.7 0.6 3.5 15.2 0.0 * 0.82 0.02 0.01 0.04 0.09 0.00 * PSD1 0.056 0.79 * -0.82 0.03 0.27 0.04 -0.08 -0.14 * 12.9 0.0 5.1 0.2 1.4 7.2 * 0.85 0.00 0.10 0.00 0.01 0.03 * PSD2 0.056 0.51 * 0.01 0.24 -0.64 0.02 -0.04 0.15 * 0.0 2.4 27.8 0.0 0.3 8.2 * 0.00 0.12 0.81 0.00 0.00 0.05 * PSD3 0.056 0.87 * 0.80 -0.27 0.37 -0.06 0.12 -0.01 * 12.4 3.0 9.1 0.4 3.1 0.0 * 0.74 0.08 0.15 0.00 0.02 0.00 * CDS1 0.056 0.64 * -0.62 0.23 0.16 0.38 0.07 0.05 * 7.4 2.2 1.8 18.4 1.0 1.0 * 0.60 0.08 0.04 0.23 0.01 0.00 * CDS2 0.056 0.47 * -0.18 0.04 -0.53 -0.33 -0.18 -0.04 * 0.7 0.1 18.9 13.5 7.7 0.7 * 0.07 0.00 0.59 0.23 0.07 0.00 * CDS3 0.056 0.87 * 0.80 -0.27 0.37 -0.06 0.12 -0.01 * 12.4 3.0 9.1 0.4 3.1 0.0 * 0.74 0.08 0.15 0.00 0.02 0.00 * PRD1 0.056 0.72 * -0.73 -0.16 0.27 -0.23 0.06 0.19 * 10.3 1.1 4.9 6.3 0.8 12.0 * 0.73 0.04 0.10 0.07 0.00 0.05 * PRD2 0.056 0.42 * 0.11 -0.36 -0.19 0.36 -0.18 -0.28 * 0.2 5.4 2.5 15.7 7.5 27.7 * 0.03 0.31 0.09 0.30 0.08 0.19 * PRD3 0.056 0.72 * 0.62 0.53 -0.08 -0.13 0.12 0.10 * 7.5 11.3 0.4 2.1 3.5 3.2 * 0.53 0.38 0.01 0.02 0.02 0.01 * Nor 0.102 0.21 * 0.07 -0.44 -0.03 -0.08 -0.03 0.00 * 0.2 14.5 0.1 1.6 0.5 0.0 * 0.03 0.92 0.00 0.03 0.01 0.00 * Sul 0.065 0.52 * -0.12 0.69 0.05 0.13 0.05 0.00 * 0.3 22.8 0.2 2.5 0.8 0.0 * 0.03 0.92 0.00 0.03 0.01 0.00 *

Pontos suplementares

AVE 0.009 1.77 * 0.92 0.00 0.00 0.00 0.00 0.00 * 2.7 0.0 0.0 0.0 0.0 0.0 * 0.48 0.00 0.00 0.00 0.00 0.00 * BEJ 0.009 1.93 * -0.93 0.00 0.00 0.00 0.00 0.00 * 2.8 0.0 0.0 0.0 0.0 0.0 * 0.45 0.00 0.00 0.00 0.00 0.00 * BRA 0.009 1.77 * 1.08 0.00 0.00 0.00 0.00 0.00 * 3.8 0.0 0.0 0.0 0.0 0.0 * 0.66 0.00 0.00 0.00 0.00 0.00 * BRG 0.009 1.77 * -0.95 0.00 0.00 0.00 0.00 0.00 * 2.9 0.0 0.0 0.0 0.0 0.0 * 0.51 0.00 0.00 0.00 0.00 0.00 * CBR 0.009 1.77 * -0.53 0.00 0.00 0.00 0.00 0.00 * 0.9 0.0 0.0 0.0 0.0 0.0 * 0.16 0.00 0.00 0.00 0.00 0.00 * COB 0.009 1.77 * 0.37 0.00 0.00 0.00 0.00 0.00 * 0.4 0.0 0.0 0.0 0.0 0.0 * 0.08 0.00 0.00 0.00 0.00 0.00 * EVR 0.009 1.93 * -0.67 0.00 0.00 0.00 0.00 0.00 * 1.4 0.0 0.0 0.0 0.0 0.0 * 0.23 0.00 0.00 0.00 0.00 0.00 * FAR 0.009 1.93 * 0.11 0.00 0.00 0.00 0.00 0.00 * 0.0 0.0 0.0 0.0 0.0 0.0 * 0.01 0.00 0.00 0.00 0.00 0.00 * GUA 0.009 1.77 * -0.95 0.00 0.00 0.00 0.00 0.00 * 2.9 0.0 0.0 0.0 0.0 0.0 * 0.51 0.00 0.00 0.00 0.00 0.00 * LEI 0.009 1.77 * 0.70 0.00 0.00 0.00 0.00 0.00 * 1.6 0.0 0.0 0.0 0.0 0.0 * 0.28 0.00 0.00 0.00 0.00 0.00 * LIS 0.009 1.93 * 0.95 0.00 0.00 0.00 0.00 0.00 * 2.9 0.0 0.0 0.0 0.0 0.0 * 0.47 0.00 0.00 0.00 0.00 0.00 * PTG 0.009 1.93 * -0.86 0.00 0.00 0.00 0.00 0.00 * 2.4 0.0 0.0 0.0 0.0 0.0 * 0.38 0.00 0.00 0.00 0.00 0.00 * POR 0.009 1.77 * 1.01 0.00 0.00 0.00 0.00 0.00 * 3.3 0.0 0.0 0.0 0.0 0.0 * 0.57 0.00 0.00 0.00 0.00 0.00 * SAT 0.009 1.93 * 0.18 0.00 0.00 0.00 0.00 0.00 * 0.1 0.0 0.0 0.0 0.0 0.0 * 0.02 0.00 0.00 0.00 0.00 0.00 * SET 0.009 1.93 * 0.40 0.00 0.00 0.00 0.00 0.00 * 0.5 0.0 0.0 0.0 0.0 0.0 * 0.08 0.00 0.00 0.00 0.00 0.00 * VCA 0.009 1.77 * -0.14 0.00 0.00 0.00 0.00 0.00 * 0.1 0.0 0.0 0.0 0.0 0.0 * 0.01 0.00 0.00 0.00 0.00 0.00 * VIR 0.009 1.77 * -0.83 0.00 0.00 0.00 0.00 0.00 * 2.2 0.0 0.0 0.0 0.0 0.0 * 0.39 0.00 0.00 0.00 0.00 0.00 * VIS 0.009 1.77 * 0.15 0.00 0.00 0.00 0.00 0.00 * 0.1 0.0 0.0 0.0 0.0 0.0 * 0.01 0.00 0.00 0.00 0.00 0.00 *

Figura 6.22 – Coordenadas das colunas e linhas nos eixos

Na figura 6.23 encontra-se o gráfico que cruza os dois primeiros factores, queexplicam 70.71% da variabilidade total. Este gráfico contém as projecções dasmodalidades das variáveis quantitativas e qualitativas, representados pelos respectivosidentificadores.

CVRM – Centro de Geosistemas do IST, 1989-2002 6.15

EIXO 1-- HORIZONTAL EIXO 2-- VERTICAL

1.047 ----------------------------------------------------------------------------SET ---------------------------------------- 1.018 I . I 0.988 I . I 0.959 I . I 0.930 I . SAT I 0.901 I . I 0.872 I . I 0.842 I . I 0.813 I . I 0.784 I . I 0.755 I . I 0.725 BEJ Sul . I 0.696 I . PCP3 LIS I 0.667 I . I 0.638 I EVR . FAR I 0.609 I . I 0.579 I . I 0.550 I . PRD3 I 0.521 I . I 0.492 I . I 0.463 I . I 0.433 I . I 0.404 I . I 0.375 I . I 0.346 PTG . I 0.316 I . I 0.287 I . I 0.258 I CDS1 PSD2 I 0.229 I . I 0.200 I . POR I 0.170 I . PS3 I 0.141 I . I 0.112 PS1 . I 0.083 I . I 0.054 I PSD1 CDS2 . I 0.024 I . . . . . . . . . . . . + . . . . . . . . . . . . . . . I -0.005 I . I -0.034 I . I -0.063 I . I -0.092 I . I -0.122 I PRD1 . PCP2 I -0.151 I . I -0.180 I . PS2 BRA -0.209 I . COB I -0.239 I VIR . PSD3 I -0.268 I . I -0.297 I . I -0.326 I . PRD2 I -0.355 I . I -0.385 I . I -0.414 BRG . Nor I -0.443 I . I -0.472 I . I -0.501 I PCP1 . I -0.531 I VCA . I -0.560 I CBR . I -0.589 I . AVE I -0.618 I . I -0.647 I . I -0.677 I . I -0.706 I . I -0.735 I . LEI I -0.764 I . I -0.794 I . I -0.823 ------------------------------------------------------------VIS --------------------------------------------------------

-0.953 -0.546 -0.139 0.267 0.674 1.081

Figura 6.23 – Projecção das diversas modalidades e dos distritos no 1º plano factorial