centro de investigaÇÕes regionais e urbanaspascal.iseg.utl.pt/~cirius/eru/caderno2.pdf ·...

UNIVERSIDADE TÉCNICA DE LISBOA

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO

CENTRO DE INVESTIGAÇÕES REGIONAIS E URBANAS

E C O N O M I A

R E G I O N A L E U R B A N A

Coordenação: Manuel Brandão Alves

4º ANO DO CURSO DE ECONOMIA

2001/2002

2. MÉTODOS DE ANÁLISE DA EVOLUÇÃO DO SISTEMA ESPACIAL

PORTUGUÊS: AS REGIÕES, AS CIDADES E OS FENÓMENOS

URBANOS

Manuel Brandão Alves

António Natalino Martins

Maria Luiza Vaz Pinto

Paulo Madruga

CIRIUSCentro de Investigações Regionais e Urbanas

SÉRIE DIDÁTICA

Documento de Trabalho nº 2 /2001

2. MÉTODOS DE ANÁLISE DA EVOLUÇÃO DO

SISTEMA ESPACIAL PORTUGUÊS: AS REGIÕES,

AS CIDADES E OS FENÓMENOS URBANOS

Manuel Brandão AlvesAntónio Natalino Martins

Maria Luiza Vaz PintoPaulo Madruga

Edição de Setembro de 1999

ÍNDICE

ÍNDICE 1

2. MÉTODOS DE ANÁLISE DA EVOLUÇÃO DO SISTEMA

ESPACIAL PORTUGUÊS: AS REGIÕES, AS CIDADES E

OS FENÓMENOS URBANOS 3

2.1. ANÁLISE ESTÁTICA DA ESTRUTURA REGIONAL 5

2.1.1 As medidas de especialização 8

2.1.2 As medidas de diversificação 14

2.2. ANÁLISE DINÂMICA 19

2.2.1 O método de Dunn e a análise de decomposição 19

2.2.2. A análise shift-share 23

2.3. INDICADORES DE SÍNTESE 29

2.3.1. A análise factorial 29

2.3.2. A distância económica 54

2.4. A IDENTIFICAÇÃO E A CLASSIFICAÇÃO DAS REGIÕES 56

2.4.1. A análise de clusters 65

2.4.2. Noções de densidade e de distância inter-grupal 76

2.4.3. A formação de agrupamentos homogéneos 79

2.4.4. A formação de agrupamentos polarizados 84

2. MÉTODOS DE ANÁLISE DA EVOLUÇÃO DO SISTEMA ESPACIAL PORTUGUÊS: AS

REGIÕES, AS CIDADES E OS FENÓMENOS URBANOS 3

2. MÉTODOS DE ANÁLISE DA EVOLUÇÃO DO SISTEMA

ESPACIAL PORTUGUÊS: AS REGIÕES, AS CIDADES E

OS FENÓMENOS URBANOS

Foi referido em ponto anterior que, o espaço económico é o

resultado de uma aplicação do espaço matemático no espaço

geográfico, em que as variáveis do espaço matemático assumem

significado económico.

O espaço matemático foi definido como sendo um espaço

abstracto de representação das relações entre variáveis, enquanto o

espaço geográfico o foi como sendo o espaço físico e o meio ambiente

em que vivemos. O espaço económico é, assim, o conjunto de espaços

concretos (lugares) de ocorrência dos fenómenos económicos, que

designaremos por espaços elementares. O que lhe dá consistência é a

unidade dos fenómenos económicos que aí ocorrem. Por isso, um

mesmo fenómeno pode dar unidade a diferentes espaços elementares.

Cada espaço elementar é, todavia, meio ambiente da ocorrência

de fenómenos diversos, protagonizados por múltiplos sujeitos. Duns e

doutros, resulta a coesão económica e social, que nos permite

distinguir os espaços entre si. Surge, assim, a região, produto da

agregação de espaços elementares dotados de determinadas

características e contíguos1 entre si.

A região, sendo uma entidade dotada de dinamismo próprio,

constitui uma dimensão privilegiada de actuação pública sobre os

fenómenos macro-económicos. A organização dessa actuação pelos

1A contiguidade significa que se pode passar de um espaço elementar a outro, sem

necessidade de transitar por um terceiro.

O espaço económico é umaaplicação do espaço deactividades sobre o espaçodos lugares.

A região é um tipo particulade espaço económico.

Os elementos que dãoidentidade à região, não seopõem à sua abertura aoexterior.

4 2. Métodos de Análise da Evolução do Sistema Espacial Português: AsRegiões, as Cidades e os Fenómenos Urbanos

poderes públicos pressupõe, por isso, a delimitação das regiões, ou

seja, a identificação dos elementos que conferem unidade a vários

espaços elementares, o que permite tomá-los como região. A região,

conjunto de espaços elementares, é, por sua vez, parte do todo

nacional e, deste modo, enquanto subsistema do sistema económico

nacional, caracteriza-se por ser um sistema aberto, o que significa, que

são reduzidas as restrições à mobilidade de bens e factores produtivos,

quer no seu interior (mobilidade intra-espacial), quer nog seu

relacionamento com outras regiões (mobilidade inter-espacial), também

elas elementos do sistema nacional.

A abertura das regiões é fomentadora de relações de

interdependência, que podem ser de dominação ou de dependência,

consoante o papel que, no conjunto desse sistema de relações,

desempenha cada uma dessas regiões

As interdependências espaciais geradas resultam da estrutura

económica de cada região e, por esse motivo, tão importante se torna

estudar as relações interregionais, como conhecer o seu suporte

económico e o respectivo quadro organizativo, ou seja, as relações

intra-regionais.

À política regional interessará conhecer a estrutura económica de

cada região, não apenas em termos estáticos (caracterização), mas

também em termos dinâmicos (perspectivas de evolução), porque da

conjugação destes dois aspectos tanto podem resultar condições

propícias ao desenvolvimento como ao aprofundamento de

desequilíbrios regionais, que necessitem de correcção.

Este conjunto de problemas será abordado nos pontos seguintes,

onde iremos estudar, os instrumentos de caracterização e evolução das

estruturas económicas das regiões e as metodologias que permitem,

A abertura das regiões gerainterdependências espaciais.

A política económicaregional supõe análise

estática e dinâmica.

2.1.1 AS MEDIDAS DE ESPECIALIZAÇÃO 5

realizar comparações entre elas, determinar o seu posicionamento no

todo nacional, classificá-las e delimitá-las.

2.1. ANÁLISE ESTÁTICA DA ESTRUTURA REGIONAL

As regiões são sistemas abertos que se interrelacionam por várias

formas e em que assumem particular importância os fluxos de bens e

serviços. Há regiões que não produzem tudo o que consomem e outras

produzem mais do que necessitam. Aí está uma fonte da

interdependência entre as regiões, mas ela não se pode esgotar numa

visão que encara as relações das regiões apenas como dando origem a

fluxos de bens e serviços. A tecnologia, os recursos humanos, a

cultura, o lazer, etc, são outras tantas perspectivas através das quais

aquela interdependência pode ser encarada.

O tipo ou as características do relacionamento referido estão

ligados à composição da estrutura económica de cada região. Como os

recursos naturais e a capacidade do seu aproveitamento variam no

espaço, as relações interregionais podem gerar condições e situações

de desigualdade, acentuando dependências julgadas pouco aceitáveis.

As desigualdades traduzem-se em desequilíbrios e estes

constituem hoje um dos objectos marcantes, embora não exclusivo, da

política regional. A política supõe, no entanto, intervenção e esta

conhecimento. O conhecimento exige a identificação e a medição dos

referidos desequilíbrios.

A medição e avaliação dos desequilíbrios supõe a escolha de um

termo de comparação, que permita concluir sobre a existência de

desvios (detecção do problema) e da respectiva amplitude (gravidade

do problema). A este termo de comparação designaremos por padrão.

A interdependência dasregiões pode ser observadaatravés dos fluxos de bens eserviços que entre elas sãogerados.

Os fluxos deinterdependência podemgerar mecanismos dedesigualdade.

A existência dedesequilíbrios exige medidasde política económica e estaimpõem o conhecimentorigoroso da importânciadaqueles desequilíbrios.

Medir implica comparar enão há comparação sem aescolha de um padrão.

O padrão pode ser uma variável cuja distribuição espacial se

considera exemplar ou um espaço em que a sua distribuição sectorial

pode ser tomada como referência. A escolha do tipo de padrão

depende dos objectivos da análise, já que os indicadores a utilizar não

serão os mesmos, sendo, também distintas as suas potencialidades

informativas.

Contudo, para bem avaliar o significado dos desequilíbrios

importa que conheçamos a estrutura ou composição interna da

economia de cada um dos espaços.

Para a caracterização do que existe interessa conhecer a forma

como as actividades produtivas se distribuem, em termos espaciais e

sectoriais.

O comportamento espacial dos sectores de actividade permite

avaliar o grau de especialização de uma região ou a diversificação de

actividades que comporta.

Este aspecto reveste um interesse especial quando o objectivo de

política regional é o da correcção dos desequilíbrios, porque a

intervenção possível terá de ser diferenciada, consoante se verifique a

concentração sectorial da actividade económica regional

(especialização) ou, pelo contrário, a sua difusão mais ou menos

equilibrada, por vários sectores (diversificação).

Em qualquer caso, são pouco desejáveis graus excessivos, tanto

de especialização como de diversificação. A especialização

exagerada, em situações desfavoráveis, aumenta a vulnerabilidade da

região, embora, em situações favoráveis, .possa conferir-lhe

características de região dominante no relacionamento com as outras

regiões.

A escolha de um padrãovaria de acordo com os

objectivos da análise.

Os indicadores dediversificação permitem-nos

conhecer a estruturaeconómica das regiões.

A avaliação do grau deespecialização ou de

diversificação de umaregião…

…é importante em termos dedefinição de política

regional.

Apesar dos aspectos positivos que a especialização possa

apresentar, é preciso ter presente que se em determinadas

circunstâncias pode revelar uma capacidade específica de uma região,

indiciadora de potencialidades a desenvolver, noutras pode significar a

existência de bloqueamentos condicionadores do arranque para o

desenvolvimento.

A especialização implica, em geral, capacidade exportadora

significativa e, por isso, inserção da economia regional nas economias

que a envolvem. Em épocas de expansão da procura, a especialização é

um benefício para a região. No entanto, se a região não sabe

acompanhar o dinamismo da procura pode acontecer que, porque o

mercado exige novos produtos, ou produtos mais sofisticados, a sua

actividade económica venha a sofrer graves revezes.

Inversamente, uma elevada diversificação de actividades

protege com mais facilidade a região dos impactos negativos que

possam ter origem nas zonas de exportação, ou porque a dinâmica da

procura se orientou para outros produtos, ou porque aí se começam a

verificar tendências depressivas generalizadas. Contudo, um grau de

diversificação demasiado elevado, ou não convenientemente gerido,

pode impedir a região de participar do esforço de crescimento e

desenvolvimento que, a nível nacional e mundial, apresentam

determinados sectores de actividade. A diversificação excessiva pode,

ainda, significar dispersão de recursos susceptível de impedir a

obtenção das dimensões mínimas2 necessárias para tornar competitivas

determinadas actividades.

2Seja em termos de dimensão das próprias empresas, seja em termos de dimensão da

actividade, no primeiro caso, condicionada pelas economias de escala e, no segundo caso,pelas economias de aglomeração.

Vantagens e incoveninentesda especialização regional…

…e da diversificaçãoregional.

Haverá que procurar beneficiar das vantagens, tentando evitar os

seus inconvenientes, tanto da especialização como da

diversificação.Em cada caso deverá procurar-se encontrar o que

poderíamos designar como a combinação óptima de especialização e

diversificação3.

2.1.1 As medidas de especialização

Como já foi salientado, se é importante que a estrutura

económica de uma região seja equilibradamente diversificada, também

é importante que a diversificação não seja tão extrema que elimine toda

a possibilidade de especialização4.

Somos, por isso, levados a estudar medidas de especialização,

apresentando em primeiro lugar, o coeficiente de localização.

O coeficiente de localização (CL ) pode ser interpretado como

um indicador de associação (distribuição) espacial entre duas

actividades (variáveis) ou como um indicador agregado das

disparidades na distribuição de uma variável num determinado espaço5,

recorrendo à comparação da sua distribuição com a de uma outra que é

tomada como termo de comparação e se chama variável padrão. Não

se pode dizer que o coeficiente de localização tem dois conteúdos

diferentes. Trata-se de duas leituras de um mesmo conteúdo.

Começamos por apresentar a primeira interpretação.

3Não basta contudo encontrar essa combinação num determinado momento. Haverá

que saber geri-la no tempo, porque uma combinação óptima hoje poderá não o ser amanhã.4Quer o ponto de vista seja o do peso de uma actividade no conjunto das actividades

de uma região, quer do da forma como uma actividade se distribui no conjunto das regiões,em comparação com um padrão pré-definido.

5 Em geral o espaço nacional.

Existem duas leituraspossíveis para o coeficiente

de localização.

O CL compara a distribuição espacial de uma variável x para

uma actividade j (x rj ) com a sua distribuição espacial para uma

actividade padrão (x rp)6.

A variável padrão pode ser o conjunto das actividades ou uma

qualquer outra variável considerada exemplar, ou que se quer tomar

como referência.

Para cada região r a proporção da actividade j e da actividade

padrão que lhe cabem são representadas por:

O somatório dos desvios (positivos ou negativos) entre estas

duas relações, constitui a base do cálculo do Coeficiente de

Localização (CL j). A fim de evitar que os desvios se compensem, são

tomados em módulo.

A representação algébrica de CL j será dada por:

2 (0 CL 1)j

≤ <∑

x j é o valor da variável x, no conjunto dos espaços e para a

actividade j;

x rp é o valor da variável x na região r para a actividade padrão;

x p valor da variável x, no conjunto dos espaços, e para a

actividade padrão.

6Ao referir-se a distribuição espacial está-se a chamar a atenção para o facto de com

o CL j se considerarem, para além do espaço padrão, todas as regiões r.

A primeira leitura.

O cálculo do CLj.

O cálculo do CLj permite determinar até que ponto estão

associadas as distribuições espaciais de duas actividades que, teórica e

(ou) normativamente, o deveriam estar7 . Quanto maior for CLj ,

maiores são os desequilíbrios verificados nas distribuições daquelas

actividades. Se as distribuições da actividade j e da actividade padrão

forem iguais, CLj =0. À medida que as distribuições se afastam uma da

outra, CLj tenderá a aproximar-se da unidade, sem contudo conseguir

atingir esse valor.

O desequilíbrio pode ser interpretado como um indicador da

especialização da actividade j num certo espaço, ou conjunto de

espaços. Daí que o coeficiente de localização possa ser apresentado

como um indicador de especialização. Dá-nos informações, não sobre a

região que está especializada na actividade j, mas antes sobre o grau de

especialização do conjunto das regiões, na actividade j8.

Tem sido comum uma outra forma de apresentação do

coeficiente de localização em que a variável cuja distribuição se

compara com um padrão não está necessariamente associada à

distribuição de uma determinada actividade e que, por isso,

designaremos apenas por CL.

Pode, por ex., comparar-se a distribuição regional do produto

com a da superfície. Seja o produto representado pela variável x, e a

superfície pela variável y. Para cada região r , as proporções de produto

e de superfície que lhe cabem são representadas por:

r e yy

7Por exemplo se admitíssemos que seria desejável que a transformação da cortiça se

processasse nas regiões florestalmente especializadas no sobreiro, este indicador permitir-nos-ia estimar os desvios em relação a esse objectivo.

Os limites de variação doCLj

A segunda leitura.

A representação algébrica de CL é, assim, dada por:

2 (0 CL 1)

−≤ <

∑ (2)

Os comentários ao comportamento de CL são idênticos aos já

referidos para CL j .

A segunda medida de especialização que iremos estudar é o

quociente de localização.

O quociente de localização não é um indicador da especialização

de uma região9, mas antes do grau em que uma região pode ser

considerada, ou não, como especializada numa determinada actividade.

A estrutura sectorial de uma região pode ser identificada, como

se sabe, através do peso relativo que nela possuem as suas diferentes

actividades. Esse peso relativo constituir a base da construção do

quociente de localização. Seja:

xrj /xr - o peso da actividade j na região r (conjunto das

actividades), tendo as variáveis o significado que

anteriormente lhes foi atribuído.

Se se pretender comparar o peso de uma variável, para uma

determinada actividade, num determinado espaço, com o seu peso no

espaço padrão, podemos utilizar o indicador simples, acima referido

como Quociente de Localização (QL rj ).

8Uma outra leitura permitirá dizer que CL j é um indicador de dispersão da

actividade j , tanto maior quanto mais se aproximar de 0.9E para esse efeito pode ser utilizado o coeficiente de diversificação, embora com

uma leitura simétrica da que atrás foi apresentada.

Escolhido um espaço padrão, que normalmente corresponde ao

conjunto das regiões em análise, o QLrj pode ser definido a partir da

seguinte expressão:

x (0 QL )rj

prj= ≤ ≤ ∞

em que:

QL rj é o quociente de localização da actividade j na região r;

x pj é o valor da variável x, para a actividade j , no espaço

padrão;

x p é o valor da variável x, no espaço padrão, para o conjunto

das actividades.

Se tomarmos a distribuição sectorial da actividade produtiva da

região padrão como desejável, isso permite-nos tomar o QL como um

indicador de disparidades regionais, considerando-se como modelar, a

região que mais se aproxima do padrão. Esta proximidade será tanto

maior, quanto mais os QL das diversas actividades forem próximos da

unidade.

O recurso ao QL , como indicador de especialização sectorial de

uma região, tem, relativamente aos índices simples xrj /xr, a vantagem

de evitar a escolha arbitrária de um limiar de especialização.

Particularmente, se o espaço tomado como padrão, for o conjunto das

regiões (a nação), a importância do QL como medida de

especialização, torna-se evidente, já que, na prática, ele nos fornece

uma medida da importância de cada sector na região, tendo em conta a

respectiva dimensão nacional. Ou seja, permite-nos saber até que ponto

O quociente de localização.

É possível ler o quociente delocalização como um

indicador das disparidadesregionais na distribuição de

uma determinada actividade.

o sector é importante na região, por via da própria especialização

regional e não por via da especialização nacional10.

Quanto maior for QLrj maior é o grau de especialização da

região r na actividade j .

Se QLrj = 0, a região não possui a actividade j .

Se QLrj = 1, a região r tem um grau de especialização idêntico

ao do espaço padrão.

Se QLrj > 1, a actividade j é mais importante (isto é, está mais

localizada) na região r do que na região padrão, concluindo-se

que a região é especializada naquela actividade.

Os quocientes de localização (QL ) permitem comparar as

regiões entre si e com o padrão mas, apresentam limitações que

resultam de se ter que escolher um termo de comparação (o padrão

como situação ideal), e de utilizar uma única variável para realizar as

comparações interregionais.

Os valores obtidos para o QL dependem da nomenclatura de

actividades utilizada. Quanto mais agregada for, menos rica será a

informação produzida. Por isso, uma análise de especialização deverá

basear-se num número de sectores tão grande, quanto as

disponibilidades estatísticas o permitirem.

A utilização do QL como indicador de desequilíbrios é

discutível, na medida em que é difícil dizer o que é uma distribuição

sectorial óptima. A fragilidade da hipótese que consiste em considerar,

como referência, o conjunto das regiões é evidente. Tomar-se como

10Nesta óptica não terá sentido afirmar que uma região é especializada num sector

que corresponde a, por ex., 51% do conjunto da sua actividade, se a nível nacional o sectorrepresenta mais do que esses 51%.

Os limites de variação doquociente de localização.

O quociente de localizaçãopossui limitações,decorrentes, tanto da sualógica de construção, comonas utilizações que dele sãofeitas.

padrão uma qualquer outra região (nacional ou estrangeira) revela as

mesmas insuficiências. Nada garante que o que é uma especialização

frutuosa para uma dada região o seja também, dada a complexidade

dos factores em apreciação, para uma outra.

Acrescente-se ainda que o QL pode apresentar a desvantagem de

não se tratar de uma medida agregada para cada espaço. Existe um QL

para cada par actividade-região, pelo que, para cada espaço, se obtem

um número elevado de indicadores cuja apreciação de conjunto se

torna difícil11.

2.1.2 As medidas de diversificação

Um dos indicadores mais usados para estudar a diversificação

regional é o coeficiente de diversificação.

O coeficiente de diversificação (CD)12 para uma determinada região

r , pode ser explicitado através da seguinte expressão:

(0 CD < 1)r r

−≤

11No entanto, uma interpretação correcta não pode concluir que estamos na presença

de uma limitação do indicador, uma vez que, por esta via, se está a pretender acusar oquociente de localização de não fornecer elementos de interpretação que com ele nunca sepretendeu proporcionar.

12É por vezes também designado por índice de especialização, o que tem tambémjustificação, uma vez que a especialização de um espaço é tanto maior quanto menor for adiversificação. Consideramos, no entanto, que o indicador tem mais potencialidades em serutilizado como indicador de diversificação do que como indicador de especialização.

O coeficiente dediversificação.

2.1.2 AS MEDIDAS DE DIVERSIFICAÇÃO 15

x r j - é o valor da variável x13, na região r e na actividade j;

x r - é o valor da variável x na região r, para o conjunto das

actividades;

x p j - é o valor da variável x, na região padrão (p), para a

actividade j;

xp - é o valor da variável x, na região padrão, para o conjunto

das suas actividades.

Quando CDr = 0, a diversificação é idêntica à do padrão; quanto

mais CDr se aproximar de 1 (o campo de variação é aberto à direita,

sem que o extremo 1 seja atingido), menor será a semelhança da

economia regional, em termos de diversificação, relativamente ao

padrão.

O recurso a um padrão implica condicionamentos na

interpretação dos resultados, nomeadamente, o facto de o padrão

poder estar sujeito a limitações. Os desvios em relação ao padrão, que

vierem a ser constatados, terão, por isso, que ser interpretados de

acordo com o significado normativo que se atribuir ao padrão. Os

juízos que a partir daí forem emitidos serão tanto mais válidos quanto

mais permanente for o padrão.

Assim, se o espaço padrão for diversificado, um CDr = 0 significa

que a região r é tão diversificada quanto o padrão, e se CDr se

aproximar de 1 então a região r será mais especializada que o padrão.

13Por ex., o emprego, os salários, a produção, etc.

Os limites de variação docoeficiente.

A escolha de um padrãosujeita a sua utilização alimitações.

Podem ser construídosindicadores que não estejamsujeitos às limitações daescolha de um padrão.

Tem-se procurado superar os inconvenientes ligados à

necessidade de escolha de um padrão, construindo indicadores, ou

medidas, que não pressuponham essa escolha.

Um deles é o índice de diversificação (Dr), construído a partir

das relações xrj /xr .

Começa-se por colocar por ordem decrescente, as sucessivas

relações xrj /xr , com j = 1, 2, . . . , m.

Seguidamente, sejam pr1 , pr2 , . . . , prm, respectivamente, as

relações x rj /x r, para j = 1, 2, . . . , m, por ordem decrescente.

Teremos: pr1 > pr2 >... > prm

Construa-se a partir destas relações a seguinte sucessão:

dr1 = pr1

dr2 = pr1 + pr2

drm = pr1 + pr2 + . . . + prm

A soma dos diferentes drk, determinará o valor do índice de

diversificação para o espaço r :

Dr =∑d (k= 1,2, , m) rkk

Se a importância relativa de cada um dos sectores j for idêntica,

então:

pr1 = pr2 = ... = prm = 1m

pelo que:

O índice de diversificação.

2.1.2 AS MEDIDAS DE DIVERSIFICAÇÃO 17

dkmrk =

e o valor de Dr será:

r = + + + = +1m

( ... )1 21

No caso, também extremo, da actividade económica se

concentrar num único sector:

d r1 = d r2 = ... = d rm = 1

e teríamos:

D = mr

O índice de diversificação D r pode, assim, variar entre um valor

mínimo:

D =m + 1

2r , considerado a diversificação máxima (peso

igual de todos os sectores) e um valor máximo:

D = mr , que corresponde à ausência de diversificação.

Este índice também apresenta limitações relativamente à

apreensão das realidades espaciais. Uma delas é o facto de o valor do

índice Dr ser indiferente às actividades sobre que recai a

especialização. Duas regiões podem apresentar o mesmo valor para o

índice Dr , e possuírem composições sectoriais muito diferentes. Este

inconveniente tem a sua origem no facto de ter sido eliminada a

referência a um padrão, o que tem como consequência que se obtenha

um índice absoluto. A sua relativização pode ser obtida recuperando a

referência a um padrão. Só que o padrão, neste caso, vai ser escolhido

de acordo com o objectivo que se pretende prosseguir.

O valor mínimo do índice dediversificação

O valor máximo do índice dediversificação

A construção de índicesrelativos.

As limitações do índice dediversificação.

Se o objectivo for a determinação da proporção de diversificação

relativamente ao índice de diversificação máxima, pode-se construir

o índice relativo:

a) D = D m +1

cujos valores extremos são 1, quando a diversificação é

máxima e 2mm +1 , quando é nula;

Ou, comparando com o índice correspondente à ausência de

diversificação.

b) D = Dmr

' ' r ,

com extremos iguais a 1 e m +12m , consoante há ausência

ou maximização da diversificação.

Quando haja interesse em comparações interregionais pode-se

utilizar como padrão, o índice relativo a uma região, ou conjunto de

regiões, e designado por DC .

c) D r' ' ' r C

− ou D

D r' ' ' ' r C

- D −

Os indicadores apresentados permitem-nos realizar um juízo

acerca do comportamento da estrutura económica da região. Estamos

no domínio da análise intra-regional.

2.2.1 O MÉTODO DE DUNN E A ANÁLISE DE DECOMPOSIÇÃO 19

2.2. ANÁLISE DINÂMICA

A informação obtida com a utilização dos indicadores anteriores

avalia a situação de uma região num dado momento e, por isso,

podemos dizer que não permite senão uma análise estática. Mas, as

estruturas espaciais evoluem no tempo e à política regional interessa

conhecer o sentido e a intensidade dessa evolução.

O diagnóstico de uma situação num dado momento não basta;

torna-se necessário determinar, para que a intervenção se justifique,

como é que tende a evoluir e, no caso concreto dos desequilíbrios

regionais, se possuem uma dinâmica divergente, agravando as

distâncias económicas entre regiões, ou se o processo de evolução

tende para a convergência, o que corresponde a uma atenuação dos

desequilíbrios.

A leitura estática de uma estrutura não pode, por isso, dispensar

a sua caracterização dinâmica, que constitui um elemento indispensável

de análise. Serão apresentados, a seguir, alguns indicadores de

evolução.

2.2.1 O método de Dunn e a análise de decomposição

O indicador de evolução mais vulgarizado é a taxa de

crescimento que compara os valores assumidos por uma variável em

dois momentos diferentes do tempo.

Para além da análiseestática que os indicadoresanteriores permitem realizar,necessitamos, também, deavaliar o comportamento, notempo, das estruturas.

Existe uma multiplicidade deindicadores de evolução.

Representando simbolicamente por xo e x1 os valores assumidos

pela variável x (produto, emprego, etc.) em determinado espaço, nos

momentos inicial e final do período em análise, a taxa de crescimento ,

define-se pelo quociente:

δ = x - x

A taxa de variação temporal ou de crescimento δ constitui um

instrumento básico, utilizado por diferentes métodos, para analisar e

explicar a evolução dos desequilíbrios.

Se tomarmos para espaço padrão um conjunto de regiões14 e se

δ, calculada em (1), for a evolução padrão, poderemos comparar a

evolução real da região com a evolução que teria se os valores iniciais

evoluíssem de acordo com a taxa de crescimento do espaço padrão.

Podemos estimar o valor assumido pela variável x, numa região

r e no momento 1, se porventura tivesse evoluído de acordo com a

taxa de crescimento do padrão, do seguinte modo:

�xr1 = x (1+ )r

0 δ (2)

�xr1 - dá o valor que assumiria a variável x no espaço r, se tivesse

evoluído segundo o ritmo do espaço padrão.

Comparando �xr1 com xr

1 (valor realmente observado pela

variável x na região r e no momento 1) - podemos concluir se a

situação da região se afastou ou aproximou da do conjunto de regiões.

Ao desvio ∆ r calculado como se segue:

∆ r r1

r1= x - x � (3)

A definição de taxa decrescimento.

A evolução da região deacordo com o espaço

padrão.

A definição de variaçãolíquida regional.

2.2.1 O MÉTODO DE DUNN E A ANÁLISE DE DECOMPOSIÇÃO 21

chama-se variação líquida regional e constituí uma primeira medida

de análise da atenuação ou acentuação dos desequilíbrios regionais

existentes. Embora no conjunto das regiões os desvios se compensem,

x x xr rrr

1 1 1= =∑∑ � ,

a análise individualizada dos ∆ r permite comparar a similaridade de

evoluções da região r e a do espaço padrão. Se ∆ r é positivo a

situação da região melhora, em relação ao padrão, deteriorando-se no

caso de ser negativo.

Pode chegar-se a uma conclusão equivalente trabalhando com

taxas de crescimento. Comecemos por definir xr1 .

x = x (1 + )r1

rδ (4)

Substituindo em (3), xr1 por (4) e �xr

1 por (2) obtem-se

facilmente:

δ δ δ δr r= + ( - ) (5)

Esta expressão permite identificar, na taxa de evolução real da

região r, duas componentes: a primeira, associada ao comportamento

global, é constituída por δ (taxa de crescimento segundo a norma); a

segunda, (δ r - δ), representa um diferencial entre o comportamento da

região r e o comportamento correspondente do conjunto das regiões.

Quanto menor for este diferencial, maior será a semelhança do

comportamento evolutivo da região r com o do espaço padrão.

14Que pode ser uma nação ou um espaço de integração económica de nações, como

por ex., a União Europeia.

A análise em termos de taxasde crescimento.

A evolução dos desequilíbrios pode, assim, ser estudada, quer

através da análise dos desvios considerados em valor absoluto (as

variações líquidas ∆ r ), quer em termos relativos, através da diferença

de taxas de crescimento (δ r -δ).

À análise dos desvios, quer em termos absolutos, quer em termos

relativos, dá-se a designação de Método de Dunn. Trata-se de um

método de decomposição, que procura explicar a evolução regional

através da evolução nacional e dos desvios que a evolução da região

apresenta em relação àquela.

O método de Dunn pode ser objecto de decomposições mais

finas, por sectores de actividade e por regiões. Com elas pretende-se

aprofundar a explicação e a origem dos desequilíbrios.

Exemplificando, se retomarmos a variável x e caso seja possível

a sua desagregação por sectores j (j=1,2,...,J) e regiões

r (r=1, 2,...,R), teremos:

x = x = x rr=1

r jj =1

∑ ∑∑

Assim, a identidade expressa em (5) pode apresentar a seguinte

forma:

rj j rj j = +( - )+( - )δ δ δ δ δ δ , (6)

o que significa que a taxa de crescimento do sector j na região r pode

ser decomposta em três parcelas.

A primeira está associada ao crescimento segundo a norma, ou

seja, a taxa do crescimento nacional. A segunda, que relaciona o

comportamento do sector j com o comportamento do conjunto, é

constituída pelo diferencial (δj - δ). A terceira parcela associa o

A análise dos desvios ouMétodo de Dunn.

O Método de Dunn comométodo de decomposições.

2.2.2. A ANÁLISE SHIFT -SHARE 23

comportamento do sector j na região r com o comportamento do

mesmo sector no conjunto das regiões e é representada pelo diferencial

(δ rj -δ j).

Pode haver ainda vantagem na desagregação do sector j em k

sub-sectores. A identidade apresentada em (6) assume, então, a

seguinte forma:

rjk j jk j rjk jk= +( - )+( - ) +( - )δ δ δ δ δ δ δ δ , (7)

com significado semelhante.

A expressão apresentada em (6) pode ser objecto de outras

decomposições, conforme os objectivos do estudo. Assim, se se

pretende dar maior realce à perspectiva regional, a componente δ rj

pode apresentar a seguinte desagregação:

rj r rj r = + ( - ) + ( - ) δ δ δ δ δ δ , (8)

onde se procura destacar primeiro, o comportamento da região no

conjunto e, depois, o comportamento regional do sector j na estrutura

da região.

No ponto seguinte vai-se procurar aprofundar o significado do

diferencial (δr - δ), o que vai permitir obter resultados interessantes,

tanto do ponto de vista da análise, como do ponto de vista da

fundamentação de medidas de política económica.

2.2.2. A análise shift-share

Se se pretender aprofundar o significado dos desvios,

nomeadamente o do comportamento da região, em relação ao

comportamento nacional, pode-se analisar o diferencial (δr - δ) com

A análise shift-share abrepara a análise anterior novavirtualidades.

maior pormenor, procurando identificar nele elementos de análise que

aparentemente esconde.

A taxa de crescimento da região r pode ser representada da

seguinte forma:

rj rj rjrr

j jr r rj r

rjrj rj rj

x x x x = = = =

x x x x

∆ ∆∆ ×∑ ∑

∑ ∑(9)

onde srj é o peso do sector j, no conjunto da actividade da região r, ou

seja uma componente estrutural da região.

De forma idêntica, a taxa de crescimento do conjunto de regiões

em que r se integra pode representar-se por:

jj j j

x x x x = = = =

x x x x

∆ ∆∆ ×∑ ∑

∑ ∑(10)

onde sj é uma componente estrutural, ou seja, o peso do sector j , no

conjunto da actividade do espaço global considerado. Se

multiplicarmos cada uma das componentes estruturais s rj pela taxa de

crescimento, segundo a norma, δj, obtém-se:

x s = =j

j rj j

'∆∑ ∑ δ δs (11)

em que δ r' representa a taxa de crescimento da região r admitindo,

que cada sector tem comportamento idêntico na região e no espaço

global considerado.

De (9) e (10) resulta que:

r rj rj j jj j

- = s - sδ δ δ δ∑ ∑ (12)

Somando e subtraindo δ r' tem-se uma nova representação para

aquele diferencial:

r rj rj j rj j rj j jj j j j

' 'r r r

rj j rj rj j jj j

- = s - + ( s - s )

= ( - ) + ( - ) =

= ( - ) s + ( s - s )

sδ δ δ δ δ δ

δ δ δ δδ δ δ

∑ ∑ ∑ ∑

∑ ∑(13)

O 2º membro desta expressão tem 2 componentes:

rj j rjj

rj j jj

( - ) s

( s - s )

A primeira é a soma de um conjunto de elementos, em que cada

um, é o resultado de se fazer evoluir o peso (estrutura) do sector j na

economia da região (s rj ), no ano base, segundo uma taxa, que é igual

à diferença entre o valor das taxas do sector, na região r (δrj ) e no

conjunto dos espaços (δj). A variação entre os ritmos de crescimento

da região r e do conjunto dos espaços, é explicada (nesta componente)

pela diferença de taxas de crescimento sectoriais (regionais e do país),

para uma estrutura constante. Por isso, se designa esta componente por

componente regional15.

Ainda que o peso relativo de cada sector na actividade

económica da região permanecesse constante, poderia haver um desvio

15Esta componente tanto pode ser positiva como negativa. Dado que o termo s rj é

sempre positivo, a primeira hipótese verifica-se quando, globalmente, os sectores têm naregião um dinamismo superior ao do país, verificando-se o contrário na segunda hipótese.Esta é a razão pela qual esta componente é , por vezes, também designado por componentedinâmica.

O significado dacomponente regional.

entre a taxa de crescimento regional e a taxa de crescimento no país,

com origem em desvios entre as taxas sectoriais de crescimento, na

região e no espaço global16.

Do mesmo modo que na componente regional também a

componente estrutural pode ser positiva ou negativa. Admitindo que

δj é positivo, o primeiro caso está presente quando os desvios positivos

entre os pesos de cada um dos sectores, multiplicados pelas taxas de

crescimento nacionais, mais do que compensam os desvios negativos,

multiplicados também pelas respectivas taxas nacionais. O segundo

caso acontece quando essa compensação não é possível.

A segunda componente é a soma de um conjunto de elementos

em que cada um é o resultado de se fazer evoluir a diferença entre os

pesos de um sector j , na actividade da região (srj ) e do país (sj),

segundo uma taxa que é igual à taxa de crescimento do sector no país

(δj). Como o elemento dinâmico é nesta componente a estrutura, ela é,

habitualmente designada por componente estrutural17. Pode haver um

desvio entre as taxas de crescimento da região e do país, mesmo

quando não há desvios entre as taxas sectoriais, da região e do país,

bastando para tanto que sejam diferentes os pesos de cada um dos

sectores no conjunto da actividade económica, da região e do país.

Resumindo, tem-se :

= + ( - )s + (s - s )r rjj

j rj rjj

j jδ δ δ δ δ∑ ∑ (14)

16O que não significa que não se tivesse modificado a sua importância em valor

absoluto. Assim também se compreende a importância que na análise deve ser atribuída acada um dos elementos do somatório.

17 Do mesmo modo que na componente regional também a componente estruturalpode ser positiva ou negativa. Admitindo que δ j é positivo, o primeiro caso está presentequando os desvios positivos entre os pesos de cada um dos sectores, multiplicados pelastaxas de crescimento nacionais, mais do que compensam os desvios negativos, multiplicados

O significado da componenteestrutural.

O crescimento regional podeser decomposto em três

componentes.

isto é, o crescimento regional pode ser explicado através de três

componentes:

a) A primeira componente é o crescimento segundo a norma, δ

b) A segunda componente indica a dinâmica regional de

crescimento - r j jδ δ , para uma dada estrutura s rj .

c) A terceira componente explica o crescimento, por uma

variação estrutural (srj -sj) na região, dada uma taxa de

crescimento nacional para o sector j, δj .

Para além de ser conhecida pela designação de Análise Shift-

Share, este tipo de análise de decomposição tem também sido

divulgado com o nome de método de alteração-proporcional.

Tem sido frequentemente utilizado em estudos de economia

regional, como instrumento analítico de interpretação da evolução das

estruturas regionais, nomeadamente em estudos demográficos e de

estrutura industrial. Enquanto apoio à compreensão do significado da

dinâmica regional este tipo de estudos torna-se um excelente suporte à

formulação de medidas de política económica.

O instrumento de análise que acaba de ser apresentado é,

também, susceptível de representação gráfica, o que permite obter uma

imagem sugestiva do peso relativo de cada uma das componentes na

explicação do desvio total encontrado. Admitamos que se tinha

observado um valor de 0,05 para a componente regional e um valor de

0,10 para a componente estrutural. O desvio total seria igual a 0,15 e a

representação gráfica que daí resultaria seria a do gráfico da página

seguinte.

também pelas respectivas taxas nacionais. O segundo caso acontece quando essacompensação não é possível.

0-25 -20 -15 -10 -5 5 1 0 1 5 2 0 2 5

C O M P O N E N T E R E S I D U A LO U

D E S V I O T O T A L

C O M P O N E N T E R E G I O N A LC O M P O N E N T E E S T R U T U R A L

M É T O D O " S H I F T - S H A R E "

A interpretação do gráfico é quase imediata, pelo que se não

fazem comentários adicionais. Repare-se, apenas, que a projecção do

vértice obtido pela representação das componentes regional e

estrutural no eixo do desvio total, dá-nos exactamente o valor desse

desvio.

2.3.1. A ANÁLISE FACTORIAL 29

2.3. INDICADORES DE SÍNTESE

Ao analisarmos o espaço associado a um determinado território,

podemos considerá-lo, de forma diferenciada integrando projecções

de âmbito geográfico, social, cultural, económico ou físico, ou numa

perspectiva indiferenciada, enquanto espaço geométrico abstracto

que, como sabemos, é utilizado como ponto de partida das reflexões

teóricas da economia espacial.

Nesta perspectiva, cada ponto do espaço abstracto euclidiano

pode ser representado por coordenadas espaciais multidimensionais.

O facto de existirem inúmeras variáveis associadas a cada ponto

do espaço, leva-nos a procurar técnicas de redução da informação e a

construir indicadores de síntese que nos permitam ter em conta o

máximo de informação relevante e assim, mais fácil e correctamente,

estabelecer comparações entre as diferentes unidades em análise.

2.3.1. A análise factorial

A análise factorial é uma técnica estatística de simplificação da

informação, utilizada para representar as relações entre um conjunto de

variáveis, através de um menor número de características, designadas

por factores. Deste modo, procura-se salientar as dimensões

fundamentais (ou factores) que podem estar subjacentes a um

fenómeno de natureza complexa.

Com a análise factorial18 visam-se dois objectivos principais:

18 Esta técnica foi originalmente desenvolvida pelo psicólogo Spearman (1904) com

o objectivo de estudar o factor inteligência indirectamente, a partir de uma multiplicidadede variáveis.

A análise factorial é umatécnica estatística desimplificação da informação

Objectivos principais:

- Reduzir o número de variáveis iniciais, através do agrupamento

de variáveis, que estão altamente correlacionadas, eliminando

a informação que possa ser considerada como redundante,

garantindo, assim, que há uma perda mínima de informação;

- Evidenciar a estrutura fundamental implícita nos dados iniciais,

através de um menor número de factores independentes, que

representam as variações das observações originais num

espaço multidimensional.

A análise factorial desenvolve-se a partir de uma matriz inicial de

informação (X) que compreende J variáveis e R observações de cada

uma das J variáveis.

Ao longo desta secção a apresentação da análise factorial está

estruturada em torno de um exemplo, com base numa matriz de

informação regional, referente às 28 NUTS III do Continente (R=28),

ver Fig. 1, e com informação sobre um conjunto de 10 variáveis,

apresentadas no Quadro 1 (J=10).

- Reduzir o número devariáveis através do

agrupamento de variáveis,que estão altamente

correlacionadas.

- Evidenciar a estruturafundamental implícita nos

dados iniciais

A análise factorialdesenvolve-se a partir de

uma matriz inicial deinformação

Figura 1- Continente (NUTS III)

MINHO-LIMA

CAVADO

GRANDE PORTO

TAMEGA

ENTRE DOURO E VOUGA

ALTO TRAS-OS-MONTES

BAIXO VOUGA

BAIXO MONDEGO

PINHAL LITORAL

PINHAL INT. NORTE

DAO-LAFOES

PINHAL INTERIOR SUL

SERRA DA ESTRELA

BEIRA INTERIOR NORTE

BEIRA INTERIOR SUL

COVA DA BEIRA

GRANDE LISBOA

PENINSULA DE SETUBA

MEDIO TEJO

LEZIRIA DO TEJO

ALENTEJO LITORAL

ALTO ALENTEJO

ALENTEJO CENTRAL

BAIXO ALENTEJO

ALGARVE

Este texto procura seguir a apresentação dos resultados da

análise factorial, através da utilização dos outputs do software SPSS

for Windows19. Optou-se por ao longo do texto, mostrar apenas parte

do output gerado por este package estatístico, deixando para o fim a

referência aos procedimentos e opções do SPSS necessários à obtenção

da análise factorial. Em anexo, apresenta-se o output integral gerado

pelo SPSS (Anexo A.1.).

19 A exemplificação é efectuada sobre a versão 6.0 para ambiente Windows.

Quadro 1. Lista dos indicadores utilizados20

Dpopul Densidade populacional (milhares de pessoas /km2)

VABpcap Valor Acrescentado Bruto per capita (em contos, ano de 1991)

Produtiv Produtividade do Emprego (em contos, 1991)

Celectr Consumo Doméstico de Electricidade (Kwh/Habit)

Lespec Peso do Emprego Especializado no Emprego Total

Sercom % do Emprego nos Sectores do Comércio e Turismo

Mortinf Taxa de mortalidade Infantil

Camhosp Número de camas de hospital por 1000 habit.

EmNOX Emissões de Nox (Kg/km2)

Abastag % população servida por água da rede publica

A. Operações prévias

As variáveis associadas a cada uma das unidades espaciais em

estudo fornecem, na generalidade dos casos, informações cuja

compatibilização não é imediata devido a questões ligadas, quer à

natureza das variáveis, quer às unidades de medida utilizadas.

Se em relação às limitações que decorrem da natureza das

variáveis não é possível eliminá-las, já em relação às que e são

consequência das unidades de medida utilizadas é possível a sua

correcção através das operações de relativização da dimensão

territorial e de normalização das variáveis.

A relativização da dimensão territorial21 é uma operação,

prévia à normalização, que visa transformar o valor de cada uma das

variáveis tendo em conta a dimensão do espaço considerado.

20 No anexo A.2 apresenta-se a base de dados com os valores das variáveis para

todas as regiões.21 Há autores, ver por exemplo PAELINCK e NIJKAMP(1975), que designam esta

transformação por estandardização das variáveis. No entanto, optou-se por esta designaçãopara diferenciar da operação de estandardização “estatística” que corresponde a uma formade normalização e por isso apresentada mais adiante.

Problemas decompatibilização das

variáveis

As operações prévias:

- a relativização da dimensãoterritorial ;

- normalização das variáveis

A relativização da dimensãoterritorial: a consideração

da dimensão das regiões.

Tomemos como ponto de partida a seguinte matriz:

Variáveis

1 ... j ... J

i r xrj X’r

õ ...

em que:

X’r é um vector (linha) que explicita a estrutura da região; e

Xj é um vector (coluna) que explicita a dispersão de uma dada

variável através das regiões.

O facto das regiões r e r' terem diferentes dimensões (por ex. em

termos de Km2, população residente, número de trabalhadores, etc.),

pode originar diferentes configurações estruturais cujos inconvenientes

se ultrapassam relativizando os indicadores, isto é, tomando a mesma

unidade relativa de medida em todas as regiões (por exemplo,

população por Km2, produto per capita, número de telefones por mil

habitantes, etc.). A superfície, a população e o emprego, são

geralmente os indicadores de dimensão mais utilizados.

Assim, se Drj for o indicador de dimensão apropriado para a

variável xrj , a relativização da dimensão territorial obtem-se da seguinte

forma:

A escolha do indicador dedimensão.

Esta operação não evita, contudo, resultados distorcidos, pois as

variáveis estão muitas vezes expressas em unidades de natureza

diferente (escudos per capita, percentagens, etc.), o que pode levar a

que uma delas domine outra ou as restantes. Para evitar este problema

e eliminar os efeitos de dominância de algumas variáveis em relação às

restantes, deverá proceder-se à operação de normalização.

Com a normalização homogeneízam-se as escalas de medida das

diferentes variáveis, mantendo-se, no entanto, as proporções

interregionais em cada variável. Deste modo, viabilizam-se as

comparações inter-variáveis em cada espaço. Das transformações

alternativas de normalização das variáveis, apresenta-se seguidamente

duas das hipóteses mais utilizadas:

i) Transformação, da variável (Xj*) de modo a que a média seja

igual a zero e o desvio padrão igual a 1.22

Neste caso, a variável normalizada (Xj** ) obtem-se,

transformando o valor da variável Xj* para cada uma das

regiões r, do seguinte modo:

srjrj j

em que X j* representa a média da variável Xj

*, ou seja:

= =∑

e sx j* o desvio padrão da variável Xj

*, que é dado por:

22 Também designada por operação de estandardização da variável.

As diferentes unidades demedida das variáveis: a

operação de normalização.

Diferentes métodos denormalização das variáveis

Estandardização davariável: Média zero e

desvio padrão igual a um.

( )* *

ii) Transformação das variáveis atribuindo a todos os vectores de

variáveis um mesmo comprimento.

A operação que conduz a um tal resultado consiste numa

transformação em que cada vector (Xj*) é dividido pela sua

norma (ou comprimento) ||Xj* ||.

O comprimento do vector (a sua norma) associa-se ao

conceito de distância do vector à origem. Assim o

comprimento, ou norma euclidiana de um vector x

representa-se por || Xj*|| e é dado por:

X X X Xj j j rjr

R* * * *=

sendo, por convenção, tomado o valor positivo da raiz.

A variável normalizada, representa-se por Xj** e define-se

B. O modelo da análise factorial

O modelo estatístico da análise factorial é em parte semelhante

ao modelo de regressão linear múltipla. Cada uma das variáveis é

expressa através de uma combinação linear dos factores que não são

observáveis, à partida. Por exemplo, a variável, VAB per capita

(VABpcap) pode ser expressa do seguinte modo:

VAB a rica b urban c socind Upcap VABpcap= + + +( ) ( ) ( ) (1)

Transformação das variáveisatribuindo a todos osvectores de variáveis ummesmo comprimento

As variáveis são expressaatravés de uma combinaçãolinear dos factores comuns(que não são observáveis, àpartida)

Esta equação difere da equação de regressão linear múltipla uma

vez que os factores rica, urban e soeco não são variáveis

independentes simples, mas representam designações de agrupamentos

de variáveis23, determinados através da análise factorial.

Rica, urban e soeco são designados por factores comuns já que

todas as variáveis originais são expressas em função destes factores. A

variável UVABpcap é designada por factor único uma vez que representa

a parte do VABpcap que não pode ser explicada através dos factores

comuns, assumindo-se como uma variável residual de natureza

aleatória.

Em geral, a equação para j-ésima variável Xj apresenta-se do

seguinte modo:

X b F b F b F Uj j j jK K j= + + + +1 1 2 2 ... (2)

onde F1, F2, ...,FK são os factores comuns, Uj a variável residual e

bj1,..,bjK os coeficientes utilizados na combinação dos K factores.

Admite-se que os factores únicos (U1,U2,...,UJ) não estão

correlacionados, entre si, nem com os factores comuns.

Os factores comuns, determinados a partir das variáveis

originais, são estimados como combinações lineares destas variáveis.

Por exemplo, a estimação para o factor grau de riqueza (rica) pode ser

representada como

rica w Dpopul w VAB w Abastagpcap= + + +1 2 10... (3)

Em geral, a expressão para estimar o i-ésimo factor, Fi pode

escrever-se do seguinte modo:

23 Mais adiante teremos oportunidade de identificar as variáveis e os factores

comuns.

A expressão da j-ésimavariável X em função dos

factores

F w X w X w X w Xi ij jj

i i iJ J= = + + +=

1 1 2 2 ... (4)

Em que os wi,j representam os valores dos coeficientes das

variáveis e J o número de variáveis originais.

À partida todas as variáveis inicialmente consideradas devem

contribuir para a estimação dos diferentes factores. No entanto,

identificados os coeficientes (w) que apresentam maiores valores

absolutos já é possível encontrar subconjuntos de variáveis que

permitem caracterizar os factores comuns.

C. As Etapas da Análise Factorial

A análise factorial compreende fundamentalmente quatro etapas:

i) Na primeira, procura testar-se a possibilidade de utilização

desta técnica estatística; recorre-se às matrizes dos

coeficientes de correlação para verificar o grau de associação

entre variáveis e concluir em que medida é possivel a

utilização da análise factorial;

ii) A segunda, corresponde à extracção dos factores, ou seja,

escolha do modelo de ajustamento a utilizar e determinação

dos factores a serem considerados na representação da

informação inicial;

iii) Na terceira, procede-se à rotação dos factores com objectivo

de melhor evidenciar a estrutura fundamental dos dados

iniciais e interpretar o significado dos factores comuns

considerados;

A estimação dos factorescomuns

A caracterização dosfactores comuns em funçãodos coeficientes associadosàs variáveis

As etapas da análisefactoriali) Avaliação da possibilidadede utilização da análisefactorial.

ii) A extracção dos factores

iii) A interpretação dosfactores

iv) Na quarta, os valores dos factores são determinados para as

diferentes observações das variáveis (regiões); estes valores

podem ser utilizados em análises posteriores.

C.1. Análise da Matriz dos Coeficientes de Correlação

Com base na matriz X, com informação inicial referente às J

variáveis e aos R indivíduos (regiões), calculam-se vários indicadores e

constroem-se as matrizes dos coeficientes de correlação simples (C) e

das variâncias-covariâncias (S).

O coeficiente de correlação simples entre as variáveis Xj e Xk é

calculado do seguinte modo:

( )( )

rj j rk kr

X X X Xr

R s s=

− −=

∑�

Com base nos diferentes rjk, assim obtidos, constroi-se a matriz

dos coeficientes de correlação simples:

... ... ... ...

A covariância entre duas variáveis Xj e Xk representa-se por sjk e

é definida do seguinte modo:

X X X X

rj j rk k

− −

∑( )( )

iv) A determinação dosvalores dos factores

1ª Etapa

As matrizes dos coeficientesde correlação simples e das

variâncias-covariâncias

O coeficiente de correlaçãosimples.

A covariância.

No caso de j=k obtem-se a variância da variável Xj ,ou seja, sj2. É

igualmente possível contruir a matriz S das variâncias e covariâncias24:

p p pp

11 12 1

21 22 2

... ... ... ...

Da observação das definições dos coeficientes de correlação e

das covariâncias, conclui-se que os coeficientes de correlação podem

ser interpretados como covariâncias normalizadas, uma vez que é

possível expressar os coeficientes de correlação em função das

covariâncias. Com efeito:

s sjkjk

A matriz dos coeficientes de correlação entre as 10 variáveis,

acima referidas, é apresentada na Fig. 2. Tendo em conta que, um dos

principais objectivos da análise factorial é obter um conjunto de

factores que possam explicar as correlações entre as variáveis,

facilmente se conclui que, a utilização desta técnica estatística

pressupõe que as variáveis originais devam estar significativamente

correlacionadas entre si.

24 No sentido de facilitar a representação da matriz das variâncias e covariâncias

utiliza-se igualmente o simbolo sii como forma alternativa a si2 na representação da

variância.

Os coeficientes decorrelação podem serinterpretados comocovariâncias normalizadas

A análise factorial exige umaelevada correlação entre asdiversas variáveis iniciais

Figura 2 - Matriz de correlações entre as variáveis

Correlation Matrix:

DPOPUL VABPCAP PRODUTIV CELECTR LESPEC SERVCOM ABASTAG

DPOPUL 1,00000VABPCAP ,63716 1,00000PRODUTIV ,40191 ,68317 1,00000CELECTR ,53785 ,62147 ,39207 1,00000LESPEC ,47605 ,27885 ,22480 ,25592 1,00000SERVCOM ,42376 ,66116 ,51687 ,62643 ,33645 1,00000ABASTAG ,28452 ,53012 ,48348 ,50281 ,07892 ,50948 1,00000CAMHOSP ,17519 ,14336 ,16880 ,34608 ,26599 ,09185 ,38710MORTINF ,01937 -,43109 -,39719 -,21592 -,30057 -,33680 -,24591EMNOX ,56675 ,54401 ,53214 ,42609 ,49516 ,44790 ,41424

CAMHOSP MORTINF EMNOX

CAMHOSP 1,00000MORTINF -,29996 1,00000EMNOX ,05382 -,16529 1,00000

Uma das formas de avaliar a possibilidade de utilização da análise

factorial faz-se através do recurso ao teste de Bartlett, em que se testa

a hipótese da matriz dos coeficientes de correlação ser uma matriz

identidade (todos os elementos da diagonal são iguais a 1 e os restantes

iguais a 0). Da observação da figura 3 verifica-se que o valor do teste

está associado a um nível de significância muito reduzido pelo que se

rejeita a hipótese de se estar perante uma matriz identidade.

Figura 3- Estatística de KMO e teste de Bartlett

Kaiser-Meyer-Olkin Measure of Sampling Adequacy = ,70768

Bartlett Test of Sphericity = 120,59010, Significance = ,00000

Outro indicador que deve ser tido em conta na avaliação da

possibilidade de utilização da análise factorial é o coeficiente de

correlação parcial. Este indicador de associação mede a intensidade

da relação entre duas variáveis após a exclusão dos efeitos de terceiras

variáveis.

Deste modo, como a análise factorial exige que as diferentes

variáveis estejam todas muito correlacionadas entre si, os coeficientes

de correlação parcial, entre pares de variáveis, excluindo os efeitos das

O teste de Bartlett.

O coeficiente de correlaçãoparcial

restantes variáveis, devem apresentar valores próximos de zero. Os

simétricos dos coeficientes de correlação parcial são apresentados na

matriz anti-imagem (ver figura 4).

Figura 4 - Matriz anti-imagem

DPOPUL VABPCAP PRODUTIV CELECTR LESPEC SERVCOM ABASTAG

DPOPUL ,65488VABPCAP -,57106 ,74020PRODUTIV ,01032 -,32848 ,86127CELECTR -,16577 -,19472 ,17122 ,81742LESPEC -,39475 ,23169 ,12399 ,15003 ,54764SERVCOM ,09163 -,19109 -,13223 -,41023 -,29493 ,79655ABASTAG ,15479 -,18820 -,06817 -,03069 ,26422 -,27438 ,74212CAMHOSP -,16749 ,23693 -,11695 -,34334 -,27267 ,31141 -,45389MORTINF -,54637 ,49365 ,12444 -,04932 ,35563 ,04185 -,11056EMNOX -,15951 -,01269 -,29393 -,12215 -,42013 ,10894 -,30271 CAMHOSP MORTINF EMNOXCAMHOSP ,40627MORTINF ,27804 ,49708EMNOX ,30262 -,05790 ,77509

Measures of Sampling Adequacy (MSA) are printed on the diagonal

Tendo por base os coeficientes de correlação simples e os

coeficientes de correlação parcial constroi-se o indicador KMO25 que

compara os valores dos coeficientes de correlação simples com os

coeficientes de correlação parcial:

ijj ii j

≠≠

≠≠ ≠≠

∑∑∑∑ ∑∑

onde rij é coeficiente de correlação simples entre as variáveis Xi e Xj, e

aij é coeficiente de correlação parcial entre as variáveis Xi e Xj.

Se o somatório dos quadrados dos coeficientes de correlação

parcial entre os diferentes pares de variáveis for pequeno, quando

comparado com o somatório dos quadrados dos coeficientes de

correlação simples, então, o indicador KMO está próximo de 1 e a

utilização da análise factorial não oferece grandes problemas.

25 Kaiser-Meyer-Olkin

O indicador KMO

Segundo Kaiser(1974) é possível estabelecer a seguinte

classificação para o valor do indicador KMO:

Figura 5 - Estatística KMO e Utilização da Análise Factorial

KMO Utilização da

Análise Factorial

0.90-1.00 Muito Boa

0.80-0.90 Boa

0.70-0.80 Média

0.60-0.70 Medíocre

0.50-0.60 Muito má

< 0.50 Inaceitável

Utilizando o mesmo princípio é igualmente possível calcular

medidas de adequação da análise factorial para cada uma das variáveis

consideradas individualmente. Para a j-ésima variável a medida de

adequação (MSAj)26 obtem-se do seguinte modo:

≠ ≠

∑∑ ∑

Estas medidas são apresentadas ao longo da diagonal principal da

matriz anti-imagem (ver fig. 4), não devendo ser consideradas na

análise factorial as variáveis que apresentem valores muito próximos de

C.2. Extracção dos factores

Nesta etapa o principal objectivo é determinar os factores

comuns. Entre os vários métodos possíveis para proceder à estimação

dos factores normalmente, o mais utilizado é o método das

26 Measure of Sampling Adequacy.

2ª Etapa

Extracção dos factores

componentes principais27, que passaremos seguidamente a expor de

uma forma abreviada.

C.2.1. O método das componentes principais

O método das componentes principais28 é uma técnica de análise

estatística multivariada, independente da análise factorial, que tem por

objectivo fundamental transformar um conjunto J de variáveis

correlacionadas, num novo conjunto de J de variáveis (combinações

lineares das variáveis originais) não correlacionadas e que explicam,

igualmente, a variância das variáveis originais. As novas variáveis

denominam-se componentes principais e, na explicação da variância

das variáveis iniciais, vêm ordenadas por ordem decrescente da sua

importância.

Toma-se como primeira componente principal (F1) a combinação

linear das variáveis X1, X2 ,...,XJ, que for capaz de explicar a maior

percentagem da variância das variáveis originais, ou seja:

F w X w X w XJ J1 11 1 12 2 1= + + +...

que permita obter a maior variância possível para F1, Var(F1), sujeita à

restrição29:

w w w J2

1 1+ + + =...

A segunda componente principal (F2), é a combinação linear que

explica a segunda maior percentagem da variância das variáveis

originais de tal modo que:

F w X w X w XJ J2 21 1 22 2 2= + + +...

27 Para uma descrição sobre os diferentes métodos de extracção dos factores ver por

exemplo Norusis (1993).28 Primeiramente desenvolvido por Pearson (1901).29 Esta restrição tem o efeito de normalização porque, caso contrário, seria possível

aumentar Var(F1) através de um aumento proporcional dos valores de w1j.

método das componentesprincipais…

transformação das variáveisiniciais em variáveis nãocorrelacionadas - ascomponentes principais.

Primeira componenteprincipal: combinação linearque seja capaz de explicar amaior percentagem davariância das variáveisiniciais.

continuando a ter-se:

w w w J2

2 1+ + + =...

e ainda a restrição de F1 e F2 não estarem correlacionados.

Do mesmo modo, é possível obter as sucessivas componentes

principais que progressivamente vão explicando menores percentagens

da variância do conjunto das variáveis iniciais, mantendo-se as

restrições de normalização e de não correlação entre as diferentes

componentes principais.

Demonstra-se30 que as componentes principais podem ser obtidas

a partir dos valores próprios e dos correspondentes vectores próprios

da matriz de variância-covariâncias (S) sendo que as variâncias das

componentes principais correspondem aos valores próprios da matriz S

e os ponderadores das variáveis aos respectivos vectores próprios.

Ordenando os valores próprios por ordem decrescente de tal

modo que, λ1≥ λ2≥ ...≥ λJ≥ 0, tem-se para o valor próprio λi,

correspondente à i-ésima componente principal (Fi):

F w X w X w Xi i i iJ J= + + +1 1 2 2 ...

Var(Fi)= λi

e wi1,wi2,...,wiJ os elementos do vector próprio correspondente.

Uma propriedade importante dos valores próprios de uma matriz

é que o seu somatório é igual à soma dos valores da diagonal da matriz

S (traço de S), ou seja,

λ λ λ1 2 11 22+ + + = + + +... ...J JJs s s

30 Os desenvolvimentos de alguns resultados seguidamente apresentados podem ser

encontradas em PAELINCK e NIJKAMP (1975) ou em JONHSON e WICHERN (1982).

As componentes principaisobtem-se a partir dos valores

próprios e doscorrespondentes vectores

próprios da matriz devariâncias-covariâncias

Este resultado permite concluir que as componentes principais

consideram toda a variância do conjunto das variáveis originais, uma

vez que a soma das variâncias das componentes principais é idêntica à

soma das variâncias das variáveis iniciais.

Como estas variáveis estão expressas em unidades diferentes e

por isso com valores da variância muito dispares, então deve proceder-

se, previamente, à sua normalização.

Esta transformação tem como resultado que, em vez da matriz

das variâncias e covariâncias (S), se considere a matriz dos coeficientes

de correlação simples (C) na determinação das componentes principais.

Neste caso, o somatório da diagonal principal da matriz, ou seja, do

conjunto dos valores próprios, equivale ao número de variáveis (J) da

matriz (X).

Na figura 6 apresentam-se os resultados da aplicação do método

das componentes principais. A variância total explicada por cada um

dos factores é apresentada na coluna com o título eigenvalue (valor

próprio). As colunas seguintes apresentam as percentagens (individuais

e acumuladas) da variância total atribuível aos factores.

Figura 6 - Estatísticas iniciais

Initial Statistics:

Variable Communality * Factor Eigenvalue Pct of Var Cum Pct *DPOPUL 1,00000 * 1 4,55322 45,5 45,5VABPCAP 1,00000 * 2 1,25539 12,6 58,1PRODUTIV 1,00000 * 3 1,08655 10,9 69,0CELECTR 1,00000 * 4 ,96735 9,7 78,6LESPEC 1,00000 * 5 ,64489 6,4 85,1SERVCOM 1,00000 * 6 ,52147 5,2 90,3ABASTAG 1,00000 * 7 ,34534 3,5 93,7CAMHOSP 1,00000 * 8 ,31696 3,2 96,9MORTINF 1,00000 * 9 ,18355 1,8 98,7EMNOX 1,00000 * 10 ,12529 1,3 100,0

A necessidade denormalização faz com que seconsidere a matriz doscoeficientes de correlaçãoem vez da matriz devariâncias-covariâncias

Note-se que as duas primeiras colunas apresentam informação

sobre as variáveis iniciais e deverão ser consideradas isoladamente, não

existindo qualquer relação pelo facto de uma determinada variável se

encontrar na mesma linha de um qualquer factor. Na segunda coluna, é

explicitada a variância das variáveis iniciais considerada pelo conjunto

das componentes principais, designada por variância comum

(communality) e normalmente representada por h2.

Tendo em conta que a variância do conjunto das componentes

principais é idêntica ao somatório das variâncias das variáveis iniciais,

conclui-se que a variância de cada uma das variáveis originais é

totalmente distribuída pelas diferentes componentes principais, ou seja,

tem-se h2i=1, para i=1,2,...J.

C.2.2. O número de factores a considerar

Após a determinação das componentes principais coloca-se a

questão de saber qual o número de componentes principais a

considerar. Um dos critérios utilizados é o de considerar os factores

em que se verifique a condição Var(Fi)> 1. A justificação para esta

opção resulta do facto de se procurar que os factores consigam captar

uma variância superior à de cada uma das variáveis consideradas

individualmente31.

Alternativamente, a determinação do número de factores a

extrair pode, por exemplo, ser efectuada impondo que pelo menos

sejam considerados os primeiros k factores comuns.

31 Relembra-se que, pelo facto de se considerar as variáveis estandardizadas, a sua

variância é igual a 1.

A variância comum(communality).

O número de factores aconsiderar:

o critério dos valorespróprios maiores que 1.

Utilizando o critério do valor próprio superior a 1, a partir da

figura 6, observa-se que são considerados três factores comuns que no

seu conjunto retêm 69% da variância do conjunto das variáveis.

Com base nestes três factores comuns é igualmente calculada a

matriz dos ponderadores dos factores (factor loadings), ver figura 7,

que permitem expressar as variáveis iniciais estandardizadas em função

dos factores comuns.

Figura 7 - Matriz dos coeficientes dos factores

Factor Matrix: Factor 1 Factor 2 Factor 3

DPOPUL ,70053 ,48540 ,18164VABPCAP ,86711 ,04488 -,22687PRODUTIV ,74318 -,06834 -,24271CELECTR ,75841 -,02954 -,08089LESPEC ,51829 ,20585 ,73858SERVCOM ,77588 ,01907 -,22309ABASTAG ,67181 -,31865 -,30038CAMHOSP ,36037 -,60573 ,46895MORTINF -,45843 ,59430 -,15257EMNOX ,72188 ,38450 ,08915

Assim cada linha da figura 7 apresenta os coeficientes usados

para representar cada uma das variáveis iniciais estandardizadas através

da através dos factores comuns. Por exemplo, a variável VABpcap

estandardizada, representada por ZVABpcap, é expressa em função dos

factores comuns do seguinte modo:

ZVAB F F Fpcap = + + −0 86711 0 04488 0 226871 2 3. . .

No método utilizado na extracção dos factores implica que estes

sejam ortogonais (não estão correlacionados entre si) então os

ponderadores representam os coeficientes de correlação entre as

variáveis e os factores comuns.

Para avaliar a forma como os três factores comuns descrevem as

variáveis originais é possível calcular a proporção da variância de cada

uma das variáveis que é explicada pelo modelo baseado nos factores

A matriz dos ponderadoresdos factores

A representação dasvariáveis através dosfactores comuns.

comuns. Por exemplo, considerando a variável VABpcap, o primeiro

factor retem 75.188% da variância desta variável, que resulta da

elevação ao quadrado do coeficiente de correlação simples entre o

VABpcap e F1 (0.86711)2.

A percentagem total da variância da variável VABpcap retida pelos

modelo baseado nos três factores comuns é 80.537% e que é o

somatório das percentagens explicados pelos diferentes factores

(75.188%+.201%+5.147%).

Como todas as variáveis estão estandardizadas, a proporção da

variância considerada pelos factores comuns, corresponde à variância

comum, h2 de cada uma das variáveis, expressa em %. Assim, os

valores da variância comum para cada uma das variáveis(ver figura 8),

podem variar entre 0 e 1, em que 0 indica que os factores comuns não

retem nada da variância da variável e 1 corresponde à situação em que

toda a variância é explicada pelo conjunto dos factores comuns.

Figura 8 - Estatísticas finais

Final Statistics:

Variable Communality* Factor Eigenvalue Pct of Var Cum Pct *DPOPUL ,75935 * 1 4,55322 45,5 45,5VABPCAP ,80537 * 2 1,25539 12,6 58,1PRODUTIV ,61590 * 3 1,08655 10,9 69,0CELECTR ,58261 *LESPEC ,85649 *SERVCOM ,65212 *ABASTAG ,64310 *CAMHOSP ,71670 *MORTINF ,58663 *EMNOX ,67690 *

C.3. Rotação dos factores

A matriz dos ponderadores dos factores obtida na etapa anterior,

indica as relações entre os factores e as variáveis individuais mas,

normalmente, não permite uma identificação e uma interpretação clara

da associação entre os factores e as variáveis iniciais. Vários factores

estão correlacionados com as mesmas variáveis. Com esta etapa, da

rotação dos factores, pretende-se transformar a matriz dos

ponderadores numa outra que seja mais facilmente interpretável.

Refira-se desde já, que a rotação dos factores não altera os

valores da variância comum das variáveis, apenas redistribui a variância

explicada pelos diferentes factores comuns.

Existe um conjunto variado de algoritmos para proceder a uma

rotação ortogonal dos factores sendo o método mais utilizado o do

varimax32, que procura minimizar o número de variáveis que

apresentam elevados valores nos ponderadores associados a um

determinado factor comum.

O resultado da rotação dos factores é apresentado na figura 10 e

a sua interpretação deve ser efectuada tendo em conta que os

ponderadores representam as correlações entre as variáveis e os

factores. Assim, com base nos valores da matriz da figura 9 é possível

concluir que:

i) O primeiro factor apresenta fortes correlações positivas com as

variáveis VABpcap, Produtiv, Celectr, Sercom e Abastag; estas

variáveis estão todas relacionadas com grau de desempenho

económico conseguido pelas regiões, pelo que se pode falar

do factor relacionado com grau de riqueza regional (rica);

32 Para uma abordagem dos métodos alternativos de rotação ver, por exemplo,

Norusis (1993) ou Johnson e Wichern (1982).

3ª Etapa

A transformação da matrizdos ponderadores comobjectivo de facilitar ainterpretação dos factorescomuns.

O método varimax

A interpretação dos factores

O primeiro factor: o grau deriqueza regional

Figura 9 - Matriz dos coefcientes dos factores após

rotação

VARIMAX converged in 10 iterations.

Rotated Factor Matrix:

Factor 1 Factor 2 Factor 3

DPOPUL ,44727 ,73992 -,10869VABPCAP ,84022 ,30072 ,09475PRODUTIV ,75353 ,16493 ,14451CELECTR ,67285 ,30116 ,19796LESPEC ,00026 ,85788 ,34717SERVCOM ,76434 ,24380 ,09200ABASTAG ,74178 -,05099 ,30044CAMHOSP ,06922 ,13933 ,83216MORTINF -,32730 ,01455 -,69231EMNOX ,52280 ,63181 -,06630

ii) O segundo factor está significativamente correlacionado

(correlação positiva) com Dpopul, Lespec, EmNOX; as três

estão de algum modo ligadas ao nível de urbanização das

regiões, pelo se pode relacionar este factor com o grau de

urbanização regional (urban);

iii) O terceiro apresenta uma forte correlação positiva com a

variável Camhosp e negativa com Mortinf; deste modo,

maiores valores deste factor são sinónimo de melhor

cobertura em termos de indicadores de conforto e de “bem

estar social”, melhor desempnho em termos de indicadores

sociais (socind).

C.4. Estimação dos valores dos factores para diferentes

observações

Como um dos principais objectivos da análise factorial é reduzir

o conjunto de variáveis inicialmente considerado a um pequeno número

de factores então deverá ser possível estimar os valores dos factores

para cada uma das observações (regiões). Estas estimativas podem ser

O segundo factor: o grau deurbanização regional

O terceiro factor: ascondições sociais.

4ª Etapa

A estimação dos valores dosfactores para cada uma das

regiões.

usadas em análises subsequentes para representar os valores assumidos

pelos factores nas diferentes regiões.

Como já anteriormente vimos (equação 4) os valores dos

factores podem ser estimados como combinação linear das variáveis

originais, existindo uma multiplicidade de métodos para estimar os

coeficientes dos factores associados a cada uma das variáveis33.

No caso do modelo de extracção dos factores se basear no

método das componentes principais, os três métodos disponíveis no

SPSS (Anderson-Rubin, regression e Bartlett) produzem os mesmos

resultados, verificando-se sempre que a média dos valores assumidos

por cada um dos factores é igual a 0.

Na figura 10 apresenta-se a matriz dos coeficientes dos valores

dos factores34, a partir da qual é possível determinar os valores dos

factores para cada uma das regiões.

Figura 10 - Matriz dos coeficientes das variáveis

Factor Score Coefficient Matrix:

Factor 1 Factor 2 Factor 3DPOPUL ,01023 ,40633 -,18950VABPCAP ,27238 -,02389 -,07987PRODUTIV ,26342 -,09834 -,02102CELECTR ,18064 ,01907 ,02909LESPEC -,29786 ,59718 ,23779SERVCOM ,25510 -,04315 -,06696ABASTAG ,29204 -,25488 ,11125CAMHOSP -,14901 ,04743 ,63317MORTINF -,03192 ,12864 -,48620EMNOX ,06667 ,30664 -,16493

Para se perceber o modo como os valores dos factores para as

diferentes regiões são calculados apresenta-se no Quadro 2 os valores

das dez variáveis estandardizadas, relativas a 4 NUTS III, e os valores

assumidos pelos três factores.

33 Ver Tucker (1974).

Quadro 2 - Variáveis estandardizadas e coeficientes dos factores

Regiões (NUTS 3)

Variáveis Grande Porto GrandeLisboa

Beira InteriorNorte

BaixoAlentejo

ZDpopul 2.49722 4.08456 -.49074 -.52315

ZVABpcap 1.50955 2.65353 -1.03993 -.03344

ZProdutiv .06351 2.21994 -.37701 -1.55323

ZCelectr 3.79242 .84826 -.75019 -.44963

ZLespec 1.12427 1.52945 -.75026 -.18923

ZSercom 1.01324 1.86990 -.39774 .15657

ZAbastag 1.01290 1.74609 .02642 .33303

ZCamhosp .63720 .81349 .64328 .05362

ZMortinf .57433 -.15664 -.41979 -1.12152

ZEmnox 1.37234 1.70339 .-.43577 -.43766

Factor Score

F1- rica 1.33614 2.03131 -.95184 -.42538

F2- urban 1.93913 2.32256 .14957 -.32217

F3- socin -.27477 -.26495 1.05341 .84437

Assim o valor do primeiro factor F1,rica, para a região Grande

Porto (1.33614) resulta de:

1.33614 = (0.01023) (2.49722) + (0.27238) (1.50955) + ...

+ (0.06667) (1.37234)

34 Esta matriz é calculada com base na matriz dos factores após a rotação (T),

apresentada na figura 9, e corresponde a: T(T’T)-1.

D. Procedimentos e opções no SPSS

A obtenção do exemplo utilizado ao longo do texto requer os

seguintes procedimentos e opções seleccionados através do sistema de

menus:

1- Abertura do ficheiro com as variáveis originais:

FILE ...

OPEN...

DATA...

2- Selecção do Procedimento análise factorial

STATISTICS ...

DATA REDUCTION...

FACTOR.....

3- Selecção das variáveis a submeter à análise factorial

4- Selecção das seguintes opções na janela Descriptives:

INITIAL SOLUTION

COEFFICIENTS

KMO AND BARTLETT’S TEST OF SPHERICITY

ANTI-IMAGE

5- Selecção das seguintes opções na janela Extraction :

Method: PRINCIPAL COMPONENTS

Extract: EIGENVALUES OVER 1

Display: UNROTATED FACTOR SOLUTION;

6- Selecção das seguintes opções na janela Rotation:

Method: VARIMAX

Display: ROTATED SOLUTION;

7- Selecção das seguintes opções na janela Scores:

SAVE AS VARIABLES

Method: REGRESSION

DISPLAY FACTOR SCORE COEFFICENT MATRIX

2.3.2. A distância económica

O conceito de distância desenvolvido em análise vectorial é a

base de cálculo do indicador abstracto de distância económica entre as

regiões, desde que se considere que cada região r é caracterizada por

um vector cujos elementos representam um conjunto de características

regionais (por ex. indicadores do rendimento per capita, grau de

urbanização, grau de industrialização, etc.).

Um país composto por R regiões elementares (r = 1 … R) pode

ser morfologicamente caracterizado pela matriz X** . O elemento

genérico da matriz [ ] x rj** representa o valor da j -enésima variável

(relativizada e normalizada) na r-enésima Região.

Note-se que xr**' nos fornece indicações acerca da estrutura

económica da região r, enquanto x j** dá o quadro de distribuição

espacial da variável j .

Variáveis1 ... j ... J

eg ...i r x**

rj X**’r

õ ...e Rs X**

Cada vector xr**' pode ser representado por um ponto num

espaço euclidiano J-dimensional, enquanto cada vector x j** pode ser

representado através de um ponto num espaço R-dimensional.

Aplicação do conceito dedistância desenvolvido em

análise vectorial

2.3.2. A DISTÂNCIA ECONÓMICA 55

Atendendo a que num espaço vectorial linear J-dimensional a

distância de um ponto à origem deste espaço é igual a:

drr'2 = x = x xr j

r**'∑

dro = ( x x ) = || x ||r**'

A distância económica em relação à origem pode, em certas

circunstâncias ser entendido como um índice sintético de

desenvolvimento de cada região. Haverá, contudo, que tomar a

precaução de que todas as variáveis consideradas na definição da

distância económica variam no mesmo sentido que o nível de

desenvolvimento (por ex., o nível de escolaridade, a taxa de

investimento, etc.).

O cálculo da distância económica entre duas regiões r e r' é

formalmente idêntico ao do cálculo da distância económica de uma

região em relação à origem.

jr' j** 2

r'** '

r'** 2 = ( x - x ) = ( x - x ) ( x - x ) = || ( x - x ) ||2 ∑ −

drr' = ( x - x ) ( x - x ) = || x - x ||r**

r'** '

A distância económica interregional pode, assim, interpretar-se

como um indicador da similaridade de estruturas socio-económicas de

regiões diferentes. Se existe alguma correspondência entre a estrutura

económica de duas regiões, os valores assumidos pelos indicadores

característicos dessas regiões não apresentam diferenças assinaláveis,

pelo que, a distância económica entre elas (obtida a partir da soma das

A distância à origem…

…como indicador sintéticode desenvolvimento de cadaregião…

…desde que todas asvariáveis variem no mesmosentido que o nível dedesenvolvimento.

O cálculo da distânciaeconómica entre duasregiões...

… a similaridade deestruturas sócio-económicasdas regiões.

diferenças quadradas dos valores que explicitam os diferentes

indicadores) será relativamente baixa.

O número total de distâncias interregionais calculáveis num

sistema de regiões é R(R-1)/2 e não R2, já que R(R-1)/2 são valores

repetidos (a matriz é diagonal) e os R valores da diagonal principal são

nulos35.

Os conceitos de similaridade e de distância económica são

úteis quando se pretende proceder à formação de agrupamentos

(clusters).

2.4. A IDENTIFICAÇÃO E A CLASSIFICAÇÃO DAS

REGIÕES

Se a caracterização da estrutura económica é indispensável para

basear decisões que se pretendem adequadas, torna-se necessária a

delimitação espacial como requisito à definição das políticas regionais.

A delimitação pode e deve apoiar-se em metodologias que tomam

como elemento de base a caracterização de espaços elementares

contíguos.

Como em qualquer metodologia de suporte ao estudo empírico

de fenómenos de natureza sócio-económica, as metodologias definidas

encontram o seu fundamento na teoria. Todavia, a sua aplicação

prática fica sujeita às restrições derivadas da disponibilidade de

informação estatística.

35A distância de r a r' é igual à distância de r' a r.

A delimitação espacial comorequisito à definição das

políticas regionais.

Tais restrições, num estudo de economia espacial, referem-se não

apenas às variáveis, mas também, às próprias dimensões espaciais da

análise.

As implicações das primeiras, serão sentidas ao longo da própria

apresentação das metodologias. Das segundas resulta a necessidade de

uma extensão da definição de espaço elementar, o qual corresponderá

à escala espacial mínima, para a qual existe disponibilidade de

informação estatística.36

Não há uma metodologia única e exclusiva de delimitação de

regiões, há um conjunto de métodos com aplicação na delimit ação de

regiões. Tais métodos assentam numa taxinomia, cujo conhecimento

prévio é necessário antes de se proceder ao trabalho de delimitação das

regiões, isto é, ao trabalho de agrupamento de espaços elementares37.

A delimitação de regiões é um trabalho fundamentalmente

orientado pelos objectivos que se pretendem atingir com essa

delimitação, pois são esses objectivos que irão determinar as

características que interessa destacar nos espaços elementares a

agregar.

Consoante os objectivos, podem-se estabelecer vários tipos de

regiões e, a este propósito, já foram mencionados, anteriormente, as

regiões administrativas, como constituindo uma escala territorial de

intervenção permanente de determinados níveis funcionais da

Administração Pública.

Um critério possível a utilizar na delimitação de regiões

administrativas, para além do da coesão sócio-económica entre espaços

36No caso português corresponde ao concelho e, nalguns casos, à freguesia, ao

distrito ou às NUTS III.37Interessa ter presente alguns conceitos da teoria dos conjuntos: união, intersecção,

axioma da extensão, etc..

A delimitação de regiões éum trabalhofundamentalmente orientadopelos objectivos que sepretendem atingir.

Regiões Administrativas.

A coesão sócio económica eas acessibilidades entreespaços elementares.

elementares, poderia ser o das acessibilidades entre esses espaços. A

preocupação seria a de estabelecer uma administração localizada o

mais perto possível dos administrados: os espaços elementares seriam

assim agrupados de modo a minimizarem as distâncias físicas38 entre

Ao falarmos em regiões homogéneas, dissemos que se tratava

de regiões dotadas de um grau mínimo de uniformidade de

características entre os seus espaços elementares. Tais características

podem ser de natureza económica e social, e acrescentamos que a

delimitação deste tipo de regiões visava, fundamentalmente, objectivos

de equidade. Um critério possível na delimitação destas regiões poderá

ser o da minimização das distâncias económicas entre os respectivos

espaços elementares.

Referimos igualmente as regiões polarizadas, em que o critério

de agrupamento não incide já em características dos espaços

elementares, mas nas relações que os espaços estabelecem entre si.

Deste modo, a definição deste tipo de regiões pretende apoiar a

implementação de políticas de crescimento económico, já que se

procuram destacar os espaços que, por causa de uma maior

complementaridade e inter-relacionamento, são susceptíveis de

maximizar efeitos multiplicadores do investimento e de outras variáveis

macro-económicas.

As metodologias que vamos estudar servem, sobretudo, para a

definição de regiões homogéneas, e ainda de regiões administrativas, se

a sua delimitação assentar maioritariamente em critérios de

homogeneidade e de acessibilidade.

38Naturalmente que representadas pelas vias e meios de locomoção.

Regiões homogéneas

Regiões polarizadas

A delimitação de regiões polarizadas tem sido inspirada pela

análise das matrizes de relações interregionais.

A delimitação de regiões homogéneas corresponde a uma

avaliação de afinidades ou similaridades existentes entre espaços

elementares e na sua subsequente classificação, na base das

similaridades, tendo em vista o seu agrupamento.

Tal classificação deve obedecer a vários critérios39 que

poderemos considerar como princípios operacionais da taxinomia, e

que passamos a mencionar40:

1) A classificação é função do objectivo pretendido; vimos já

que as características a obter para os agrupamentos (regiões)

a formar, dependem dos objectivos de política, e determinam

as características a destacar nos espaços elementares;

2) A classificação baseia-se em características de natureza

diferenciada, o que significa que nenhuma classificação se

deve fundamentar no comportamento de uma única variável.

3) Qualquer classificação, é sempre relativa, pois depende das

hipóteses iniciais e da informação disponível; vimos já que a

informação disponível condiciona o número e tipo de variáveis

a utilizar, bem como a determinação dos espaços elementares;

teoricamente, a delimitação de regiões homogéneas e

polarizadas deveria basear-se em espaços elementares

diferentes, exigindo-se, no primeiro caso, uma elevada

uniformidade interna, não forçosa no segundo caso;

normalmente as restrições de informação não o permitem;

39Aplicáveis também a definição de regiões polarizadas.40Baseando-nos em PAELINCK, J.H. e NIJKAMP, P. (1975).

A delimitação de regiõeshomogéneas corresponde auma avaliação dassimilaridades existentes entrespaços elementares.

4) A classificação deve basear-se nas características actuais41

dos espaços elementares, não havendo, por conseguinte, lugar

para a inclusão de factores históricos;

5) Exaustividade de classificação, ou seja, todos os espaços

elementares devem ser incluídos, ainda que isso signifique

perda de qualidade nos agrupamentos formados;

6) Classificação exclusiva, isto é, os agrupamentos devem ser

disjuntos;

7) Os princípios da classificação devem ser os mesmos em

todas as etapas da análise;

8) As características que separam grandes grupos devem

prevalecer sobre as referentes a pequenos grupos; na

selecção das variáveis; para além da arbitrariedade possível,

este tipo de selecção justifica-se, a nosso ver, por dois

motivos: os objectivos pretendidos que orientam a análise, na

qual a classificação de regiões não é mais do que um passo

intermédio e a necessidade de economia no número e

dimensão das regiões a obter;

9) Podem considerar-se elementos qualitativos, desde que seja

possível estabelecer uma escala de medida, por exemplo, uma

escala ordinal ou uma simples classificação binária;

10) A classificação deve conduzir a uma hierarquia de

classes, como veremos adiante.

A classificação dos espaços elementares, tendo em vista a sua

agregação em regiões, baseia-se na determinação de relações de

similaridade entre esses espaços.

41Com a actualidade que o atraso na produção estatística permite.

A similaridade pode ser entendida como função inversa da

distância económica. Sendo d rr’ a distância económica entre duas

regiões r e r ', o grau de similaridade poderá então ser representado

s rr' = (1 + d rr' ) -1

em que s rr' varia entre 1, valor correspondente à máxima

similaridade (mínima distância, drr' =0) e 0, mínima similaridade

(máxima distância, drr' → ∞.

Quando se dispõem de variáveis quantificadas, a distância

económica é obtida pelo método que vimos anteriormente. Quando se

dispõe apenas de informação qualitativa, a similaridade pode obter-se a

partir de uma matriz de características, em que a ocorrência ou

ausência de ocorrência de cada característica em cada região é

assinalada, respectivamente, com 1 e 0.

Característica

1 2. ... J

R 1 1 0 … 1

e 2 0 1 … 1

g . . .

i . . .

õ . . .

e R 1 1 … 0

Nos casos em que para a característica se pode estabelecer uma

escala de ocorrência, a classificação binária dependerá do

estabelecimento de um limiar (dj) de separação entre o que se

considerará como sendo 1 ou 0:

A similaridade pode serentendida como funçãoinversa da distânciaeconómica

A determinação dasimilaridade quando sedispõe apenas de informaçãode natureza qualitativa.

A construção de uma matrizde características.

1 se y

se y drj

em que y rj é o valor da característica j na região r .

Com base nesta matriz binária, pode-se estabelecer para cada par

de regiões:

Região r’

11rrJ ′

10rrJ ′

Região r 01rrJ ′

00rrJ ′

1rJ ′

0rJ ′ J

em que:

J r r'1 1 - número de características presentes, simultaneamente,

em r e r’ ;

J r r'0 0 - número de características ausentes, simultaneamente, em

r e r’ ;

J r r'1 0 - número de características presentes em r e ausentes em

J r r'0 1 - número de características ausentes, em r e presentes em

r’ ;

J r 1 e J r'

1 - número total de características presentes em r e

em r' , respectivamente:

1 11 10r rr' rr'=J +JJ ;

1 11 01r' rr' rr'J +JJ = ;

J r 0 e Jr'

0 - número total de características ausentes em r e em r' ,

ou seja :

0 01 00r rr' rr'+JJ J= ;

0 10 00r' rr' rr'J +JJ = ;

J - número total de características em análise.

Com os dados anteriores podem-se calcular índices de

similaridade, definidos como42:

* 11 00rr' rr' rr' s =(J +J ) /J )

a partir destes uma matriz de similaridades:

S* = [ * rr's ],

facilmente transformável numa matriz de distâncias económicas

entre regiões, na medida em que sendo:

1=rr' rr's (1+ ) d − ,

então:

d = (1 - s srr' rr'*

rr' * ) / ,

desde que se admita que srr' ≈srr'

42Admite-se que a afinidade entre os espaços elementares tanto resulta da presença

comum de uma característica, como da sua ausência.

A determinação de umindicador de similaridade.

Com base na matriz de similaridades, ou na matriz de distâncias

económicas é possível construir uma matriz de proximidade, onde

cada linha explicita a hierarquia de proximidade de cada região, em

relação às restantes. Para cada região, a proximidade com as outras

será tanto maior, quanto maior for a similaridade que lhes corresponde.

Se o ponto de partida for uma matriz de distâncias económicas,

para cada região, a sua proximidade com as outras variará em sentido

contrário ao valor das distâncias. Os números da matriz de

proximidade explicitam os valores das posições ocupadas, por cada

região, na hierarquia das suas relações com as restantes.

Exemplificando, se tivermos a seguinte matriz de distâncias

económicas43:

Regiões 1 2 3 4 5

1 0 1 8 10 6

2 1 0 7 9 5

3 8 7 0 2 3

4 10 9 2 0 4

5 6 5 3 4 0

A matriz de proximidade associada, é:

Regiões 1 2 3 4 5

1 1 2 4 5 3

2 2 1 4 5 3

3 5 4 1 2 3

4 5 4 2 1 3

5 5 4 2 3 1

43Com base em PAELINCK, J. H. e NIJKAMP, P., op. cit., 201. A metodologia de

cálculo da distância económica será explicitada no ponto seguinte

A construção da matriz deproximidade.

Um exemplo:

2.4.1. A ANÁLISE DE CLUSTERS 65

Será com base nesta matriz e na matriz de distâncias económicas

(ou de similaridades) que, segundo um processo iterativo, se procede à

escolha dos espaços elementares a agrupar.

2.4.1. A análise de clusters

A análise de clusters é uma técnica estatística de agrupamento de

observações de indivíduos baseada na similaridade das suas

características. O ponto de partida é, assim, uma matriz de similaridade

ou de distâncias entre os diferentes individuos.

Este texto procura seguir a apresentação dos resultados da

análise clusters, através da utilização dos outputs do software SPSS for

Windows. Optou-se por, ao longo do texto, mostrar apenas parte do

output gerado por este package estatístico, deixando para o fim a

referência aos procedimentos e opções do SPSS necessários à obtenção

da análise de clusters (no anexo A.3. apresenta-se o output integral

gerado pelo SPSS).

O exemplo apresentado tem por base uma matriz de informação

regional referente às 28 NUTS III do Continente com três indicadores

sobre os graus de riqueza (rica), urbanização (urban) e bem estar

social (socind), ver Anexo A.4., determinados através da aplicação da

análise factorial a um conjunto inicial de dez indicadores, efectuada em

7.2.6..

A análise de clusters é umatécnica de agrupamento deobservações baseada nasimilaridade das suascaracterísticas.

A. Os métodos de análise de clusters hierárquicos44

Os métodos de análise clusters hierárquicos processam-se através

de uma sucessão de aglomeração ou partição de indivíduos. No

primeiro caso, parte-se de uma situação em que o número de clusters é

idêntico ao número de espaços elementares (no exemplo presente, as

28 regiões NUTS III do Continente) e, através da aglomeração dos

espaços mais semelhantes, vai-se progressivamente diminuíndo o

número de clusters até que todas as regiões sejam agrupadas num

único cluster.

Os métodos hierárquicos de partição baseiam-se no princípio

oposto, ou seja, parte-se de uma situação em que todos os espaços

elementares estão agrupados num único cluster para uma situação de

partição em subgrupos, com base nas maiores distâncias entre regiões,

até que se formem tantos clusters quantos os espaços elementares

inicialmente considerados.

O algoritmo dos métodos de aglomeração hierárquica,

compreende fundamentalmente os seguintes passos:

1. Determinação de uma matriz das distâncias { }D dij= , em que

se consideram R clusters, cada um constituído por uma única

observação (região NUTIII)- cluster elementar; a matriz é

simétrica e de dimensão R x R, em que R é o número de

regiões inicialmente consideradas (28 no exemplo utilizado).

44 Para além dos métodos hierárquicos existem um outro conjunto de métodos que

não são objecto de referência neste texto. Entre os métodos não hierárquicos um dosalgoritmos mais utilizados é designado por K-means. Para uma apresentação deste algoritmover por exemplo Johnson e Wichern (1982).

Os métodos de análise declustes hierárquicos:

i) os métodos deaglomeração

ii) os métodos de partição.

O algoritmo dos métodos deaglomeração hierárquica.

1º A matriz das distâncias

2. Extracção na matriz das distâncias do menor dos valores (duv),

a que correspondem os clusters U e V.

3. Os clusters U e V são agregadas formando o cluster (UV); a

matriz das distâncias é actualizada, suprimindo-se as linhas e

as colunas referentes às regiões (U e V) e adicionando uma

nova linha e um nova coluna com as distâncias entre o

agrupamento (UV) e os restantes clusters.

4. Os procedimentos 2. e 3. são repetidos R-1 vezes, ou seja, o

processo termina quando todas as regiões estiverem

agrupadas, formando um único cluster.

Uma vez realizada a primeira iteração nos procedimentos 2. e 3.

coloca-se, em cada uma das seguintes, o problema da determinação da

distância entre clusters que não são constituídos por um único espaço

elementar. Diversos critérios podem estar subjacentes a essa

determinação. Normalmente os critérios mais utilizados são:

i) Vizinho mais próximo (nearest neighbor) ou single linkage: a

distância entre dois clusters corresponde à menor das

distâncias entre dois espaços elementares pertencentes a

clusters diferentes;

C 1 C 2

Distância entre os clusters C1 e C2:

2º A pesquisa da menordistância

3º A actualização da matrizde distâncias

4º A repetição dosprocedimentos 2 e 3.

Os critérios para adeterminação da distânciaentre dois clusters.

i) Vizinho mais próximo(nearest neighbor) ou singlelinkage

ii) vizinho mais afastado (furthest neighbor) ou complete

linkage: a distância entre dois clusters corresponde à maior

das distâncias entre dois espaços elementares pertencentes a

clusters diferentes;

C 1 C 2

Distância entre os clusters C1

e C2: d15

iii) average linkage between groups, média entre todos os pares

de espaços elementares possiveis de serem formados, com

cada uma das regiões pertencentes a agrupamentos diferentes.

C 1 C 2

Distância entre os clusters C1 e C2:

d d d d d d13 14 15 23 24 25

+ + + + +

O último critério difere substancialmente dos dois primeiros.

Utiliza informação sobre todos os pares de espaços elementares que

são possiveis constituir com os dois agrupamentos e não apenas a

distância entre os dois espaços mais próximos ou mais afastados.

Porque ao adoptar este critério se retêm um maior volume de

informação é normalmente preferível recorrer à sua utilização.

B. Análise dos resultados do SPSS

Como vimos na secção anterior, o ponto de partida da análise de

clusters é matriz das distâncias entre espaços elementares. Assim tendo

em conta os três indicadores atrás mencionados (ver anexo A2)

apresenta-se a matriz das distâncias euclidianas, calculada com recurso

ao SPSS, entre as 28 NUTS III, que constituem os espaços

elementares do exemplo proposto.

ii) vizinho mais afastado(furthest neighbor) ou

complete linkage

iii) average linkage betweengroups

Figura 2- Matriz das Distâncias* * * * * * * * * * * * * * * P R O X I M I T I E S * * * * * * * * * * * * * * * Data Information 28 unweighted cases accepted. 0 cases rejected because of missing value. Euclidean measure used.- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Euclidean Dissimilarity Coefficient Matrix Case MINHO CÁVADO AVE G.PORTO TÂMEGA DOURO DOURO ALTO LIMA VOUGA T.MONTES CÁVADO ,5609 AVE ,8965 ,3491 G.PORTO 2,8505 2,6576 2,5240 TÂMEGA 1,6658 1,2358 1,1491 3,3334 DOURO VOUGA 1,5144 1,2100 1,0216 2,6245 1,9469 DOURO 1,1349 1,0676 1,1251 3,3533 1,7834 ,9874 ALTO T. MONTES 1,2756 ,8636 ,6797 2,9574 1,3111 ,7006 ,7482 BAIXO VOUGA 1,3398 1,2667 1,2231 2,3889 2,3356 ,6983 1,1758 1,2049 BAIXO MONDEGO 2,9539 3,4781 3,7589 4,2609 4,5924 3,8945 3,5509 4,0317 PINHAL LITORAL 1,5313 1,4466 1,3797 2,3619 2,4854 ,7412 1,3155 1,3270 PINHAL I.NORTE 2,0506 1,7762 1,5904 3,0618 2,3454 ,6184 1,2276 1,0797 DÃO-LAFÕES ,7620 ,6188 ,7215 3,0408 1,4930 ,9651 ,4495 ,6192 PINHAL I.SUL 2,0031 1,8684 1,7557 2,8733 2,7174 ,7906 1,3613 1,4228 SERRA ESTRELA 3,4416 3,0686 2,8179 4,1321 3,1119 2,0553 2,4939 2,2229 BEIRA I.NORTE ,7686 1,2915 1,5899 3,1940 2,3924 1,8627 1,3549 1,8006 BEIRA I.SUL 2,1203 2,5469 2,7553 3,5249 3,7426 2,5816 2,3449 2,8541 COVA DA BEIRA ,9201 1,4393 1,7284 3,1307 2,5749 1,9723 1,5452 1,9703 OESTE 2,0526 1,9622 1,8622 2,1869 2,9651 1,1623 1,8664 1,8243 GRANDE LISBOA 3,6214 3,4488 3,3172 ,7940 4,0935 3,3734 4,1307 3,7392 PENÍNS.SETÚBAL 2,8370 2,6450 2,5142 ,0575 3,3133 2,6374 3,3560 2,9581 MÉDIO TEJO 2,7281 2,7441 2,6955 3,3030 3,7165 1,8100 2,1853 2,4267 LEZIRIA DO TEJO 2,5892 2,5847 2,5216 2,8393 3,5991 1,6944 2,2165 2,3566 ALENTEJO LITORAL 2,7714 2,7231 2,6292 2,7935 3,6928 1,7709 2,3844 2,4562 ALTO ALENTEJO 2,3865 2,5121 2,5347 3,2082 3,5989 1,8171 2,0221 2,3688 ALENTEJO CENTRAL 3,2807 3,2887 3,2315 3,9047 4,1795 2,2918 2,5920 2,8694 BAIXO ALENTEJO 1,2105 1,5492 1,7343 3,0772 2,7186 1,5759 1,2869 1,7748 ALGARVE 2,9319 2,9403 2,8765 2,4126 4,0015 2,2187 2,8418 2,8829- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Case BAIXO BAIXO PINHAL PIN. I DÃO- PINH. I SERRA BEIRA I VOUGA MONDEGO LITORAL NORTE -LAFÕES SUL ESTRELA NORTE BAIXO MONDEGO 3,2732 PINHAL LITORAL ,1927 3,3475 PINHAL I.NORTE 1,1198 4,2531 1,0822 DÃO-LAFÕES 1,0990 3,4648 1,2724 1,4008 PINHAL I SUL ,7941 3,7857 ,6812 ,6428 1,5134 SERRA ESTRELA 2,6399 5,7488 2,5820 1,5326 2,7156 2,0430 BEIRA I. NORTE 1,4711 2,2837 1,6349 2,2960 1,2024 2,0717 3,7586 BEIRA I. SUL 1,9600 1,5267 2,0005 2,8360 2,3616 2,3245 4,2941 1,4391 COVA DA BEIRA 1,5101 2,0838 1,6612 2,4100 1,3898 2,1321 3,8984 ,2319 OESTE ,7526 3,5142 ,5709 1,3378 1,8392 ,8324 2,6792 2,1029 GRANDE LISBOA 3,1190 4,7244 3,0715 3,7659 3,8286 3,5468 4,7468 3,9191 PENÍN. SETÚBAL 2,4031 4,2550 2,3806 3,0826 3,0377 2,8988 4,1577 3,1864 MÉDIO TEJE 1,5240 3,6390 1,3756 1,6089 2,3816 1,0361 2,6619 2,5292 LEZIRIA TEJO 1,3191 3,5439 1,1470 1,6224 2,3231 1,0092 2,7838 2,4468 ALENTEJO LITORAL 1,4625 3,7864 1,2775 1,6616 2,4826 1,0985 2,7157 2,6790 ALTO ALENTEJO 1,3466 3,0419 1,2433 1,7910 2,1773 1,1696 3,0629 2,0673 ALENTEJO CENTRAL 2,1208 4,0763 1,9802 1,9454 2,8610 1,5052 2,6629 3,0547 BAIXO ALENTEJO 1,0541 2,3755 1,1604 1,8951 1,2891 1,5174 3,3895 ,7372 ALGARVE 1,7452 3,5356 1,5818 2,2875 2,8384 1,7137 3,4254 2,8015- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Case BEIRA I COVA OESTE GRANDE PENÍNS MÉDIO LEZIRIA ALENT.

SUL BEIRA LISBOA SETÚBAL EJO TEJO LITORAL COVA DA BEIRA 1,2701 OESTE 2,1579 2,0851 GRANDE LISBOA 4,0966 3,8341 2,8114 PENÍN.SETÚBAL 3,5333 3,1236 2,2175 ,8055 MÉDIO TEJO 2,1350 2,5162 1,1669 3,8494 3,3383 LEZIRIA TEJO 2,0912 2,4119 ,7833 3,3687 2,8760 ,4863 ALENTEJO LITORAL 2,3521 2,6475 ,8353 3,2900 2,8340 ,6268 ,2739 ALTO ALENTEJO 1,5370 2,0228 1,1537 3,7805 3,2369 ,5986 ,6752 ,9418 ALENTEJO CENTRAL 2,5833 3,0559 1,7897 4,4198 3,9428 ,6560 1,0941 1,1298 BAIXO ALENTEJO 1,0827 ,7193 1,5540 3,7763 3,0830 1,8096 1,7540 2,0022 ALGARVE 2,2905 2,7108 1,0621 2,7944 2,4557 1,2873 ,8526 ,7958- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Case ALTO ALENTEJO BAIXO ALENTEJO CENTRAL ALENTEJO ALENTEJO CENTRAL 1,1307 BAIXO ALENTEJO 1,3315 2,3374 ALGARVE 1,2986 1,7830 2,1813- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Para exemplificar, tomemos a base de dados do anexo A2 e

consideremos a informação dos 3 indicadores referentes às regiões do

Minho-Lima e Cávado:

RICA URBAN SOCINDMinho-Lima -1.08147 0.61936 0.45908Cávado -1.03683 0.75803 -0.08258

então a distância entre as duas regiões vem dada por:

[ ] [ ]dMin Cav, , ( , ) ( , , ) , ( , )= − − − + − + − −108147 103683 0 61936 0 75803 0 45908 0 082582 2 2

Os resultados da análise de clusters utilizando o SPSS são

resumidos na output do SPSS apresentado na figura 3.

Figura 3- Resultados da Análise de Clusters

• * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * *• Agglomeration Schedule using Average Linkage (Between Groups)

Next Clusters Combined Stage Cluster 1st AppearsStage Cluster 1 Cluster 2 Coefficient Cluster 1 Cluster 2 Stage

1 4 21 .057463 0 0 15 2 9 11 .192670 0 0 9 3 16 18 .231904 0 0 12 4 23 24 .273936 0 0 7 5 2 3 .349071 0 0 13 6 7 13 .449477 0 0 10 7 22 23 .556573 0 4 14 8 6 12 .618444 0 0 11 9 9 19 .661742 2 0 17 10 7 8 .683687 6 0 16 11 6 14 .716672 8 0 17 12 16 27 .728222 3 0 20 13 1 2 .728687 0 5 16 14 22 25 .738552 7 0 18 15 4 20 .799743 1 0 26 16 1 7 .916534 13 10 21 17 6 9 .938814 11 9 22 18 22 26 1.002656 14 0 19 19 22 28 1.203453 18 0 22 20 16 17 1.263982 12 0 23 21 1 5 1.439690 16 0 23 22 6 22 1.526854 17 19 24 23 1 16 1.866338 21 20 24 24 1 6 2.165417 23 22 25 25 1 15 2.872076 24 0 26 26 1 4 3.215650 25 15 27 27 1 10 3.584466 26 0 0

Os títulos do output permitem identificar que se aplicou o

método hierárquico de aglomeração e que o critério de determinação

A leitura da figura 3

da distância entre clusters foi o da distância média entre os pares de

espaços elementares pertencentes a agrupamentos diferentes (average

linkage between groups).

A leitura das primeiras quatro colunas da figura 3 permite obter

informação sobre os clusters formados em cada uma das iterações e a

respectiva distância. Assim, da leitura da primeira linha e das colunas 2

(Clusters Combined - Cluster 1) e 3 (Clusters Combined - Cluster 2),

verifica-se que são as regiões 4 e 21, ou seja, as regiões que se

encontram na linha 4 e 21 da matriz de informação inicial

(respectivamente, Grande Porto e Península de Setúbal), aquelas que

apresentam um maior grau de proximidade (o valor distância é

apresentado no coluna coefficient) e passam a constituir

provisoriamente o primeiro cluster. Registe-se que este cluster é

identificado pelo menor número de ordem das regiões envolvidas,ou

seja, neste caso pelo indíce 4.

As três últimas colunas permitem obter informação

respectivamente sobre as iterações anteriores em que cada um dos

clusters tenha sido objecto de agrupamento e a próxima etapa em que

o cluster agora constituído vai de novo participar. No caso da iteração

1, verifica-se que as colunas 5 (Stage Cluster 1st Appears - Cluster 1)

e 6 (Stage Cluster 1st Appears - Cluster 2) têm o valor 0 uma vez que

estes clusters elementares (constituídos por uma única região) ainda

não tinham sido incluídos no processo de aglomeração. Finalmente a

coluna 7 (Next Stage) informa que o cluster resultante desta iteração é

de novo objecto de agrupamento na iteração 15.

Tomemos um outro exemplo, considerando ainda a figura 3,

analisando a iteração 7:

i) Através das colunas 2 e 3 conclui-se que os clusters agrupados

são o 22 (que inclui a região do Médio Tejo) e o 23 (que

inclui a Lezíria do Tejo);

ii) Da observação das colunas 5 e 6 que resulta que o cluster com

a região do Médio Tejo é a primeira vez objecto de

agrupamento (trata-se de um cluster elementar) e que o

cluster que inclui a região da Leziria do Tejo já foi objecto de

agregação na iteração 4;

iii)Recorrendo à informação da iteração 4 verifica-se que aí

foram agrupados os clusters 23 (Lezíria do Tejo) e 24

(Alentejo Litoral), não existindo para qualquer destes clusters

um envolvimento anterior à actual iteração (0 nas colunas 5 e

Deste modo, tendo em conta que cada cluster constituido fica

identificado pelo indíce correspondente ao cluster elementar de ordem

mais baixa, o agrupamento constituído na iteração 7 passa a ser

identifcado pelo indíce 22 e resulta da agregação do cluster elementar

Médio Tejo ao cluster constituído pela regiões da Lezíria do Tejo e do

Alentejo Litoral.

Com base nas distâncias entre estas três regiões, retiradas da

matriz das distâncias apresentada na fig 2,

Médio Tejo Leziria doTejo

Lezíria do Tejo 0,4863Alentejo Litoral 0,6268 0,2739

a distância entre a região do Médio Tejo e o cluster constituído na

iteração 4, pelas regiões da Leziria do Tejo e do Alentejo Litoral, vem

dM Tejo Leziria A Litoral. ,( , . ), ,

,= + =0 4863 0 6268

20 5565

o que corresponde ao valor da coluna quatro (coefficient) referente à

iteração 7.

A observação da coluna coefficient permite igualmente observar

que à medida que o número de iterações aumenta procede-se à ligação

entre clusters com menores níveis de similaridade, ou seja, maiores

distâncias entre clusters. A informação sobre os valores das distâncias

entre os clusters pode fornecer um critério para a decisão sobre o

número de clusters que deverão ser considerados no caso de se

procurar formar agrupamentos com um certo grau de similaridade

entre os respectivos elementos. Com efeito, o processo de

aglomeração deverá ser interrompido quando se verificar um aumento

substancial na distância entre duas iterações consecutivas45.

No exemplo apresentado verifica-se que, entre a iteração 22 e a

iteração 23, existe um acréscimo na distância entre os clusters

agrupados bastante superior ao verificado na iteração anterior. Deste

modo, se fizermos a interrupção do processo de aglomeração no final

da iteração 22, obtêm-se 6 agrupamentos de regiões que de algum

modo confirmam uma certa ideia sobre a similaridade das

características económico-sociais das 28 regiões NUTS III do

Continente (ver figura 4).

45 Note-se que de acordo com o algoritmo de aglomeração alguns destes

agrupamentos podem ser constituidos por apenas um espaço elementar (NUTS III), bastando

Figura 4 - Similaridades económico-sociais

das regiões portuguesas

M I N H O - L I M A

C A V A D O

G R A N D E P O R T O

T A M E G A

E N T R E D O U R O E V O U G A

D O U R O

A L T O T R A S - O S - M O N T

B A I X O V O U G A

B A I X O M O N D E G O

P I N H A L L I T O R A L

P I N H A L I N T . N O R T E

D A O - L A F O E S

P I N H A L I N T E R I O R S U L

S E R R A D A E S T R E L A

B E I R A I N T E R I O R N O R T E

B E I R A I N T E R I O R S U L

C O V A D A B E I R A

O E S T E

G R A N D E L I S B O A

P E N I N S U L A D E S E T Ú B A L

M E D I O T E J O

L E Z I R I A D O T E J O

A L E N T E J O L I T O R A L

A L T O A L E N T E J O

A L E N T E J O C E N T R A L

B A I X O A L E N T E J O

A L G A R V E

Para além do output apresentado na figura 3 é igualmente

possível obter com o SPSS várias representações gráficas do processo

de constituição dos clusters. Entre estas merece ser destacada a

representação através da construção de um dendrograma (figura 5).

O dendrograma permite não só identificar os clusters agrupados

ao longo de todo o processo (tracejado vertical), como ainda observar,

o incremento nos valores da distância entre os clusters (tracejado

horizontal).

para isso que esses espaços elementares apresentem características consideravelmentedistintas dos restantes.

O dendrograma.

Figura 5- Dendrograma

* * ** * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

C. Procedimentos e opções no SPSS

A obtenção do exemplo utilizado ao longo do texto requer os

seguintes procedimentos e opções seleccionados através do sistema de

menus:

1- Abertura do ficheiro com as variáveis originais:

FILE ...

OPEN...

DATA...

2- Selecção do Procedimento análise clusters

STATISTICS ...

CLASSIFY...

HIERARCHICAL CLUSTER.....

3- Selecção das variáveis a submeter à análise de clusters

4- Selecção das seguintes opções na janela Statistics:

AGGLOMERATION SCHEDULE

DISTANCE MATRIX

5- Selecção das seguintes opções na janela Plots:

DENDROGRAM

6- Selecção das seguintes opções na janela Method:

Cluster Method: BETWEEN-GROUPS LINKAGE

Measure: INTERVAL;

EUCLIDEAN DISTANCE;

2.4.2. Noções de densidade e de distância inter-grupal

Ao utilizar-se o conceito de distância económica na delimitação

de regiões, haverá que distinguir:

- As distâncias entre espaços elementares;

- As distâncias inter-grupais, ou seja, entre os agrupamentos que

se vão constituindo.

Se A é um território constituído por um conjunto de espaços

elementares r, temos que:

A = rr=1

Os espaços elementares podem ser reunidos em agrupamentos

(ou clusters), que constituem subconjuntos de A e que designaremos

por c , de tal modo que

c = Ac=1

2.4.2. NOÇÕES DE DENSIDADE E DE DISTÂNCIA INTER -GRUPAL 77

Se tomarmos rc como o elemento genérico do agrupamento c, a

soma dos elementos de cada agrupamento deverá ser igual ao

agrupamento:

r = ccrc=1c

A densidade de um agrupamento c é um indicador da distância

económica média entre todos os espaços elementares que o compõem.

A densidade dos espaços elementares de um agrupamento será tanto

maior quanto mais pequena for essa distância média.

Assim, se dr c r c' for a distância económica entre dois espaços

elementares r c e r c' do agrupamento c, e Rc o respectivo número de

espaços elementares, o inverso da densidade do agrupamento será

dado por46:

= d R - 1)

==∑∑

Este indicador da densidade de um agrupamento define-se como

sendo igual ao somatório dos quadrados das distâncias económicas

entre os espaços elementares (pertencentes a um mesmo

agrupamento), dividido por metade do número de elementos da matriz

dessas distâncias, deduzidos dos elementos da diagonal principal, que

naturalmente são nulos. Daí o afirmar-se que a densidade corresponde

a uma distância média intra-grupal. Essas distâncias podem

representar-se numa matriz Dc c' , tal que:

Densidade de umagrupamento.

Densidade que correspondea uma distância média intra-grupal.

1c … Rc

Dc c= dr rc c′

A distância inter-grupal é a distância económica média entre

espaços elementares rc e r c′ pertencentes a dois agrupamentos, c e c':

==∑∑

Do mesmo modo, que para as distâncias intra-grupais, as

distâncias inter-grupais (entre espaços elementares pertencentes a

agrupamentos diferentes) podem representar-se numa matriz Dc c'

1c’ … Rc’

Dc ′c = dr rc c′

Se tivéssemos um conjunto de espaços elementares agrupados

em três regiões, poderíamos continuar a calcular as distâncias inter-

grupais entre os elementos da várias regiões.

Do mesmo modo que anteriormente, temos agora, depois de

reordenadas as linhas e as colunas, uma matriz alargada, em que cada

elemento é uma matriz Dc ′c do tipo das anteriormente explicitadas.

46Tenhamos presente que a matriz de distâncias económicas é simétrica

Distância inter-grupal.

2.4.3. A FORMAÇÃO DE AGRUPAMENTOS HOMOGÉNEOS 79

11 1c cR. .. 1

2 2c cR... 13 3c cR.. .

cR... Dc1c1

Dc1c1Dc1c1

cR... Dc2c1

Dc1c1Dc1c1

cR... Dc1c1

Dc1c1Dc1c1

Posto isto, interessa ver como se processam as várias fases de

delimitação de regiões homogéneas.

2.4.3. A formação de agrupamentos homogéneos

Vamos abordar a questão da formação de agrupamentos

tomando como ponto de partida a informação reunida em matrizes de

similaridades, de proximidades ou de distâncias económicas. Os

espaços referidos nestas matrizes serão considerados como os espaços

elementares necessários para agregação. Através de um processo de

natureza iterativa, procuraremos proceder à escolha dos espaços

elementares que vão fazer parte de cada agrupamento.

As matrizes de proximidade permitem-nos estabelecer

hierarquias de proximidade, sem realizar a sua quantificação, enquanto

que as matrizes de distância económica dão-nos uma medida dessa

proximidade. No que se segue, referimo-nos sempre a matrizes de

distância económica. A utilização das matrizes de similaridades em

nada alteraria a metodologia a apresentar, apenas se deverá ter em

As matrizes de similaridade,distância e de proximidadecomo ponto de partida.

Os espaços referidos nessasmatrizes serão consideradoscomo os espaçoselementares.

conta que para qualquer elemento genérico de uma matriz de

similaridades se tem:

rr= f (d )′ ′

Um critério básico a ser seguido na formação dos agrupamentos

será o de que a distância entre um agrupamento c de espaços

elementares e um novo espaço elementar r não deverá ser superior a

α Dc c 2 sendo α uma constante fixada à priori, embora, normalmente,

se possa admitir que se deva aproximar da unidade. Este critério tem

como fundamento o facto de se admitir que o alargamento de um

agrupamento inicial com novos espaços elementares, não se deve

realizar à custa da destruição da coerência interna entre os espaços

elementares que compõem o agrupamento inicial.

Tal critério corresponde a tomar-se como princípio genérico de

agregação, o de que as distâncias económicas entre os espaços

elementares de uma região devem ser inferiores às distâncias

económicas entre espaços elementares pertencentes a regiões

diferentes, o que está de acordo com a noção de regiões homogéneas.

O processo de agrupamento terá natureza iterativa, e cada

iteração é composta por 3 fases de análise e cálculo:

1) Com base na matriz de distâncias económicas entre espaços

elementares, procede-se à escolha dos espaços elementares

que apresentem menor distância económica entre si, e sejam

contíguos. Isto é, selecciona-se r i e r j , tais que:

d r jrr r r ri '

'= min d

sendo r, r’ = 1, ..., R e, r i e rj espaços contíguos.

Critério básico a ser seguidona formação dos

agrupamentos.

O processo de agrupamentoterá natureza iterativa, e

cada iteração é compostapor 3 fases de análise e

cálculo:

1ª Fase

Com estes dois espaços elementares constitui-se um

primeiro agrupamento (provisório), que designaremos de c1147.

Um agrupamento só deixará de ser provisório quando já não for

possível acrescentar-lhe mais espaços elementares. É o que se

tentará nos passos que se seguem. Nesta iteração obtém-se:

i j= r r*

2) Seguidamente, procede-se à reestimação das distâncias

económicas entre c11 e cada um dos restantes espaços

elementares, procedendo-se depois à anexação (que começa

por ser provisória) do espaço elementar rk que estiver mais

próximo do agrupamento c11 e lhe seja contíguo.

3) Para se verificar se o alargamento deve ou não ser mantido,

procede-se aos seguintes passos:

Tendo c1 sido provisoriamente definido, como:

i j= r r*

Hipótese 1:

SeD c r 2

11 D ≤ α , então rk ∈ c1 e c = r r r2

1i j k* * ,

retomando-se o passo 2) até que não seja possível encontrar

outro espaço elementar, contíguo ao espaço em formação que

verifique esta hipótese.

47Em que o índice superior é um indicador da iteração em curso e índice inferior umindicador de referência para o agrupamento

2ª Fase

3ª Fase

Hipótese 2:

Se D c r 2

11 D ≥ αα , então r k ∉ c1 e c1 será definido apenas

como, c 1 1 2= r r* , já que outro espaço elementar que quiséssemos

acrescentar a c11 apenas contribuiria para um maior afastamento entre

os 2 termos da expressão anterior pois, como vimos em 2), r k era o

espaço elementar que mais próximo estava de c 11.

O parâmetro α surge aqui como estimado à priori e serve como

ponderador da importância relativa que se quer atribuir à

homogeneidade dos agrupamentos. Efectivamente, da condição de

retenção do alargamento do agrupamento (Hipótese 1) deduz-se que:

Dc r 2

c c 211

O valor a atribuir a α tem implicações no número de regiões a

obter e nas suas dimensões. Se se for muito exigente em termos de

homogeneidade, tornar-se-á mais difícil preencher as condições de

proximidade económica e, por conseguinte, obter-se-á um maior

número de regiões, de menor dimensão.

Este critério pode ser complementado com restrições adicionais

relativas, por exemplo, à dimensão territorial e (ou) à população

global. O critério anterior pode ser verificado mas, se uma das

restrições adicionais for violada, então o espaço elementar adicional

não deverá ser acrescentado ao agrupamento. Far-se-ão tantas

iterações, quantas as necessárias para que a formação de agrupamentos

esgote todos os espaços elementares (condição de exaustividade).

Como se pode verificar, a adopção desta metodologia para a

delimitação de regiões homogéneas constitui um processo

O parâmetro α, estimado àpriori, serve como indicador

da homogeneidade que sepretende atribuir aos

agrupamentos.

O valor a atribuir a α temimplicações no número deregiões a obter e nas suas

dimensões.

Este critério pode sercomplementado comrestrições adicionais

relativas, por exemplo, àdimensão territorial e (ou) à

população global.

relativamente complexo e algo exigente em meios de cálculo. Não se

pense, contudo, que qualquer outra metodologia alternativa permite

facilitar substancialmente a tarefa. Uma forma de diminuir a carga de

cálculo associada ao processo, será a de tomar como critério

alternativo, de inclusão de espaços elementares, ao anteriormente

explicitado, o seguinte:

β d2 em lugar de α Dc c 2 ,

em que β é um parâmetro constante estabelecido à priori, tal

como o α, mas em que d 2 . à média dos quadrados das distâncias entre

espaços elementares, da matriz inicial de distâncias económicas. Evita-

se, assim, a necessidade de reestimação dos Dc c 2 em cada iteração.

A delimitação de regiões homogéneas não tem de, forçosamente,

basear-se neste método, como já se referiu.

O recurso a indicadores estatísticos mais vulgares, como o

desvio padrão ou o coeficiente de variação pode constituir uma

alternativa. Tratar-se-ia, neste caso, de formar agrupamentos que

permitissem minimizar os desvios padrão ou os coeficientes de

variação respectivos.

A dificuldade está em que, ou se trabalha com uma só variável, o

que pode inviabilizar uma delimitação de regiões, aceitável em termos

do número e da dimensão, ou então, quando se pretende trabalhar com

mais variáveis, tem de estabelecer-se ponderadores que permitam

passar para um indicador sintético.48

48O cálculo consistiria em minimizar a soma dos desvios padrão ou dos coeficientes

de variação referentes às diversas variáveis em cada agrupamento. Os ponderadoresforneceriam os critérios de ligação entre as diferentes variáveis

O estabelecimento destes ponderadores representa um acto

subjectivo, o qual pode, no entanto, considerar-se como uma

vantagem, se tivermos em conta que esses ponderadores poderão

servir para representar a importância atribuída pelos agentes

económicos, sociais e políticos às diferentes variáveis a ter em conta na

análise. Este método será bastante útil se se pretender fazer da

delimitação de regiões um processo participado. Não esquecer, no

entanto, que a escolha das variáveis relevantes para a determinação das

distâncias económicas, pode igualmente ser objecto de consenso entre

as principais entidades interessadas.

Uma outra alternativa é-nos oferecida pela análise factorial. É um

método útil no trabalho de delimitação de regiões, na medida em que

permite uma redução do número de variáveis de trabalho, sem que haja

perdas de informação. O leitor é aqui remetido para o ponto do texto

em que se abordou explicitamente a análise factorial.

2.4.4. A formação de agrupamentos polarizados

Como vimos anteriormente, a delimitação de regiões polarizadas

não se baseia em valores assumidos por características internas aos

espaços elementares, mas sim em valores que tomam as relações

entre esses espaços. Por isso se diz que as regiões homogéneas

constituem um conceito estático, enquanto as regiões polarizadas

constituem um conceito dinâmico.

Para a delimitação deste tipo de regiões poderiam utilizar-se as

metodologias anteriormente referidas com adaptações metodológicas e

analíticas. Não estaríamos nesse caso perante matrizes de distâncias,

A delimitação de regiõespolarizadas baseia-se novalor das relações entre

espaços elementares.

2.4.4. A FORMAÇÃO DE AGRUPAMENTOS POLARIZADOS 85

cujos valores intra-grupais interessaria minimizar, mas sim, perante

matrizes de fluxos inter-espaços cujos valores interessaria maximizar.

Independentemente da metodologia a utilizar, uma das principais

dificuldades da delimitação de regiões polarizadas, está na

determinação dos fluxos (de bens e serviços e de factores) entre

espaços elementares. Estatisticamente tal determinação é difícil, senão

mesmo impossível, pelo que, se tem procurado soluções alternativas.

Uma, muito vulgar, consiste na utilização de um modelo que

encontra o seu fundamento na lei da atracção, de Newton e segundo o

qual modelo a atracção entre duas massas M i e M j é igual a:

y = kM M

em que k e α são parâmetros a estimar e dij a distância que

separa as massas.

A transposição deste modelo para o domínio dos fenómenos

económicos, é feita no pressuposto de que os espaços económicos

exercem, como os físicos, mútua atracção, a qual seria função dos seus

potenciais económicos (medidos por exemplo pelos PIB) e das

distâncias que os separam. Naturalmente, que se trata de uma hipótese

de trabalho restritiva, já que a capacidade de atracção e de difusão de

uma região não depende apenas da sua massa produtiva, mas de

múltiplos outros factores, ao mesmo tempo que a distância física é

apenas um dos elementos da distância económica entre regiões.

O modelo tornar-se-á ainda mais restritivo se tivermos em conta

que, na impossibilidade de determinação estatística dos seus

parâmetros, a prática habitual é a de extrapolar para a economia que

estudamos, os valores estabelecidos para o próprio modelo de Newton

A dificuldade nadeterminação dos fluxos debens, serviços e factoresentre espaços elementares.

Um solução alternativabaseada na lei da atracçãode Newton.

(K=1 e α=2), ou para outras economias cujo comportamento se julga

comparável.

Uma segunda hipótese de trabalho consiste na utilização de uma

matriz binária em que, cada cela, representando os fluxos inter-

espaços, terá o valor 1 ou 0, consoante os fluxos entre esses espaços

ultrapassem ou fiquem aquém de um determinado limiar. Teríamos,

assim, uma matriz:

F = [f rr' ]

em que f rr' = 1 ou f rr' = 0.

Em qualquer dos casos um método vulgarmente utilizado na

delimitação das regiões polarizadas, assenta no conceito de

decomponibilidade das matrizes. Diz-se que uma matriz é

decomponível se, através de um processo de permutação de linhas e

colunas, for passível de transformação numa matriz diagonal

(decomponibilidade forte) ou numa matriz triangular

(decomponibilidade fraca). Quer a diagonalidade, quer a

triangularidade podem ser por elementos ou por blocos.

No primeiro caso teremos:

x xx x x

. . . .. . . .

. . . .x x x . . . x

Matriz diagonal porelementos

Matriz triangularpor elementos

Uma segunda alternativa aconstrução de matrizes

binárias de fluxos inter-regionais.

O método utilizado nadelimitação das regiõespolarizadas, assenta no

conceito dedecomponibilidade das

matrizes

No segundo caso teremos:

xxx … xxx …xxx … xxx …xxx … xxx …. . .. . .. . . …

. . . …

… xxx xxx … xxx… xxx xxx … xxx… xxx xxx … xxx

Matriz diagonalpor blocos

Matriz triangularpor blocos

x - valores significativos ( ≠ 0)

Se tivermos uma matriz de fluxos inter-espaços elementares,

quantitativos ou qualitativos, e se essa matriz for aproximadamente

diagonizável por blocos, então, a identificação de espaços polarizados

é imediata. Efectivamente cada bloco da matriz diagonal, preenchido

com valores significativos, corresponde a um espaço polarizado.

No caso de uma matriz de fluxos quantitativos, a matriz diagonal

permitirá, por exemplo, determinar dois agrupamentos polarizados A e

A x ≈ 0

B ≈ 0 x

cujos fluxos internos são maioritariamente positivos AA e BB,

enquanto os fluxos inter-blocos AB e BA são maioritariamente nulos

ou pouco significativos.

No caso de uma matriz de fluxos qualitativos, os blocos

polarizados são preenchidos maioritariamente por 1, enquanto os

fluxos inter-blocos são maioritariamente preenchidos com 0.

Bibliografia

JOHNSON, R. e WICHERN, D. (1982), Multivariate Statistical Methods,

Englewood Cliffs: Prentice-Hall (3ª edição, 1992).

KAISER, H. (1974), An index of factor simplicity, Psychometrika, 39:31-36.

NÖRUSIS, M. (1993), SPSS for Windows: Professional Statistics, Release 6.0,

Chicago: SPSS Inc.

PAELINCK, J. e NJKAMP, P. (1975), Operational Theory and Method in

Regional Economics, Saxon House.

PEARSON, K. (1901), On lines and planes of closest fit to a system of points in

space, Philosophical Magazine, 2:557-72.

SPEARMAN, C. (1904), General intelligence, objectively determined and

measured, American Journal of Psychology, 15:201-93.

SPSS Inc. (1991) SPSS Statistical Algorithms, Chicago: SPSS Inc. (2ª edição).

ANEXO A1: OUTPUT DO PROCEDIMENTO FACTOR DO SPSS

- - - - - - - - - - - F A C T O R A N A L Y S I S - - - - - - - - - - -

Analysis number 1 Listwise deletion of cases with missing values

Correlation Matrix:

DPOPUL VABPCAP PRODUTIV CELECTR LESPEC SERVCOM ABASTAGDPOPUL 1.00000VABPCAP .63716 1.00000PRODUTIV .40191 .68317 1.00000CELECTR .53785 .62147 .39207 1.00000LESPEC .47605 .27885 .22480 .25592 1.00000SERVCOM .42376 .66116 .51687 .62643 .33645 1.00000ABASTAG .28452 .53012 .48348 .50281 .07892 .50948 1.00000CAMHOSP .17519 .14336 .16880 .34608 .26599 .09185 .38710MORTINF .01937 -.43109 -.39719 -.21592 -.30057 -.33680 -.24591EMNOX .56675 .54401 .53214 .42609 .49516 .44790 .41424

CAMHOSP MORTINF EMNOXCAMHOSP 1.00000MORTINF -.29996 1.00000EMNOX .05382 -.16529 1.00000

Kaiser-Meyer-Olkin Measure of Sampling Adequacy = .70768

Bartlett Test of Sphericity = 120.59010, Significance = .00000

Anti-image Covariance Matrix:

DPOPUL VABPCAP PRODUTIV CELECTR LESPECDPOPUL .30234VABPCAP -.14433 .21129PRODUTIV .00379 -.10082 .44586CELECTR -.05826 -.05721 .07307 .40852LESPEC -.14701 .07213 .05608 .06495 .45876SERVCOM .03158 -.05506 -.05535 -.16437 -.12523ABASTAG .05784 -.05879 -.03093 -.01333 .12162CAMHOSP -.06813 .08057 -.05777 -.16234 -.13662MORTINF -.20549 .15521 .05684 -.02156 .16476EMNOX -.05742 -.00382 -.12848 -.05111 -.18629

SERVCOM ABASTAG CAMHOSP MORTINF EMNOX

SERVCOM .39299ABASTAG -.11689 .46181CAMHOSP .14442 -.22818 .54726MORTINF .01794 -.05139 .14069 .46786EMNOX .04471 -.13467 .14655 -.02592 .42855

2. Métodos de Análise da Evolução do Sistema Espacial Português: As Regiões, asCidades e os Fenómenos Urbanos

- - - - - - - - - - - F A C T O R A N A L Y S I S - - - - - - - - - - -

Anti-image Correlation Matrix:

DPOPUL VABPCAP PRODUTIV CELECTR LESPEC SERVCOM ABASTAGDPOPUL .65488VABPCAP -.57106 .74020PRODUTIV .01032 -.32848 .86127CELECTR -.16577 -.19472 .17122 .81742LESPEC -.39475 .23169 .12399 .15003 .54764SERVCOM .09163 -.19109 -.13223 -.41023 -.29493 .79655ABASTAG .15479 -.18820 -.06817 -.03069 .26422 -.27438 .74212CAMHOSP -.16749 .23693 -.11695 -.34334 -.27267 .31141 -.45389MORTINF -.54637 .49365 .12444 -.04932 .35563 .04185 -.11056EMNOX -.15951 -.01269 -.29393 -.12215 -.42013 .10894 -.30271

CAMHOSP MORTINF EMNOXCAMHOSP .40627MORTINF .27804 .49708EMNOX .30262 -.05790 .77509

Measures of Sampling Adequacy (MSA) are printed on the diagonal.

Extraction 1 for analysis 1, Principal Components Analysis (PC)

Initial Statistics:

Variable Communality * Factor Eigenvalue Pct of Var Cum PctDPOPUL 1.00000 * 1 4.55322 45.5 45.5VABPCAP 1.00000 * 2 1.25539 12.6 58.1PRODUTIV 1.00000 * 3 1.08655 10.9 69.0CELECTR 1.00000 * 4 .96735 9.7 78.6LESPEC 1.00000 * 5 .64489 6.4 85.1SERVCOM 1.00000 * 6 .52147 5.2 90.3ABASTAG 1.00000 * 7 .34534 3.5 93.7CAMHOSP 1.00000 * 8 .31696 3.2 96.9MORTINF 1.00000 * 9 .18355 1.8 98.7EMNOX 1.00000 * 10 .12529 1.3 100.0

PC extracted 3 factors.

Factor Matrix:

Factor 1 Factor 2 Factor 3DPOPUL .70053 .48540 .18164VABPCAP .86711 .04488 -.22687PRODUTIV .74318 -.06834 -.24271CELECTR .75841 -.02954 -.08089LESPEC .51829 .20585 .73858SERVCOM .77588 .01907 -.22309ABASTAG .67181 -.31865 -.30038CAMHOSP .36037 -.60573 .46895MORTINF -.45843 .59430 -.15257EMNOX .72188 .38450 .08915

- - - - - - - - - - - F A C T O R A N A L Y S I S - - - - - - - - - - -

Final Statistics:Variable Communality * Factor Eigenvalue Pct of Var Cum PctDPOPUL .75935 * 1 4.55322 45.5 45.5VABPCAP .80537 * 2 1.25539 12.6 58.1PRODUTIV .61590 * 3 1.08655 10.9 69.0CELECTR .58261 *LESPEC .85649 *SERVCOM .65212 *ABASTAG .64310 *CAMHOSP .71670 *MORTINF .58663 *EMNOX .67690 *

VARIMAX rotation 1 for extraction 1 in analysis 1 - Kaiser Normalization.VARIMAX converged in 10 iterations.

Rotated Factor Matrix: Factor 1 Factor 2 Factor 3DPOPUL .44727 .73992 -.10869VABPCAP .84022 .30072 .09475PRODUTIV .75353 .16493 .14451CELECTR .67285 .30116 .19796LESPEC .00026 .85788 .34717SERVCOM .76434 .24380 .09200ABASTAG .74178 -.05099 .30044CAMHOSP .06922 .13933 .83216MORTINF -.32730 .01455 -.69231EMNOX .52280 .63181 -.06630

Factor Transformation Matrix: Factor 1 Factor 2 Factor 3Factor 1 .82493 .48960 .28246Factor 2 -.05873 .57126 -.81867Factor 3 -.56217 .65876 .50000

Factor Score Coefficient Matrix: Factor 1 Factor 2 Factor 3DPOPUL .01023 .40633 -.18950VABPCAP .27238 -.02389 -.07987PRODUTIV .26342 -.09834 -.02102CELECTR .18064 .01907 .02909LESPEC -.29786 .59718 .23779SERVCOM .25510 -.04315 -.06696ABASTAG .29204 -.25488 .11125CAMHOSP -.14901 .04743 .63317MORTINF -.03192 .12864 -.48620EMNOX .06667 .30664 -.16493

Covariance Matrix for Estimated Regression Factor Scores:

Factor 1 Factor 2 Factor 3Factor 1 1.00000Factor 2 .00000 1.00000Factor 3 .00000 .00000 1.00000

3 PC EXACT factor scores will be saved.

Following factor scores will be added to the working file: Name LabelFAC1_1 REGR factor score 1 for analysis 1FAC2_1 REGR factor score 2 for analysis 1FAC3_1 REGR factor score 3 for analysis 1

ANEXO A.2: BASE DE DADOS UTILIZADA NA ANÁLISE FACTORIAL

ID NUT DPOPUL VABPCAP PRODUTIV CELECTR LESPEC SERVCOM ABASTAG CAMHOSP MORTINF EMNOX

101 MINHO-LIMA 112.8 343.2 2050.2 458 .418 5.0 55.6 1.62 8.1 975

102 CÁVADO 290.4 411.7 1711.3 381 .410 5.3 58.9 1.97 11.6 780

103 AVE 378.0 504.8 1797.8 389 .403 4.5 53.7 1.52 11.5 684

104 GRANDE PORTO 1143.8 675.5 2479.8 1027 .424 7.8 87.7 3.16 12.4 18166

105 TÂMEGA 198.9 322.8 1396.0 285 .419 4.4 43.5 .64 14.3 288

106 ENTRE DOURO E VOUGA 299.2 520.9 2388.9 415 .361 4.9 42.9 1.17 9.8 1822

107 DOURO 28.1 278.7 1741.9 315 .368 3.6 64.4 2.35 13.5 51

108 ALTO TRÁS-OS-MONTES 57.4 348.6 1917.2 341 .391 3.9 73.5 2.69 19.4 54

201 BAIXO VOUGA 196.1 506.6 2885.2 499 .379 5.0 57.1 1.90 9.2 4622

202 BAIXO MONDEGO 159.1 491.2 2978.3 601 .398 5.2 82.4 8.66 7.2 3604

203 PINHAL LITORAL 129.3 509.2 2841.6 531 .390 5.4 64.5 1.25 9.3 2310

204 PINHAL INTERIOR NORTE 52.1 350.7 2063.8 362 .370 5.1 72.8 .00 12.7 355

205 DÃO-LAFÕES 25.6 340.4 2217.9 347 .388 4.5 51.4 2.04 12.0 163

206 PINHAL INTERIOR SUL 80.7 453.6 2899.4 347 .371 5.7 62.9 .00 7.9 355

207 SERRA DA ESTRELA 61.0 264.5 1340.1 404 .316 3.6 72.5 .00 20.8 101

208 BEIRA INTERIOR NORTE 28.5 334.3 2140.9 362 .412 5.0 72.9 3.17 9.0 44

209 BEIRA INTERIOR SUL 21.3 433.1 2512.5 430 .399 5.7 94.2 4.08 6.2 247

210 COVA DA BEIRA 66.6 413.0 1477.3 533 .412 4.4 76.0 2.92 7.4 165

301 OESTE 143.4 517.2 2804.9 537 .382 6.7 78.0 1.51 9.2 12826

302 GRANDE LISBOA 1736.3 828.6 4138.8 596 .437 9.5 98.7 3.45 9.9 21484

303 PENÍNSULA DE SETÚBAL 427.7 606.4 3741.8 537 .447 8.4 90.6 1.59 7.8 47171

304 MÉDIO TEJO 87.7 477.7 2849.1 524 .339 6.0 75.9 1.95 9.0 1294

305 LEZIRIA DO TEJO 54.3 511.0 4050.9 500 .380 5.8 83.4 1.57 10.2 162

401 ALENTEJO LITORAL 18.4 748.0 2942.4 431 .377 5.6 84.7 .67 7.8 5356

402 ALTO ALENTEJO 21.2 496.6 2809.0 455 .365 5.7 87.7 2.67 9.5 89

403 ALENTEJO CENTRAL 23.7 507.7 1873.9 492 .309 6.0 84.7 2.36 10.7 49

404 BAIXO ALENTEJO 16.4 469.0 1236.0 406 .394 6.1 77.5 2.20 6.6 25

501 ALGARVE 68.9 592.3 2779.5 706 .403 13.3 82.0 2.02 9.2 281

ANEXO A3: OUTPUT DO PROCEDIMENTO CLUSTER DO SPSS

* * * * * * * * * * * * * * * * * * * P R O X I M I T I E S * * * * * * * * * * * * * * * * * * *

Data Information 28 unweighted cases accepted. 0 cases rejected because of missing value. Euclidean measure used.- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Euclidean Dissimilarity Coefficient Matrix

Case MINHO-LI CÁVADO AVE GRANDE P TÂMEGA ENTRE DO

CÁVADO .5609 AVE .8965 .3491 GRANDE 2.8505 2.6576 2.5240 TÂMEGA 1.6658 1.2358 1.1491 3.3334 ENTRE DO 1.5144 1.2100 1.0216 2.6245 1.9469 DOURO 1.1349 1.0676 1.1251 3.3533 1.7834 .9874 ALTO TRÁ 1.2756 .8636 .6797 2.9574 1.3111 .7006 BAIXO VO 1.3398 1.2667 1.2231 2.3889 2.3356 .6983 BAIXO MO 2.9539 3.4781 3.7589 4.2609 4.5924 3.8945 PINHAL L 1.5313 1.4466 1.3797 2.3619 2.4854 .7412 PINHAL I 2.0506 1.7762 1.5904 3.0618 2.3454 .6184 DÃO-LAFÕ .7620 .6188 .7215 3.0408 1.4930 .9651 PINHAL I 2.0031 1.8684 1.7557 2.8733 2.7174 .7906 SERRA DA 3.4416 3.0686 2.8179 4.1321 3.1119 2.0553 BEIRA IN .7686 1.2915 1.5899 3.1940 2.3924 1.8627 BEIRA IN 2.1203 2.5469 2.7553 3.5249 3.7426 2.5816 COVA DA .9201 1.4393 1.7284 3.1307 2.5749 1.9723 OESTE 2.0526 1.9622 1.8622 2.1869 2.9651 1.1623 GRANDE L 3.6214 3.4488 3.3172 .7940 4.0935 3.3734 PENÍNSUL 2.8370 2.6450 2.5142 .0575 3.3133 2.6374 MÉDIO TE 2.7281 2.7441 2.6955 3.3030 3.7165 1.8100 LEZIRIA 2.5892 2.5847 2.5216 2.8393 3.5991 1.6944 ALENTEJO 2.7714 2.7231 2.6292 2.7935 3.6928 1.7709 ALTO ALE 2.3865 2.5121 2.5347 3.2082 3.5989 1.8171 ALENTEJO 3.2807 3.2887 3.2315 3.9047 4.1795 2.2918 BAIXO AL 1.2105 1.5492 1.7343 3.0772 2.7186 1.5759 ALGARVE 2.9319 2.9403 2.8765 2.4126 4.0015 2.2187

Case DOURO ALTO TRÁ BAIXO VO BAIXO MO PINHAL L PINHAL I ALTO TRÁ .7482 BAIXO VO 1.1758 1.2049 BAIXO MO 3.5509 4.0317 3.2732 PINHAL L 1.3155 1.3270 .1927 3.3475 PINHAL I 1.2276 1.0797 1.1198 4.2531 1.0822 DÃO-LAFÕ .4495 .6192 1.0990 3.4648 1.2724 1.4008 PINHAL I 1.3613 1.4228 .7941 3.7857 .6812 .6428 SERRA DA 2.4939 2.2229 2.6399 5.7488 2.5820 1.5326 BEIRA IN 1.3549 1.8006 1.4711 2.2837 1.6349 2.2960 BEIRA IN 2.3449 2.8541 1.9600 1.5267 2.0005 2.8360 COVA DA 1.5452 1.9703 1.5101 2.0838 1.6612 2.4100 OESTE 1.8664 1.8243 .7526 3.5142 .5709 1.3378 GRANDE L 4.1307 3.7392 3.1190 4.7244 3.0715 3.7659 PENÍNSUL 3.3560 2.9581 2.4031 4.2550 2.3806 3.0826 MÉDIO TE 2.1853 2.4267 1.5240 3.6390 1.3756 1.6089 LEZIRIA 2.2165 2.3566 1.3191 3.5439 1.1470 1.6224 ALENTEJO 2.3844 2.4562 1.4625 3.7864 1.2775 1.6616 ALTO ALE 2.0221 2.3688 1.3466 3.0419 1.2433 1.7910 ALENTEJO 2.5920 2.8694 2.1208 4.0763 1.9802 1.9454 BAIXO AL 1.2869 1.7748 1.0541 2.3755 1.1604 1.8951 ALGARVE 2.8418 2.8829 1.7452 3.5356 1.5818 2.2875

Case DÃO-LAFÕ PINHAL I SERRA DA BEIRA IN BEIRA IN COVA DA PINHAL I 1.5134 SERRA DA 2.7156 2.0430 BEIRA IN 1.2024 2.0717 3.7586 BEIRA IN 2.3616 2.3245 4.2941 1.4391 COVA DA 1.3898 2.1321 3.8984 .2319 1.2701 OESTE 1.8392 .8324 2.6792 2.1029 2.1579 2.0851 GRANDE L 3.8286 3.5468 4.7468 3.9191 4.0966 3.8341 PENÍNSUL 3.0377 2.8988 4.1577 3.1864 3.5333 3.1236 MÉDIO TE 2.3816 1.0361 2.6619 2.5292 2.1350 2.5162 LEZIRIA 2.3231 1.0092 2.7838 2.4468 2.0912 2.4119 ALENTEJO 2.4826 1.0985 2.7157 2.6790 2.3521 2.6475 ALTO ALE 2.1773 1.1696 3.0629 2.0673 1.5370 2.0228 ALENTEJO 2.8610 1.5052 2.6629 3.0547 2.5833 3.0559 BAIXO AL 1.2891 1.5174 3.3895 .7372 1.0827 .7193 ALGARVE 2.8384 1.7137 3.4254 2.8015 2.2905 2.7108

Case OESTE GRANDE L PENÍNSUL MÉDIO TE LEZIRIA ALENTEJO GRANDE L 2.8114 PENÍNSUL 2.2175 .8055 MÉDIO TE 1.1669 3.8494 3.3383 LEZIRIA .7833 3.3687 2.8761 .4863 ALENTEJO .8353 3.2900 2.8340 .6268 .2739 ALTO ALE 1.1537 3.7805 3.2369 .5986 .6752 .9418 ALENTEJO 1.7897 4.4198 3.9428 .6560 1.0941 1.1298 BAIXO AL 1.5540 3.7763 3.0830 1.8096 1.7540 2.0022 ALGARVE 1.0621 2.7944 2.4557 1.2873 .8526 .7958

Case ALTO ALE ALENTEJO BAIXO AL ALENTEJO 1.1307 BAIXO AL 1.3315 2.3374 ALGARVE 1.2986 1.7830 2.1813- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

* * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * *

Agglomeration Schedule using Average Linkage (Between Groups) Clusters Combined Stage Cluster 1st Appears Next Stage Cluster 1 Cluster 2 Coefficient Cluster 1 Cluster 2 Stage 1 4 21 .057463 0 0 15 2 9 11 .192670 0 0 9 3 16 18 .231904 0 0 12 4 23 24 .273936 0 0 7 5 2 3 .349071 0 0 13 6 7 13 .449477 0 0 10 7 22 23 .556573 0 4 14 8 6 12 .618444 0 0 11 9 9 19 .661742 2 0 17 10 7 8 .683687 6 0 16 11 6 14 .716672 8 0 17 12 16 27 .728222 3 0 20 13 1 2 .728687 0 5 16 14 22 25 .738552 7 0 18 15 4 20 .799743 1 0 26 16 1 7 .916534 13 10 21 17 6 9 .938814 11 9 22 18 22 26 1.002656 14 0 19 19 22 28 1.203453 18 0 22 20 16 17 1.263982 12 0 23 21 1 5 1.439690 16 0 23 22 6 22 1.526854 17 19 24 23 1 16 1.866338 21 20 24 24 1 6 2.165417 23 22 25 25 1 15 2.872076 24 0 26 26 1 4 3.215650 25 15 27 27 1 10 3.584466 26 0 0

* * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * *

Dendrogram using Average Linkage (Between Groups)

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

ANEXO A.4: BASE DE DADOS UTILIZADA NA ANÁLISE DE CLUSTERS

ID NUT RICA URBAN SOCIND

101 MINHO-LIMA -1.08147 .61936 .45908

102 CÁVADO -1.03683 .75803 -.08258

103 AVE -.90347 .78253 -.40425

104 GRANDE PORTO 1.33614 1.93913 -.27477

105 TÂMEGA -1.85371 1.19895 -.89830

106 ENTRE DOURO E VOUGA -.35214 -.02448 -.70146

107 DOURO -1.16424 -.29437 -.20897

108 ALTO TRÁS-OS-MONTES -1.01273 .20482 -.74530

201 BAIXO VOUGA -.03022 -.01088 -.08194

202 BAIXO MONDEGO -.16348 -.03898 3.18839

203 PINHAL LITORAL .13370 -.08970 -.14549

204 PINHAL INTERIOR NORTE -.28870 -.54276 -1.03287

205 DÃO-LAFÕES -1.11646 .14683 -.13764

206 PINHAL INTERIOR SUL .10905 -.64554 -.53850

207 SERRA DA ESTRELA -.43450 -1.09021 -2.45696

208 BEIRA INTERIOR NORTE -.95184 .14957 1.05341

209 BEIRA INTERIOR SUL .03054 -.60645 1.78439

210 COVA DA BEIRA -.78524 .18079 1.21168

301 OESTE .69671 -.15135 -.21704

302 GRANDE LISBOA 2.03131 2.32256 -.26495

303 PENÍNSULA DE SETÚBAL 1.30149 1.98171 -.25778

304 MÉDIO TEJO .76752 -1.30940 -.09206

305 LEZIRIA DO TEJO .97160 -.86883 -.06459

401 ALENTEJO LITORAL 1.15420 -.84840 -.26777

402 ALTO ALENTEJO .57714 -1.09633 .43399

403 ALENTEJO CENTRAL .84195 -1.93415 -.27765

404 BAIXO ALENTEJO -.42538 -.32217 .84437

501 ALGARVE 1.64904 -.41029 .17557

centro de investigaÇÕes regionais e urbanaspascal.iseg.utl.pt/~cirius/eru/caderno2.pdf ·...

Documents

georreferenciamentode informações...

algoritmos elementares nao

partículas elementares

04 finais elementares

formas elementares

fundamentos elementares do áudio - oneal.com.br ·...

governo do estado de minas gerais item...

funções elementares

princÍpios elementares de alquimia.pdf

01-lesões elementares

eru 324 – metodologia da pesquisa material...

eru 324 – metodologia da pesquisa material didÁtico ii

01 amplificadores elementares transistorizados

nocoes elementares de_seguranca_em_quimica

princípios elementares

trabalho eru feijao

princípios elementares - 01

cartas elementares - · pdf filereiki 2 cartas elementares...

alguns algoritmos elementares de ordenação

conceitos elementares