Transcript
Page 1: Delineamento  Analises Multivariadas

ANÁLISES MULTIVARIADAS

• Análises que trabalham com mais de uma variável dependente.

• Análises principalmente exploratórias.

• Inferências estatísticas possíveis em alguns casos.

• Análises recomendadas em estudos de comunidades.

• TIPOS

� Classificação (classificar em grupos)� Ordenação (ordenar em gradientes)

Page 2: Delineamento  Analises Multivariadas

ORDENAÇÃO

• Ordenar dados ao longo de gradientes (variáveis)

� Reduzir o número de variáveis para permitir o reconhecimento de padrões só com as variáveis realmente importantes (Análise Exploratória)

� Fornecer uma nova combinação de variáveis, as variáveis latentes, que podem ser tratadas como novas variáveis para análises estatísticas (ANOVA, teste t, Regressão).

� Variáveis bióticas, ambientais ou ambas

� Variáveis explicativas (independentes) ou dependentes

Page 3: Delineamento  Analises Multivariadas

ORDENAÇÃO

� Relação entre variáveis biológicas (espécies ou táxons) a partir de observações (amostras).

� Análises indiretas: padrões de ordenação explicados por variáveis ambientais não analisadas diretamente.

Análise de Componentes PrincipaisAnálise Discriminante

Análise de CorrespondênciaEscalonamento Multidimensional

� Análises diretas: padrões de ordenação calculados a partir de dados bióticos e ambientais concomitantemente

Análise de GradientesAnálise de Correspondência Canônica

Análise de Correlação Canônica

Page 4: Delineamento  Analises Multivariadas

ORDENAÇÃO

VARIÁVEIS VARIÁVEIS AMBIENTAIS

...

2

5

5

3

4

Sp.B

...

1

6

5

4

2

Sp. A

......St. Y

...2St. 5

...1St. 4

...2St. 3

...12St. 2

...3St. 1

Sp. X

Sp. C

EspécieEstação

...

2

5

5

3

4

Temp

...

1

6

5

4

2

NO3

......

...2

...1

...2

...12

...3

xAltitude

OB

SE

RV

ÕE

S/O

BJE

TO

S

(uni

dade

s am

ostr

ais)

ESPÉCIES

AM

OS

TR

AS

AMOSTRAS

Modo R Modo Q

VARIÁVEIS << AMOSTRAS(Colunas) (linhas)

ES

CIE

S

Page 5: Delineamento  Analises Multivariadas

ORDENAÇÃOVARIÁVEIS

AMBIENTAIS

MATRIZ

Correlação ou Covariância

ESPÉCIES/ AMBIENTAIS

ESPÉCIES

AM

OS

TR

AS

AM

OS

TR

AS

ESPÉCIES

ES

CIE

S

AM

OS

TR

AS

AMOSTRAS

Modo Q

Modo R MATRIZ

Distância ou Similaridade

ES

CIE

S/ A

MB

IEN

TA

IS

ANÁLISE DIRETA

ANÁLISE INDIRETA

Page 6: Delineamento  Analises Multivariadas

Análise de Componentes Principais(ACP – PCA)

Estação/ Espécie Sp. A Sp. B

St. 1 1 1

St. 2 4 3

St. 3 5 5

St. 4 2 4

St. 5 6 4

St. 6 2 2

Page 7: Delineamento  Analises Multivariadas

ACP

Page 8: Delineamento  Analises Multivariadas

COMPONENTES PRINCIPAIS

st 4 st 5

st 2

st 6

st 1

st 3

Sp. A

Sp.

B

Page 9: Delineamento  Analises Multivariadas

NOVO SISTEMA DE EIXOS

st 2st 6

st 1

st 3

st 4

st 5CP 1

CP

2Sp. A

Sp. B

Page 10: Delineamento  Analises Multivariadas

Elipse, bisnaga & hipervolume

NOVO EIX

O

(CP1)

Page 11: Delineamento  Analises Multivariadas

NOVO SISTEMA DE EIXOS(modo R) - biplot

T. v

inicol

a

A. cinea

Variáveis

Observações

CP 1

CP

2

P. g

era

ncico

la

G. brunnea

St 1

St 10

St 9

St 5

St 2

St 3

St 8

St 4

St 7

St 6

Page 12: Delineamento  Analises Multivariadas

NOVO SISTEMA DE EIXOS (modo Q) – biplot

CP 1

Variáveis

Observações

CP

2

brejo

restinga

mata

cilia

r

flore

sta

Cap

Alu

Nem

Tec

Pac

Tal

Cil

Bec

Page 13: Delineamento  Analises Multivariadas

Quantos componentes interpretar ?

Componente Valor Absoluto

% da Variância

CP 1 1,890 64,4%

CP 2 0,602 20,4%

CP 3 0,401 13,6%

CP 4 0,021 0,7%

CP 5 0,014 0,5%

CP 6 0,013 0,4%

0 1 2 3 4 5 6 7 8 9 10Componentes Principais

0

1

2

3

4

5

Aut

o val

ores

0 1 2 3 4 5 6 7 8 9 10Componentes Principais

0

1

2

3

4

5

Aut

oval

ores

Valores reaisValores aleatorizados

Page 14: Delineamento  Analises Multivariadas

Quantos componentes interpretar ?

• Decisão numérica

• Decisão ecológica

Variáveis biologicamente explicáveis

Componente Valor Absoluto

% da Variância

CP 1 1,890 64,4%

CP 2 0,602 20,4%

CP 3 0,401 13,6%

CP 4 0,021 0,7%

CP 5 0,014 0,5%

CP 6 0,013 0,4%

Critério de Kaiser CP > 1

> Excesso de redundância

Page 15: Delineamento  Analises Multivariadas

Premissas da ACP

Linear Gaussiana

Monotônicas

1. Linearidade entre as variáveis

Page 16: Delineamento  Analises Multivariadas

2. Normalidade de cada variável (univariada).

3. Normalidade de todas as variáveis (multivariada)

4. Número de Variáveis << Observações (<50%)

5. Ausência de ‘valores extremos’ (‘outliers’)

Premissas da ACP

Page 17: Delineamento  Analises Multivariadas

Premissas da ACP

• Transformações

√x, Log (x+1), √ √x , Arcoseno

• Eliminação de valores extremos

‘outlier’ > 2,5 D.P.

• Violação das premissas →menos grave quando o objetivo da análise é apenas exploratório.

Page 18: Delineamento  Analises Multivariadas

Variações da ACP

• Gradientes pequenos (maior chance de dados monotônicos)

• Pouco conhecimento sobre o local

• Ausência de estruturação nas amostras (sem formação de grupos a priori.

• Eliminação de valores extremos

• Variáveis latentes.

Utilização da ACP

• Rotação secundária (varimax, quadrimax, etc...)

• Matriz → Correlação × Covariância

Page 19: Delineamento  Analises Multivariadas

ROTAÇÃO DOS EIXOS

st 4 st 5

st 2

st 6

st 1

st 3

Sp. A

Sp.

B

Page 20: Delineamento  Analises Multivariadas

Novo sistema de variáveis (latentes) a serem testadas

Page 21: Delineamento  Analises Multivariadas

Análise Discriminante ouAnálise de Variáveis Canônica

(AVC ou CVA)MANOVA

ACP AVC

Page 22: Delineamento  Analises Multivariadas

CVA(Discriminante)

4

-4 -3 -2 -1 0 1 2 3 4

Variável Canônica 1

-3

-2

-1

0

1

2

3V

ariá

vel C

anôn

ica

2

50m20m10m

GRUPO

Page 23: Delineamento  Analises Multivariadas

4

-4 -3 -2 -1 0 1 2 3 4

Variável Canônica 1

-3

-2

-1

0

1

2

3V

ariá

vel C

anôn

ica

2

50m20m10m

GRUPO

CVA(Discriminante)

Page 24: Delineamento  Analises Multivariadas

10 m 20 m 50 m classificação correta (%)

10 m 10 0 1 91 %

20 m 0 8 1 89 %

50 m 0 0 11 100 %

Total 10 8 13 94 %

10 m 20 m 50 m classificação correta (%)

10 m 9 1 1 82 %

20 m 1 7 1 78 %

50 m 0 1 10 91 %

Total 10 9 12 84 %

Matriz de classificação

Matriz de classificação corrigida (‘jacknife)

CVA(Discriminante)

Page 25: Delineamento  Analises Multivariadas

CVA (Discriminante)

Testando a Significância dos agrupamentos

• MANOVA

� Traço de Pillai

� Lambda de Wilks

• ANOVA das Variáveis Canônicas (Funções Discriminantes)

• Teste T de Hotelling

Page 26: Delineamento  Analises Multivariadas

CVA (Discriminante)

PREMISSAS

• Mesmas da ACP

APLICAÇÃO

• Objetivo é avaliar o que difere entre grupos

• Dados estruturados em grupos a priori

� Pontos de coleta formando grupos

� Amostras referentes a diferentes ambientes

� Morfometria (variação entre populações, espécies, etc.)

Page 27: Delineamento  Analises Multivariadas

Análise de Correspondência

Parcela 1 = 1 ind.Parcela 2 = 0 ind.Parcela 3 = 1 ind.Parcela 4 = 0 ind.Parcela 5 = 7 ind.Parcela 6 = 2 ind.Parcela 7 = 1 ind. Parcela 8 = 0 ind.Parcela 9 = 0 ind.

(1× 1) + (3 × 1) + (5× 7) + (6× 2) + (7× 1)/12 = 4,83

Espécie D

Média ponderada da Espécie D

= Escore de D por parcelas

Análise de GradientesT = 20o C = 2 ind.T = 22o C = 0 ind.T = 25o C = 1 ind.T = 28o C = 5 ind.T = 30o C = 3 ind.T = 32o C = 2 ind.

Espécie X

(20×2) + (25×1) + (28×5) + (30×3) + (32×2) / 13 = 27,61oC

Média ponderada da Espécie X

Escore de X para temperatura = temperatura ‘ideal’

Page 28: Delineamento  Analises Multivariadas

Análise de Correspondência

A B C D E F

ORDEM 1 2 3 4 5 6 M.P.

P1 1 1 9 3 1 2 6 3.55

P2 2 2 0 2 0 1 1 3.17

P3 3 3 3 2 1 2 2 3.15

P4 4 4 0 3 0 1 1 2.67

P5 5 3 1 2 7 1 2 3.50

P6 6 2 0 3 2 2 1 3.50

P7 7 1 1 2 1 2 2 3.89

P8 8 0 1 3 0 1 1 3.67

P9 9 0 0 2 0 2 0 4.00

M.P. 4.00 2.53 4.95 4.83 5.07 3.50

Page 29: Delineamento  Analises Multivariadas

Análise de Correspondência

-0.10 -0.05 0.00 0.05AC1

-0.05

0.00

0.05

0.10

AC

2

BP1 F

P8

P3EP7

D

P5

P6A

P4P2

P9

C

Page 30: Delineamento  Analises Multivariadas

Análise de Correspondência

A B C D E F

P1 1 9 3 1 2 6

P2 2 0 2 0 1 1

P3 3 3 2 1 2 2

P4 4 0 3 0 1 1

P5 3 1 2 7 1 2

P6 2 0 3 2 2 1

P7 1 1 2 1 2 2

P8 0 1 3 0 1 1

P9 0 0 2 0 2 0-0.10 -0.05 0.00 0.05

AC1

-0.05

0.00

0.05

0.10

AC

2

BP1 F

P8

P3EP7

D

P5

P6A

P4P2

P9

C

Page 31: Delineamento  Analises Multivariadas

Análise de Correspondência

A B C D E F

P1 1 9 3 1 2 6

P2 2 0 2 0 1 1

P3 3 3 2 1 2 2

P4 4 0 3 0 1 1

P5 3 1 2 7 1 2

P6 2 0 3 2 2 1

P7 1 1 2 1 2 2

P8 0 1 3 0 1 1

P9 0 0 2 0 2 0-0.10 -0.05 0.00 0.05

AC1

-0.05

0.00

0.05

0.10

AC

2

BP1 F

P8

P3EP7

D

P5

P6A

P4P2

P9

C

Page 32: Delineamento  Analises Multivariadas

Análise de CorrespondênciaDestendenciosa (‘Detrended’)

‘Efeito Ferradura’

C1 (CA)

C1

C2

C1 (DCA)

Page 33: Delineamento  Analises Multivariadas

Análise de Correspondência

PREMISSAS

• Espécies apresentam distribuição gaussiana ao longo dos gradientes ambientais.

• Homogeneidade das Variâncias

APLICAÇÃO

• Pode ser usada quando o número de variáveis ≈ observações

• Modo Q e R = equivalentes

• Gradientes ambientais amplos

Page 34: Delineamento  Analises Multivariadas

Análise de Correspondência

Linear Gaussiana

Monotônicas

Page 35: Delineamento  Analises Multivariadas

Análise de Correspondência Canônica (CANOCO)

• Extensão da Análise de Correspondência com duas matrizes.

• Extensão da Análise de Gradientes ou de Média Ponderada (univariada).

• Os gradientes da AC são condicionados pela matriz de variáveis abióticas.

• Análise direta expressa graficamente por (espécies x amostras x var. ambientais – joint-plot).

• Gradientes de espécies e estações por eixos ambientais

Page 36: Delineamento  Analises Multivariadas

Análise de Correspondência Canônica (ACC ou CANOCO)

Ple 6

Cec

1

Typ Ter

Au 2

5

O2

Temp

Zon

Page 37: Delineamento  Analises Multivariadas

Análise de Correspondência Canônica (CANOCO)

Page 38: Delineamento  Analises Multivariadas

Análise de Correlações Canônicas (COR)

PREMISSAS

• Mesmas da Análise de Componentes Principais

APLICAÇÃO

• Envolve dois grupos de variáveis

• Ambientais

• Bióticas

• Gera variáveis latentes que maximizam a explicação da variável latente biótica pela variável latente ambiental.

• Pouco recomendada devido a dificuldade de interpretação

• Recomenda-se interpretar um PCA a partir da projeção das variáveis ambientais no plano fatorial

Page 39: Delineamento  Analises Multivariadas

Análise de Redundância (RDA)

• Extensão da Análise de Componentes Principais (monotônica) com varáveis explicativas (duas matrizes).

• Semelhante à CANOCO (só que para distribuições monotônicas e não gaussianas)

• Extensão da COR (Análise de Correl. Canônicas) mas com a definição de variáveis predictivas (independentes).

• Sub-estimada em estudos ecológicos

• Premissas semelhantes as da ACP (monotonicidade) e da CANOCO

Page 40: Delineamento  Analises Multivariadas

Escalonamento Multidimensional não métrico (N-MDS ou MDS)

• Ordenação por escores

• Matriz de similaridades (modo Q) ordena observações (amostras)

• Mapa de pares de distâncias/similaridades projetadas em um espaço bidimensional – interpretação por proximidade.

• Não paramétrica – vantagens → premissas desvantagens → s/ variáveis latentes;

→ não preserva s2

Stress = 0,2 Stress = 0,1

Page 41: Delineamento  Analises Multivariadas

ACP (PCA)

AD, AVC(DA, CVA)

AC(CA)

ACC(CANOCO)

COR(COR)

ARD(RDA)

Esc. Multid.(MDS)

Variáveis Indif. I & Categ Indif. D & I Indif. D & I Indif.

Matrizes 1 1 1 2 2 2 1

Análise Indireta Indireta Indireta Direta Direta Direta Indireta

Relação entre Var.

Monotônica Monotônica Gaussiana Gaussiana Monotônica Monotônica N.A

Grupos

(a priori)

Não Sim Não Não Não Não Não

Forma da Matriz

Ob >> Var Ob>>Var>G Ob ≈ Var Ob ≈ Var Ob >> Var Ob >> Var Ob >> Var

Gradiente ambiental

restrito restrito amplo amplo restrito restrito Indif.

COMPARAÇÃO ENTRE AS DIFERENTES ANÁLISES DE ORDENAÇÃO

Page 42: Delineamento  Analises Multivariadas

CLASSIFICAÇÃO

Análise de Dendrograma (‘Cluster Analysis’)

A

B

E

F

H

C

D

G

I

J

A

B

E

F

H

C

D

G

I

J

0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

Page 43: Delineamento  Analises Multivariadas

CLASSIFICAÇÃOAnálise de Dendrograma (‘Cluster Analysis’)

TIPOS

• Medidas de similaridade ou distância:

�Jaccard, Sorensen, Distância Euclidiana, Bray-Curtis.

• Algorítimo de aglomeração:

� UPGMA, WPGMA, Ward, Neighbor-joining, etc...

APLICAÇÃO

• Organiza entidades (amostras, spp.) em grupos onde a similaridade interna é maximizada

• Não existem grupos a priori

• Sintetiza a análise para apenas alguns grupos G << N

• Identifica ‘outliers’

• Sintetiza as informações de um único grupo de variáveis (não hávariáveis predictivas/respostas)

Page 44: Delineamento  Analises Multivariadas

CLASSIFICAÇÃO

Análise de Dendrograma (‘Cluster Analysis’)

A

B

E

F

H

C

D

G

I

J

A

B

E

F

H

C

D

G

I

J

0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

Page 45: Delineamento  Analises Multivariadas

CLASSIFICAÇÃO

Análise de Dendrograma (‘Cluster Analysis’)Twinspan

A B E F H C D G I J

sp1

sp5

sp2

sp7

sp8

sp3

sp6

sp4

4 5 0 0 1 2 0 0 7 1

8 7 0 0 2 1 0 0 9 6

0 0 0 0 7 5 0 0 0 1

0 1 1 0 4 3 0 0 1 0

0 1 8 7 1 2 0 0 0 1

0 1 5 4 0 1 2 3 0 0

0 2 0 0 1 2 6 8 0 0

0 1 0 1 1 0 5 7 0 1

Page 46: Delineamento  Analises Multivariadas

CLASSIFICAÇÃOAnálise de Dendrograma (‘Cluster Analysis’)

LIMITAÇÕES

• Muito sensível à ‘outliers’

• Sempre procura grupos minimizando diferenças internas e maximizando externas → ordenação não procura grupos

• Difícil a determinação do número de grupos e do nível de formação destes, exceto quando bem estruturados

• Muitas opções de distâncias/similaridades e de métodos de aglomeração – leva muitas vezes a resultados muito distintos.

• Agrupamentos formados por dicotomias, não realísticos em estudos de comunidades – mais aplicáveis a estudos evolutivos.

Page 47: Delineamento  Analises Multivariadas

CLASSIFICAÇÃO

Análise de Dendrograma (‘Cluster Analysis’)

A

B

E

F

H

C

D

G

I

J

K

0 10 20 30 40 50 60 70 80 90 100 %

Page 48: Delineamento  Analises Multivariadas

AM

OS

TR

AS

TESTES DE HIPÓTESE MULTIVARIADOS POR ALEATORIZAÇÃO

TESTE DE MANTEL

AM

OS

TR

AS

AMOSTRAS

MATRIZ DE SIMILARIDADE MATRIZ DE DISTÂNCIA

AM

OS

TR

AS

AMOSTRAS

CORRELAÇÃO

ALEATORIZAÇÃO

ALEATORIZAÇÃO

CORRELAÇÃO

R = 0,40

R1 = 0,38R2 = 0,36R3 = 0,47R4 = 0,15R5 = 0.10...............

98%

R = 0,40

Page 49: Delineamento  Analises Multivariadas

TESTE DE MANTEL

PREMISSAS

• As mesmas da correlação linear

APLICAÇÃO

• Compara duas ou mais matrizes de similaridades

� Biótica × Distância geográfica

� Biótica × Ambiental

� Biótica × Modelo

� Biótica × Distância geográfica × Ambiental

• Não paramétrico mas monotônico

• Elimina o problema da dependência dos dados (autocorrelação)

• Não apresenta graficamente a estruturação, apenas testa a hipótese de dependência entre as matrizes.

Page 50: Delineamento  Analises Multivariadas

TESTE DE MANTEL

AM

OS

TR

AS

AMOSTRAS

MATRIZ DE SIMILARIDADE

×

A

A

A

B

B

B

B

MATRIZ DO MODELO

1

1

1

0

0

0

0

A A A B B B B

1

1

0

0

0

0

1

0

0

0

0

1

1 1

1 1 1

1 1 1 1

Biótica × Modelo

(Ex.: ANOSIM)

Page 51: Delineamento  Analises Multivariadas

TESTE DE MANTEL PARCIAL

Biótica × Distância geográfica × Ambiental

BIÓTICA

ESPACIAL (DISTÂNCIA)

CORRELAÇÃO

AMBIENTAL

CORRELAÇÃO

CORRELAÇÃO Espúria ?

Page 52: Delineamento  Analises Multivariadas

TESTE DE MANTEL PARCIAL

Biótica × Distância geográfica × Ambiental

BIÓTICA

ESPACIAL (DISTÂNCIA)

REGRESSÃOAMBIENTAL REGRESSÃO

Res

íduo

Resíduo

AMBIENTAL (resídual) BIÓTICA (residual)

TESTE DE MANTEL

Page 53: Delineamento  Analises Multivariadas

ANÁLISES MULTIVARIADAS

• Análises ainda muito exploratórias.

• Fornecimento de variáveis latentes – promissor em estudos ecológicos.

• Grande desenvolvimento de diferentes métodos nas últimas décadas (embora antigas).

• Fim ou Meio ?

Page 54: Delineamento  Analises Multivariadas

Fim


Top Related