delineamentos multivariados métodos de reamostragem e ......anÁlises multivariadas • análises...
Post on 29-Sep-2020
2 Views
Preview:
TRANSCRIPT
• Delineamentos Multivariados
• Métodos de reamostragem e permutação
ANÁLISES MULTIVARIADAS
• Análises que trabalham com mais de uma variável dependente.
• Análises principalmente exploratórias.
• Inferências estatísticas possíveis em alguns casos.
• Análises recomendadas em estudos de comunidades.
• TIPOS
ü Classificação (classificar em grupos)
ü Ordenação (ordenar em gradientes)
ORDENAÇÃO • Ordenar dados ao longo de gradientes (variáveis)
ü Reduzir o número de variáveis para permitir o reconhecimento de padrões só com as variáveis realmente importantes (Análise Exploratória)
ü Fornecer uma nova combinação de variáveis, as
variáveis latentes, que podem ser tratadas como novas variáveis para análises estatísticas (ANOVA, teste t, Regressão).
ü Variáveis bióticas, ambientais ou ambas
ü Variáveis explicativas (independentes) ou dependentes
ORDENAÇÃO ü Relação entre variáveis biológicas (espécies ou táxons) a
partir de observações (amostras).
ü Análises indiretas: padrões de ordenação explicados por variáveis ambientais não analisadas diretamente.
Análise de Componentes Principais Análise Discriminante
Análise de Correspondência Análise de Cordenadas Principais Escalonamento Multidimensional
ü Análises diretas: padrões de ordenação calculados a partir de dados bióticos e ambientais concomitantemente
Análise de Gradientes Análise de Correspondência Canônica
Análise de Redundância Análise de Correlação Canônica
ORDENAÇÃO
VARIÁVEIS VARIÁVEIS AMBIENTAIS
...
2 5 5 3 4
Sp. B
... 1 6 5 4 2
Sp. A
... ... St. Y
... 2 St. 5
... 1 St. 4
... 2 St. 3
... 12 St. 2
... 3 St. 1
Sp. X
Sp. C
Espécie Estação
...
2 5 5 3 4
Temp
... 1 6 5 4 2
NO3
... ...
... 2
... 1
... 2
... 12
... 3 x Altitude
OB
SE
RVA
ÇÕ
ES
/OB
JETO
S
(uni
dade
s am
ostra
is)
ESPÉCIES
AM
OS
TRA
S
AMOSTRAS
Modo R Modo Q
COLUNAS<< LINHAS
ES
PÉ
CIE
S
ORDENAÇÃO VARIÁVEIS (ESPÉCIES)
AM
OS
TRA
S
VARIÁVEIS AMBIENTAIS
AM
OS
TRA
S
Modo R
AM
OS
TRA
S
AMOSTRAS
MATRIZ
Distância ou Similaridade
ESPÉCIES/AMBIENTAIS
ES
PÉ
CIE
S/ A
MB
IEN
TAIS
Modo Q
ANÁLISE DIRETA
ANÁLISE INDIRETA
MATRIZ
Correlação ou Covariância
ESPÉCIES
ES
PÉ
CIE
S
ORDENAÇÃO VARIÁVEIS
AMBIENTAIS
MATRIZ
Correlação ou Covariância
VARIÁVEIS (ESPÉCIES)
AM
OS
TRA
S
AM
OS
TRA
S
ESPÉCIES
ES
PÉ
CIE
S
AM
OS
TRA
S
AMOSTRAS
Modo Q
Modo R MATRIZ
Distância ou Similaridade
ANÁLISE DIRETA
ESPÉCIES/ AMBIENTAIS
ES
PÉ
CIE
S/ A
MB
IEN
TAIS
ANÁLISE INDIRETA
Análise de Componentes Principais
(ACP – PCA)
Estação/ Espécie Sp. A Sp. B St. 1 1 1 St. 2 4 3 St. 3 5 5 St. 4 2 4 St. 5 6 4 St. 6 2 2
ACP
COMPONENTES PRINCIPAIS
st 4 st 5
st 2
st 6
st 1
st 3
Sp. A
Sp.
B
NOVO SISTEMA DE EIXOS
st 2 st 6
st 1
st 3
st 4
st 5 CP 1
CP
2
Elipse, bisnaga & hipervolume
NOVO SISTEMA DE EIXOS
(modo R) - biplot
Variáveis
Observações
CP 1 C
P 2
St 1
St 10
St 9
St 5
St 2
St 3
St 8
St 4
St 7
St 6
Quantos componentes interpretar ?
Componente Valor Absoluto
% da Variância
CP 1 1,890 64,4% CP 2 0,602 20,4% CP 3 0,401 13,6% CP 4 0,021 0,7% CP 5 0,014 0,5% CP 6 0,013 0,4%
0 1 2 3 4 5 6 7 8 9 10Componentes Principais
0
1
2
3
4
5
Aut
oval
ores
0 1 2 3 4 5 6 7 8 9 10Componentes Principais
0
1
2
3
4
5
Auto
valo
res
Valores reaisValores aleatorizados
• Aleatorização
• Modelo ‘Broken-stick’
Quantos componentes interpretar ? • Decisão numérica
• Decisão ecológica
Variáveis biologicamente explicáveis
Componente Valor
Absoluto % da
Variância CP 1 1,890 64,4% CP 2 0,602 20,4% CP 3 0,401 13,6% CP 4 0,021 0,7% CP 5 0,014 0,5% CP 6 0,013 0,4%
Critério de Kaiser CP > 1
> Excesso de redundância
Premissas da ACP
Linear Gaussiana
Monotônicas
1. Linearidade entre as variáveis
2. Normalidade de cada variável (univariada).
3. Normalidade de todas as variáveis (multivariada) 4. Número de Variáveis < Observações (~50% ) 5. Ausência de ‘valores extremos’ (‘outliers’)
Premissas da ACP
Premissas da ACP
(como atingir)
• Transformações √x, Log (x+1), √ √x , Arcoseno
• Eliminação de valores extremos ‘outlier’ > 2,5 D.P. • Violação das premissas → menos grave quando o objetivo
da análise é apenas exploratório.
Variações da ACP
• Rotação secundária (varimax, quadrimax, etc...)
ROTAÇÃO DOS EIXOS
st 4 st 5
st 2
st 6
st 1
st 3
Sp. A
Sp.
B
Variações da ACP
• Gradientes pequenos (maior chance de dados monotônicos). • Pouco conhecimento sobre o local. • Ausência de estruturação nas amostras (sem formação de
grupos a priori ).
• Eliminação de valores extremos.
• Variáveis latentes.
Utilização da ACP
• Rotação secundária (varimax, quadrimax, etc...)
• Matriz → Correlação × Covariância
Análise de Componentes Principais
(ACP – PCA)
Es tação / Espécie
Sp. A Sp. B
St. 1 1 1 St. 2 4 3 St. 3 5 5 St. 4 2 4 St. 5 6 4 St. 6 2 2
Análise de Componentes Principais
(ACP – PCA)
Es tação / Espécie
Sp. A Sp. B PC1
St. 1 1 1 -2,2 St. 2 4 3 0,4 St. 3 5 5 1,8 St. 4 2 4 -0,5 St. 5 6 4 2,0 St. 6 2 2 -1,2
st 2 st 6 st 1
st 3 st 4
st 5
CP 1 C
P 2
-2 -1 0 1 2
FUNDO
RASO
MÉDIAS: Fundo=-0,00003 Raso= 0,1
GL SQ QM F p Localidade 1 0,01 0,01 0,004 0,95 Resíduo 4 13,90 3,47
Novo sistema de variáveis (latentes) a serem testadas
indicate that it is possible to discriminate the two sitesonly when diversity is calculated for replicate corespooled in Plots (0·04 m2), i.e., when comparing twodifferent places, different dominance and diversitypatterns are obtained, depending on the sample size.When all surveys are taken together, the diversity andevenness measured for Plots (0·04 m2) are not sensi-tive to temporal variations (Figure 5), i.e. they showeddifferences between Sites, but when measured forsmaller (0·008 m2) or greater (0·012 m2) samples thetwo Sites are not distinguishable, indicating that thepattern of temporal variation was quite different when
both indices were measured for different samplesizes.
Biocenosis descriptors
To evaluate the variation of species combination asused in standard community surveys, an ANOVAwas also applied for the scores obtained in the PCA.The first principal component which accounts forthe largest variation of the species data matrixshowed significant interaction (Site!Time), so indi-cating the complex spatial to temporal pattern for the
TABLE 1. Most frequent (>5% of frequency of occurrences) or abundant (>10 ind m"2) species
Main species Taxonomic group Ind m"2Occurrences
(%)
1 Lumbrineris curtolobata Polychaeta 392 642 Spiochaetopterus costarum Polychaeta 188 583 Owenia fusiformis Polychaeta 135 494 Magelona variolamellata Polychaeta 131 445 Magelona papillicornis Polychaeta 115 446 Pholoididae gen. sp. Polychaeta 110 287 Corbula cariboea Bivalvia 84 378 Amphiodia atra Ophiuroidea 75 459 Nucula puelcha Bivalvia 74 3210 Magelona posterolongata Polychaeta 56 2911 Amphiodia riisei Ophiuroidea 48 3112 Terebellides anguicomus Polychaeta 44 2113 Neanthes bruaca Polychaeta 39 2414 Hemipholis elongata Ophiuroidea 38 2315 Eunoe papillosa Polychaeta 35 2216 Eunice prayensis Polychaeta 31 1917 Diplodonta danieli Bivalvia 28 1918 Pectinaria (Pectinaria) laelia Polychaeta 26 1619 Clymenella sp. Polychaeta 26 1520 Melaniella sp. Gastropoda 24 1421 Batea catharinensis Amphipoda 24 222 Tellina sp. Bivalvia 23 1723 Abra lioica Bivalvia 23 1424 Entodesma sp. Bivalvia 22 1325 Fimbriosthenelais marianae Polychaeta 22 1626 Ctena pectinella Bivalvia 21 1427 Dosinia concentrica Bivalvia 21 1428 Felaniella cf. candena Gastropoda 21 1229 Amphitalamus vallei Gastropoda 20 1330 Mooreonuphis lineata Polychaeta 20 1131 Parandalia tricuspis Polychaeta 18 1232 Amphicteis gunneri Polychaeta 17 833 Ceratocephale oculata Polychaeta 17 834 Finella dubia Gastropoda 17 735 Scoloplos (Leodamas) sp. Polychaeta 13 936 Tharyx sp. Polychaeta 13 837 Voluvella sp. Gastropoda 13 938 Sthenolepis grubei Polychaeta 12 839 Tiburonella viscana Amphipoda 11 740 Axiothella brasiliensis Polychaeta 10 6
428 P. C. Paiva
Novo sistema de variáveis (latentes) a serem testadas
Novo sistema de variáveis (latentes) a serem testadas
Análise Discriminante ou Análise de Variáveis Canônica
(AVC ou CVA) MANOVA
ACP AVC
CVA
(Discriminante) 4
-4 -3 -2 -1 0 1 2 3 4 Variável Canônica 1
-3
-2
-1
0
1
2
3
Variá
vel C
anôn
ica
2
50m
20m
10m
GRUPO
4
-4 -3 -2 -1 0 1 2 3 4 Variável Canônica 1
-3
-2
-1
0
1
2
3
Variá
vel C
anôn
ica
2
50m
20m
10m
GRUPO
CVA
(Discriminante)
10 m 20 m 50 m classificação correta (%)
10 m 10 0 1 91 % 20 m 0 8 1 89 % 50 m 0 0 11 100 % Total 10 8 13 94 %
10 m 20 m 50 m classificação correta (%)
10 m 9 1 1 82 % 20 m 1 7 1 78 % 50 m 0 1 10 91 % Total 10 9 12 84 %
Matriz de classificação
Matriz de classificação corrigida (‘jacknife)
CVA (Discriminante)
CVA (Discriminante)
Testando a Significância dos agrupamentos
• MANOVA
ü Traço de Pillai
ü Lambda de Wilks
• ANOVA das Variáveis Canônicas (Funções Discriminantes)
• Teste T de Hottelling
CVA (Discriminante)
PREMISSAS
• Mesmas da ACP
APLICAÇÃO
• Objetivo é avaliar o que difere entre grupos
• Dados estruturados em grupos a priori
ü Pontos de coleta formando grupos
ü Amostras referentes a diferentes ambientes
ü Morfometria (variação entre populações, espécies, etc.)
Análise de Correspondência
Hipótese de distribuição uniforme entre amostras &
espécies
A B C D E F
P1 1 9 3 1 2 6
P2 2 0 2 0 1 1
P3 3 3 2 1 2 2
P4 4 0 3 0 1 1
P5 3 1 2 7 1 2
P6 2 0 3 2 2 1
P7 1 1 2 1 2 2
P8 0 1 3 0 1 1
P9 0 0 2 0 2 0
Análise de Correspondência
Parcela 1 = 1 ind. Parcela 2 = 0 ind. Parcela 3 = 1 ind. Parcela 4 = 0 ind. Parcela 5 = 7 ind. Parcela 6 = 2 ind. Parcela 7 = 1 ind. Parcela 8 = 0 ind. Parcela 9 = 0 ind.
(1× 1) + (3 × 1) + (5×7) + (6× 2) + (7× 1)/12 = 4,83
Espécie D
• Média ponderada da Espécie D
• = Escore de D por parcelas
Análise de Correspondência
A B C D E F
ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00
M.P. 4.00 2.53 4.95 4.83 5.07 3.50
Análise de Correspondência
A B C D E F
ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00
M.P. 4.00 2.53 4.95 4.83 5.07 3.50
Análise de Correspondência
A B C D E F
ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00
M.P. 4.00 2.53 4.95 4.83 5.07 3.50
Análise de Correspondência
-0.10 -0.05 0.00 0.05 AC1
-0.05
0.00
0.05
0.10 A
C2
B P1
F
P8
P3 E
P7
D
P5
P6
A
P4 P2
P9
C
Análise de Correspondência
A B C D E F
P1 1 9 3 1 2 6 P2 2 0 2 0 1 1 P3 3 3 2 1 2 2 P4 4 0 3 0 1 1 P5 3 1 2 7 1 2 P6 2 0 3 2 2 1 P7 1 1 2 1 2 2 P8 0 1 3 0 1 1 P9 0 0 2 0 2 0 -0.10 -0.05 0.00 0.05
AC1
-0.05
0.00
0.05
0.10
AC
2
B P1 F
P8
P3 E P7
D
P5
P6
A
P4 P2
P9
C
Análise de Correspondência
A B C D E F
P1 1 9 3 1 2 6
P2 2 0 2 0 1 1
P3 3 3 2 1 2 2
P4 4 0 3 0 1 1
P5 3 1 2 7 1 2
P6 2 0 3 2 2 1
P7 1 1 2 1 2 2
P8 0 1 3 0 1 1
P9 0 0 2 0 2 0 -0.10 -0.05 0.00 0.05 AC1
-0.05
0.00
0.05
0.10
AC
2
B P1 F
P8
P3 E P7
D
P5
P6
A
P4 P2
P9
C
Análise de Correspondência Destendenciosa (‘Detrended’)
‘Efeito Ferradura’
C1 (CA)
C1
C2
C1 (DCA)
Análise de Correspondência
PREMISSAS
• Espécies apresentam distribuição gaussiana ao longo dos gradientes ambientais.
• Homogeneidade das Variâncias
APLICAÇÃO
• Pode ser usada quando o número de variáveis ≈ observações
• Modo Q e R = equivalentes
• Gradientes ambientais amplos
Análise de Correspondência
Linear Gaussiana
Monotônicas
Análise de Coordenadas Principais (PCoA)
= Escaloneamento Multidimensional Métrico
PREMISSAS
• Mesmas da Análise de Componentes Principais
APLICAÇÃO
• Matriz de similaridades (modo Q) ordena observações (amostras)
• Mapa de pares de distâncias/similaridades projetadas em um espaço bidimensional – interpretação por proximidade.
• Os eixos não tem significado real embora indiquem a variação - apenas as distâncias entre os objetos (estações)
Análise de Coordenadas Principais (PCoA)
= Escaloneamento Multidimensional Métrico
Escalonamento Multidimensional não métrico
(N-MDS ou MDS) • Ordenação por escores
• Matriz de similaridades (modo Q) ordena observações (amostras)
• Mapa de pares de distâncias/similaridades projetadas em um espaço bidimensional – interpretação por proximidade.
• Não paramétrica – vantagens → premissas desvantagens → s/ variáveis latentes; → não preserva s2
Stress = 0,2 Stress = 0,1
• Variáveis biológicas e ambientais analisadas conjuntamente
2 conjuntos de dados = 2 matrizes
Análises Diretas
Análise de Gradientes
T = 20o C = 2 ind. T = 22o C = 0 ind. T = 25o C = 1 ind. T = 28o C = 5 ind. T = 30o C = 3 ind. T = 32o C = 2 ind.
Espécie X
(20×2) + (25×1) + (28×5) + (30×3) + (32×2) / 13 = 27,61oC
• Média ponderada da Espécie X
• Escore de X para temperatura = temperatura ‘ideal’
Análise de Correspondência Canônica
(CANOCO)
• Extensão da Análise de Correspondência com duas matrizes.
• Extensão da Análise de Gradientes ou de Média Ponderada (univariada).
• Os gradientes da AC são condicionados pela matriz de variáveis abióticas.
• Análise direta expressa graficamente por (espécies x amostras x var. ambientais – joint-plot).
• Gradientes de espécies e estações por eixos ambientais
Análise de Correspondência Canônica
(ACC ou CANOCO)
Ple 6
Cec
1
Typ Ter
Au 2
5
O2
Temp
Zon
Análise de Redundância
(RDA)
• Extensão da Análise de Componentes Principais (monotônica) com varáveis explicativas (duas matrizes).
• Semelhante à CANOCO (só que para distribuições monotônicas e não gaussianas)
• Extensão da COR (Análise de Correl. Canônicas) mas com a definição de variáveis predictivas (independentes).
• Sub-estimada em estudos ecológicos.
• Premissas semelhantes às da ACP (monotonicidade) e da CANOCO.
Análise de Redundância (RDA)
Análise de Correlações Canônicas (COR)
PREMISSAS
• Mesmas da Análise de Componentes Principais
APLICAÇÃO
• Envolve dois grupos de variáveis:
• Ambientais
• Bióticas
• Gera variáveis latentes que maximizam a explicação da variável latente biótica pela variável latente ambiental.
• Pouco recomendada devido a dificuldade de interpretação
• Recomenda-se interpretar um PCA a partir da projeção das variáveis ambientais no plano fatorial
ACP (PCA)
AD, AVC (DA, CVA)
AC (CA)
ACC (CANOCO)
COR (COR)
ARD (RDA)
Esc. Multid. (MDS)
Variáveis Indif. I & Categ Indif. D & I Indif. D & I Indif.
Matrizes 1 1 1 2 2 2 1
Análise Indireta Indireta Indireta Direta Direta Direta Indireta
Relação entre Var.
Monotônica Monotônica
Gaussiana
Gaussiana
Monotônica Monotônica N.A
Grupos (a priori)
Não Sim Não Não Não Não Não
Forma da Matriz
Ob > Var Ob>>Var>G Ob ≈ Var Ob >Var
Ob >> Var
Ob >>Var
Ob ≈ Var
Gradiente ambiental
restrito restrito amplo amplo
restrito
restrito
Indif.
COMPARAÇÃO ENTRE AS DIFERENTES ANÁLISES DE ORDENAÇÃO
CLASSIFICAÇÃO
Análise de Dendrograma (‘Cluster Analysis’)
A
B
E
F
H
C
D
G
I
J
A
B
E
F
H
C
D
G
I
J
0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’)
TIPOS
• Medidas de similaridade ou distância:
ü Jaccard, Sorensen, Distância Euclidiana, Bray-Curtis.
• Algorítimo de aglomeração:
ü UPGMA, WPGMA, Ward, Neighbor-joining, etc...
APLICAÇÃO
• Organiza entidades (amostras, spp.) em grupos onde a similaridade interna é maximizada
• Não existem grupos a priori
• Sintetiza a análise para apenas alguns grupos G << N
• Identifica ‘outliers’
• Sintetiza as informações de um único grupo de variáveis (não há variáveis predictivas/respostas)
CLASSIFICAÇÃO
Análise de Dendrograma (‘Cluster Analysis’)
A
B
E
F
H
C
D
G
I
J
A
B
E
F
H
C
D
G
I
J
0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
CLASSIFICAÇÃO
Análise de Dendrograma (‘Cluster Analysis’) Twinspan
A B E F H C D G I J
sp1
sp5
sp2
sp7
sp8
sp3
sp6
sp4
4 5 0 0 1 2 0 0 7 1
8 7 0 0 2 1 0 0 9 6
0 0 0 0 7 5 0 0 0 1
0 1 1 0 4 3 0 0 1 0
0 1 8 7 1 2 0 0 0 1
0 1 5 4 0 1 2 3 0 0
0 2 0 0 1 2 6 8 0 0
0 1 0 1 1 0 5 7 0 1
CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster
Analysis’)
LIMITAÇÕES
• Muito sensível à ‘outliers’
• Sempre procura grupos minimizando diferenças internas e maximizando externas → ordenação não procura grupos
• Difícil a determinação do número de grupos e do nível de formação destes, exceto quando bem estruturados
• Muitas opções de distâncias/similaridades e de métodos de aglomeração – leva muitas vezes a resultados muito distintos.
• Agrupamentos formados por dicotomias, não realísticos em estudos de comunidades – mais aplicáveis a estudos evolutivos.
CLASSIFICAÇÃO
Análise de Dendrograma (‘Cluster Analysis’)
A
B
E
F
H
C
D
G
I
J
K
0 10 20 30 40 50 60 70 80 90 100 %
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
K- Means
K- Means
1. Definindo o número de grupos (K = 3) 2. Escolhendo “sementes” dos grupos
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
K- Means
1. Definindo o número de grupos (K = 3) 2. Escolhendo “sementes” dos grupos 3. Ligando as sementes
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
K- Means
1. Definindo o número de grupos (K = 3) 2. Escolhendo “sementes” dos grupos 3. Ligando as sementes 4. Separando nos grupos
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
K- Means
1. Calculando centróide
✪
✪ ✪
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2
K- Means
1. Calculando centróide 2. Religando
✪
✪ ✪
0 1 2 3 4 5 6 7 8 Espécie 1
0
1
2
3
4
5
6
Esp
écie
2 ✪
✪ ✪
K- Means
1. Calculando centróide 2. Religando 3. Novos grupos 4. Novos centróides ..... até estabilizar os grupos
K- Means
• Número de grupos determinado pode ser determinado à posteriori
• Grupos não são hierárquicos (como nas Análise de Dendrograma)
2 4 6 8 10 12
K-means partitions comparison
Objects
Num
ber o
f gro
ups
in e
ach
parti
tion
23
45
2 4 6 8 10 12 7 9 11
calinskicriterion
Values
23
45
7 9 11
K- Means
• Número de grupos determinado pode ser determinado à posteriori
• Grupos não são hierárquicos (como nas Análise de Dendrograma)
2 4 6 8 10 12
K-means partitions comparison
Objects
Num
ber o
f gro
ups
in e
ach
parti
tion
23
45
67
89
11
2 4 6 8 10 12 6 8 10
calinskicriterion
Values
23
45
67
89
11
6 8 10
ANÁLISES MULTIVARIADAS
• Análises ainda muito exploratórias.
• Fornecimento de variáveis latentes – promissor em estudos ecológicos.
• Grande desenvolvimento de diferentes métodos nas últimas décadas (embora antigas).
• Fim ou Meio ?
PERMUTAÇÃO, ‘JACKNIFE’, ‘BOOTSTRAP’
& SIMULAÇÕES DE MONTE CARLO
• Estatística não paramétrica (uni ou multivariada) • ‘Gerando o Acaso’ (= modelos nulos)
PERMUTAÇÃO
(análoga à correlação)
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
R = 0,39 P = 0,09
PERMUTAÇÃO
(análoga à correlação)
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2
R = 0,39 P = 0,09
R 0,10
IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2
PERMUTAÇÃO
(análoga à correlação)
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2
R = 0,39 P = 0,09
R 0,10 0,01
IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2
PERMUTAÇÃO
(análoga à correlação)
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2
IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2
R = 0,39 P = 0,09
R 0,10 0,01 0,09
PERMUTAÇÃO
(análoga à correlação)
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2
R = 0,39 P = 0,09
R 0,10 0,01 0,09 0,41 -‐0,44 0,06 0,05 0,26 0,15
IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2
PERMUTAÇÃO
(análoga à correlação)
R 1º 0,41 2º 0,26 3º 0,15 . 0,10 . 0,09 . 0,06 . 0,05 . 0,01 . -‐0,05
10º -‐0,44
0,39 0,39 entre o 1º e o 2º Dez modelos nulos
1/10 = 0,1 Prob, de acaso < 0,1
P = 0,1
R = 0,39 P = 0,09
COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2
PERMUTAÇÃO (análoga a teste ‘t’)
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
PERMUTAÇÃO (análoga a teste ‘t’)
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
3,30 4,11
0,81
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
XB XA XB -‐XA 4.00 3.33 0.67
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67 4.00 3.33 0.67
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67 4.00 3.33 0.67 4.20 3.11 1.09
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67 4.00 3.33 0.67 4.20 3.11 1.09 3.40 4.00 0.60 3.40 4.00 0.60 4.20 3.11 1.09 3.00 4.44 1.44 3.30 4.11 0.81 4.00 3.33 0.67 3.30 4.11 0.81
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
XB XA ΙXB -‐XAΙ 4.00 3.33 0.67 4.00 3.33 0.67 4.20 3.11 1.09 3.40 4.00 0.60 3.40 4.00 0.60 4.20 3.11 1.09 3.00 4.44 1.44 3.30 4.11 0.81 4.00 3.33 0.67 3.30 4.11 0.81
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
ESPÉCIE A A A A A A A A A A B B B B B B B B B
PERMUTAÇÃO (análoga a teste ‘t’)
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
Ι XB-‐XA Ι ordenado
1,44 1,09 1,09 0,81 0,81 0,67 0,67 0,67 0,60 0,60
0,81 – quarto valor em Dez modelos nulos
4/10 = 0,4 Prob. de acaso < 0,4
P = 0,4
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
PERMUTAÇÃO (análoga a teste ‘t’)
BOOTSTRAP
(análogo ao teste ‘t’)
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
ESPÉCIE A 1 2 3 4 3 2 5 6 4 3
2 2 2 2 2 3 3 3 4 5 Bootstrap 1
5 2 1 3 4 3 2 4 5 5 Bootstrap 2
BOOTSTRAP
COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
XA XB Ι XB-‐XA Ι 4,1 4,44 0,34 3,3 3,67 0,37 3,3 3,78 0,48 2,6 2,78 0,18 3,6 3,89 0,29 4,2 2,89 1,31 2,9 4 1,1 3,8 4,22 0,42 3,1 3,22 0,12 4,5 3,11 1,39
1 1 3 1 3 7 6 6 4 5 A 7 3 2 1 5 7 2 3 2 2 A 6 3 5 3 1 5 4 3 6 4 A 2 3 3 3 1 3 3 2 4 6 A 5 2 2 4 3 4 1 5 2 4 A 5 5 3 3 6 4 1 3 2 5 A 3 2 2 3 2 4 2 6 3 5 A 5 3 6 3 6 3 4 2 2 4 A 4 6 4 2 6 3 5 5 3 5 A 3 5 3 3 3 2 1 3 3 5 A 4 2 2 2 4 4 3 7 4 4 B 4 3 6 4 4 2 4 3 3 3 B 5 5 3 3 1 1 3 3 3 3 B 4 7 3 4 4 2 6 1 4 1 B 4 3 2 1 4 6 5 7 4 4 B 6 1 4 4 4 3 4 5 1 4 B 4 3 6 3 6 1 4 3 5 1 B 4 5 4 3 5 3 4 5 3 4 B 5 4 4 1 3 4 3 4 2 4 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
ESPÉCIE A A A A A A A A A A B B B B B B B B B
BOOTSTRAP
COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
Ord 1º 1,39 2º 1,31 3º 1,10 . 0,48 . 0,42 . 0,37 . 0,34 . 0,29 . 0,18
10º 0,12
0,81
BOOTSTRAP
COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B
Ord 1º 1,39 2º 1,31 3º 1,10 . 0,48 . 0,42 . 0,37 . 0,34 . 0,29 . 0,18
10º 0,12
XA = 3,30 XB = 4,11
XB-‐XA = 0,81
Test ‘t’ P = 0, 31
0,81 – entre o 3º e o 4º Dez modelos nulos
4/10 = 0,4 Prob. de acaso < 0,4
P = 0,4
0,81
ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
-‐1,39 0, 30 1,10
0,81
JACKNIFE (=CANIVETE)
ESPÉCIE A ESPÉCIE B
1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7
ESPÉCIE A 1 2 3 4 3 2 5 6 4 3
2 3 4 3 2 5 6 4 3 Pseudoamostra 1
1 3 4 3 2 5 6 4 3 Pseudoamostra 2
1 2 4 3 2 5 6 4 3 Pseudoamostra 3
ESTATÍSTICA PARAMÉTRICA
Distribuição Populacional (desconhecida)
Amostra {18, 18, 20, 23 25, 28}
Esgmagva x = 22 S= 4,05
PRECISÃO Intervalo de confiança 95% (17,8 – 26,2)
‘BOOTSTRAP’
Distribuição Populacional (desconhecida)
Amostra Esgmagva
População esgmada
Bootstrap 1 Bootstrap 2 Bootstrap 3 Bootsrap 4
Esgmagva Bootstrap 1
Esgmagva Bootstrap 2
Esgmagva Bootstrap 3
Esgmagva Bootstrap 4
PRECISÃO Erro padrão
Intervalo de confiança
‘SIMULAÇÃO DE MONTE CARLO’
Distribuição Populacional (parâmetros populacionais definidos pela amostra)
Distribuição das esgmagvas construída a pargr De múlgplas simulações
Simulação 1 Simulação 2 Simulação 3 Simulação 4 (amostra) (amostra) (amostra) (amostra)
Esgmagva 1
Esgmagva 2 Esgmagva 3 Esgmagva 4
Amostra
X S
E1 E4 E3 E2 E...
‘SIMULAÇÃO DE MONTE CARLO’
Loc A = {2, 2, 3, 4, 2, 5, 3, 2, 6, 2, 3, 4, 6, 2, 1, 4, 3, 7, 2, 3, 4, 4, 5, 8, 5, 2, 1, 3, 4, 4, 3} N= 31
Loc B = {2, 2, 3, 2, 4, 2, 3, 2, 8, 9, 2, 9, 3, 2, 3, 3, 3, 9} N=18 Se fazem parte da mesma população – então LocA+LocB tem a uma distribuição única MÉDIA (Loc A+Loc B) = 3,17 S= 2,1 Simulações: amostras com n= 31 e n= 18 (Loc A e Loc B) de Distr. Normal (X= 3,15 e S = 2,1) Calcular diferenças entre as médias de Loc A e Loc B das simulações
Média (Loc A) – Média (Loc B)
Distribuição das diferenças entre média das simulações Média (Loc Asim)-‐ Média(Loc Bsim)
TESTES DE HIPÓTESE MULTIVARIADOS POR ALEATORIZAÇÃO TESTE DE MANTEL
AM
OS
TRA
S
AMOSTRAS
MATRIZ DE SIMILARIDADE MATRIZ DE DISTÂNCIA
AM
OS
TRA
S
AMOSTRAS
AM
OS
TRA
S
ALEATORIZAÇÃO
CORRELAÇÃO
R = 0,40
R1 = 0,38 R2 = 0,36 R3 = 0,47 R4 = 0,15 R5 = 0.10 ...............
98%
R = 0,40
TESTE DE MANTEL
PREMISSAS
• As mesmas da correlação linear
APLICAÇÃO
• Compara duas ou mais matrizes de similaridades
ü Biótica × Distância geográfica
ü Biótica × Ambiental
ü Biótica × Modelo
ü Biótica × Distância geográfica × Ambiental
• Não paramétrico mas monotônico
• Elimina o problema da dependência dos dados (autocorrelação)
• Não apresenta graficamente a estruturação, apenas testa a hipótese de dependência entre as matrizes.
TESTE DE MANTEL PARCIAL
Biótica × Distância geográfica × Ambiental
BIÓTICA
ESPACIAL (DISTÂNCIA)
AMBIENTAL CORRELAÇÃO
Espúria ?
TESTE DE MANTEL PARCIAL
Biótica × Distância geográfica × Ambiental
BIÓTICA
ESPACIAL (DISTÂNCIA)
REGRESSÃO AMBIENTAL REGRESSÃO
AMBIENTAL (resídual) BIÓTICA (residual)
TESTE DE MANTEL
TESTE DE MANTEL
AM
OS
TRA
S
AMOSTRAS
MATRIZ DE SIMILARIDADE
×
A
A
A
B
B
B
B
MATRIZ DO MODELO
1
1
1
0
0
0
0
A A A B B B B
1
1
0
0
0
0
1
0
0
0
0
1
1 1
1 1 1
1 1 1 1
Biótica × Modelo
(ANOSIM & PERMANOVA)
TESTE DE MANTEL
ANOSIM & PERMANOVA
• Permutação de ‘similaridades’
• ANOSIM (não paramétrica)
ü ordenação por postos (maior >...>...>menor)
• PERMANOVA(semi-paramétrica)
ü estatística ‘F’ dos dados permutados
ü permite os mesmos modelos da ANOVA (ou MANOVA)
v cálculo de interações
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1 Setor 2
A B C D
ANOSIM & PERMANOVA
Setor 1
A B
ANOSIM & PERMANOVA
Setor 1
A B
ANOSIM & PERMANOVA
Setor 1
A B
ANOSIM & PERMANOVA
Setor 1
A B
ANOSIM
• Não paramétrica (postos ou ranqueamento das similaridades)
• Não é possível calcular interação
• Menos pressupostos – menos poder
PERMANOVA
• Semi-paramétrica
• Permutação de similaridades “reais”
• Permite modelos complexos (fatoriais e hierárquicos)
• Mais poder
Fim
top related