Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISES MULTIVARIADAS • Análises que trabalham com mais de uma variável dependente. • Análises principalmente exploratórias. • Inferências estatísticas possíveis em alguns casos. • Análises recomendadas em estudos de comunidades. • TIPOS Classificação (classificar em grupos) Ordenação (ordenar em gradientes) ORDENAÇÃO • Ordenar dados ao longo de gradientes (variáveis) Reduzir o número de variáveis para permitir o reconhecimento de padrões só com as variáveis realmente importantes (Análise Exploratória) Fornecer uma nova combinação de variáveis, as variáveis latentes, que podem ser tratadas como novas variáveis para análises estatísticas (ANOVA, teste t, Regressão). Variáveis bióticas, ambientais ou ambas Variáveis explicativas (independentes) ou dependentes ORDENAÇÃO Relação entre variáveis biológicas (espécies ou táxons) a partir de observações (amostras). Análises indiretas: padrões de ordenação explicados por variáveis ambientais não analisadas diretamente. Análise de Componentes Principais Análise Discriminante Análise de Correspondência Escalonamento Multidimensional Análises diretas: padrões de ordenação calculados a partir de dados bióticos e ambientais concomitantemente Análise de Gradientes Análise de Correspondência Canônica Análise de Redundância Análise de Correlação Canônica ORDENAÇÃO VARIÁVEIS VARIÁVEIS AMBIENTAIS ... 2 5 5 3 4 Sp. B ... 1 6 5 4 2 Sp. A ... ... St. Y ... 2 St. 5 ... 1 St. 4 ... 2 St. 3 ... 12 St. 2 ... 3 St. 1 Sp. X Sp. C Espécie Estação ... 2 5 5 3 4 Temp ... 1 6 5 4 2 NO3 ... ... ... 2 ... 1 ... 2 ... 12 ... 3 x Altitude O B S E R V A Ç Õ E S /O B J E T O S (u n id a d e s a m o s tr a is ) ESPÉCIES A M O S T R A S AMOSTRAS Modo R Modo Q COLUNS<< LINHAS E S P É C IE S ORDENAÇÃO VARIÁVEIS (ESPÉCIES) A M O S T R A S VARIÁVEIS AMBIENTAIS A M O S T R A S Modo R A M O S T R A S AMOSTRAS MATRIZ Distância ou Similaridade ESPÉCIES/ AMBIENTAIS E S P É C IE S / A M B IE N T A IS Modo Q ANÁLISE DIRETA ANÁLISE INDIRETA MATRIZ Correlação ou Covariância ESPÉCIES E S P É C IE S ORDENAÇÃO VARIÁVEIS AMBIENTAIS MATRIZ Correlação ou Covariância VARIÁVEIS (ESPÉCIES) A M O S T R A S A M O S T R A S ESPÉCIES E S P É C IE S A M O S T R A S AMOSTRAS Modo Q Modo R MATRIZ Distância ou Similaridade ANÁLISE DIRETA ESPÉCIES/ AMBIENTAIS E S P É C IE S / A M B IE N T A IS ANÁLISE INDIRETA Análise de Componentes Principais (ACP – PCA) Estação/ Espécie Sp. A Sp. B St. 1 1 1 St. 2 4 3 St. 3 5 5 St. 4 2 4 St. 5 6 4 St. 6 2 2 ACP COMPONENTES PRINCIPAIS st 4 st 5 st 2 st 6 st 1 st 3 Sp. A S p . B NOVO SISTEMA DE EIXOS st 2 st 6 st 1 st 3 st 4 st 5 CP 1 C P 2 Elipse, bisnaga & hipervolume NOVO SISTEMA DE EIXOS (modo R) - biplot Variáveis Observações CP 1 C P 2 St 1 St 10 St 9 St 5 St 2 St 3 St 8 St 4 St 7 St 6 Quantos componentes interpretar ? Componente Valor Absoluto % da Variância CP 1 1,890 64,4% CP 2 0,602 20,4% CP 3 0,401 13,6% CP 4 0,021 0,7% CP 5 0,014 0,5% CP 6 0,013 0,4% 0 1 2 3 4 5 6 7 8 9 10 Componentes Principais 0 1 2 3 4 5 A u to v a lo re s 0 1 2 3 4 5 6 7 8 9 10 Componentes Principais 0 1 2 3 4 5 A ut ov al or es Valores reais Valores aleatorizados Quantos componentes interpretar ? • Decisão numérica • Decisão ecológica Variáveis biologicamente explicáveis Componente Valor Absoluto % da Variância CP 1 1,890 64,4% CP 2 0,602 20,4% CP 3 0,401 13,6% CP 4 0,021 0,7% CP 5 0,014 0,5% CP 6 0,013 0,4% Critério de Kaiser CP > 1 > Excesso de redundância Premissas da ACP Linear Gaussiana Monotônicas 1. Linearidade entre as variáveis 2. Normalidade de cada variável (univariada). 3. Normalidade de todas as variáveis (multivariada) 4. Número de Variáveis << Observações (<50%) 5. Ausência de ‘valores extremos’ (‘outliers’) Premissas da ACP Premissas da ACP (como atingir) • Transformações √x, Log (x+1), √ √x , Arcoseno • Eliminação de valores extremos ‘outlier’ > 2,5 D.P. • Violação das premissas → menos grave quando o objetivo da análise é apenas exploratório. Variações da ACP • Gradientes pequenos (maior chance de dados monotônicos). • Pouco conhecimento sobre o local. • Ausência de estruturação nas amostras (sem formação de grupos a priori ). • Eliminação de valores extremos. • Variáveis latentes. Utilização da ACP • Rotação secundária (varimax, quadrimax, etc...) • Matriz → Correlação × Covariância ROTAÇÃO DOS EIXOS st 4 st 5 st 2 st 6 st 1 st 3 Sp. A S p . B Novo sistema de variáveis (latentes) a serem testadas Plot of Means pca25$EST m e a n o f p c a 2 5 $ P C 1 -2 -1 0 1 2 3 I1 I2 I3 I4 I5 I6 I7 I8 I9 V1 V2 V3 V4 Novo sistema de variáveis (latentes) a serem testadas Análise Discriminante ou Análise de Variáveis Canônica (AVC ou CVA) MANOVA ACP AVC CVA (Discriminante) 4 -4 -3 -2 -1 0 1 2 3 4 Variável Canônica 1 -3 -2 -1 0 1 2 3 V a ri á v e l C a n ô n ic a 2 50m 20m 10m GRUPO 4 -4 -3 -2 -1 0 1 2 3 4 Variável Canônica 1 -3 -2 -1 0 1 2 3 V a ri á v e l C a n ô n ic a 2 50m 20m 10m GRUPO CVA (Discriminante) 10 m 20 m 50 m classificação correta (%) 10 m 10 0 1 91 % 20 m 0 8 1 89 % 50 m 0 0 11 100 % Total 10 8 13 94 % 10 m 20 m 50 m classificação correta (%) 10 m 9 1 1 82 % 20 m 1 7 1 78 % 50 m 0 1 10 91 % Total 10 9 12 84 % Matriz de classificação Matriz de classificação corrigida (‘jacknife) CVA (Discriminante) CVA (Discriminante) Testando a Significância dos agrupamentos • MANOVA Traço de Pillai Lambda de Wilks • ANOVA das Variáveis Canônicas (Funções Discriminantes) • Teste T de HottellingCVA (Discriminante) PREMISSAS • Mesmas da ACP APLICAÇÃO • Objetivo é avaliar o que difere entre grupos • Dados estruturados em grupos a priori Pontos de coleta formando grupos Amostras referentes a diferentes ambientes Morfometria (variação entre populações, espécies, etc.) Análise de Correspondência Hipótese de distribuição uniforme entre amostras & espécies A B C D E F P1 1 9 3 1 2 6 P2 2 0 2 0 1 1 P3 3 3 2 1 2 2 P4 4 0 3 0 1 1 P5 3 1 2 7 1 2 P6 2 0 3 2 2 1 P7 1 1 2 1 2 2 P8 0 1 3 0 1 1 P9 0 0 2 0 2 0 Análise de Correspondência Parcela 1 = 1 ind. Parcela 2 = 0 ind. Parcela 3 = 1 ind. Parcela 4 = 0 ind. Parcela 5 = 7 ind. Parcela 6 = 2 ind. Parcela 7 = 1 ind. Parcela 8 = 0 ind. Parcela 9 = 0 ind. (1× 1) + (3 × 1) + (5×7) + (6× 2) + (7× 1)/12 = 4,83 Espécie D • Média ponderada da Espécie D • = Escore de D por parcelas Análise de Correspondência A B C D E F ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00 M.P. 4.00 2.53 4.95 4.83 5.07 3.50 Análise de Correspondência A B C D E F ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00 M.P. 4.00 2.53 4.95 4.83 5.07 3.50 Análise de Correspondência A B C D E F ORDEM 1 2 3 4 5 6 M.P. P1 1 1 9 3 1 2 6 3.55 P2 2 2 0 2 0 1 1 3.17 P3 3 3 3 2 1 2 2 3.15 P4 4 4 0 3 0 1 1 2.67 P5 5 3 1 2 7 1 2 3.50 P6 6 2 0 3 2 2 1 3.50 P7 7 1 1 2 1 2 2 3.89 P8 8 0 1 3 0 1 1 3.67 P9 9 0 0 2 0 2 0 4.00 M.P. 4.00 2.53 4.95 4.83 5.07 3.50 Análise de Correspondência -0.10 -0.05 0.00 0.05 AC1 -0.05 0.00 0.05 0.10 A C 2 B P1 F P8 P3 E P7 D P5 P6 A P4 P2 P9 C Análise de Correspondência A B C D E F P1 1 9 3 1 2 6 P2 2 0 2 0 1 1 P3 3 3 2 1 2 2 P4 4 0 3 0 1 1 P5 3 1 2 7 1 2 P6 2 0 3 2 2 1 P7 1 1 2 1 2 2 P8 0 1 3 0 1 1 P9 0 0 2 0 2 0 -0.10 -0.05 0.00 0.05 AC1 -0.05 0.00 0.05 0.10 A C 2 B P1 F P8 P3 E P7 D P5 P6 A P4 P2 P9 C Análise de Correspondência A B C D E F P1 1 9 3 1 2 6 P2 2 0 2 0 1 1 P3 3 3 2 1 2 2 P4 4 0 3 0 1 1 P5 3 1 2 7 1 2 P6 2 0 3 2 2 1 P7 1 1 2 1 2 2 P8 0 1 3 0 1 1 P9 0 0 2 0 2 0 -0.10 -0.05 0.00 0.05 AC1 -0.05 0.00 0.05 0.10 A C 2 B P1 F P8 P3 E P7 D P5 P6 A P4 P2 P9 C Análise de Correspondência Destendenciosa (‘Detrended’) ‘Efeito Ferradura’ C1 (CA) C1 C 2 C1 (DCA) Análise de Correspondência PREMISSAS • Espécies apresentam distribuição gaussiana ao longo dos gradientes ambientais. • Homogeneidade das Variâncias APLICAÇÃO • Pode ser usada quando o número de variáveis ≈ observações • Modo Q e R = equivalentes • Gradientes ambientais amplos Análise de Correspondência Linear Gaussiana Monotônicas • Variáveis biológicas e ambientais analisadas conjuntamente 2 conjuntos de dados = 2 matrizes Análises Diretas Análise de Gradientes T = 20o C = 2 ind. T = 22o C = 0 ind. T = 25o C = 1 ind. T = 28o C = 5 ind. T = 30o C = 3 ind. T = 32o C = 2 ind. Espécie X (20×2) + (25×1) + (28×5) + (30×3) + (32×2) / 13 = 27,61oC • Média ponderada da Espécie X • Escore de X para temperatura = temperatura ‘ideal’ Análise de Correspondência Canônica (CANOCO) • Extensão da Análise de Correspondência com duas matrizes. • Extensão da Análise de Gradientes ou de Média Ponderada (univariada). • Os gradientes da AC são condicionados pela matriz de variáveis abióticas. • Análise direta expressa graficamente por (espécies x amostras x var. ambientais – joint-plot). • Gradientes de espécies e estações por eixos ambientais Análise de Correspondência Canônica (ACC ou CANOCO) Ple 6 Cec 1 Typ Ter Au 2 5 O2 Temp Zon Análise de Redundância (RDA) • Extensão da Análise de Componentes Principais (monotônica) com varáveis explicativas (duas matrizes). • Semelhante à CANOCO (só que para distribuições monotônicas e não gaussianas) • Extensão da COR (Análise de Correl. Canônicas) mas com a definição de variáveis predictivas (independentes). • Sub-estimada em estudos ecológicos. • Premissas semelhantes às da ACP (monotonicidade) e da CANOCO. Análise de Redundância (RDA) Análise de Correlações Canônicas (COR) PREMISSAS • Mesmas da Análise de Componentes Principais APLICAÇÃO • Envolve dois grupos de variáveis: • Ambientais • Bióticas • Gera variáveis latentes que maximizam a explicação da variável latente biótica pela variável latente ambiental. • Pouco recomendada devido a dificuldade de interpretação • Recomenda-se interpretar um PCA a partir da projeção das variáveis ambientais no plano fatorial Escalonamento Multidimensional não métrico (N-MDS ou MDS) • Ordenação por escores • Matriz de similaridades (modo Q) ordena observações (amostras) • Mapa de pares de distâncias/similaridades projetadas em um espaço bidimensional – interpretação por proximidade. • Não paramétrica – vantagens → premissas desvantagens → s/ variáveis latentes; → não preserva s2 Stress = 0,2 Stress = 0,1 ACP (PCA) AD, AVC (DA, CVA) AC (CA) ACC (CANOCO) COR (COR) ARD (RDA) Esc. Multid. (MDS) Variáveis Indif. I & Categ Indif. D & I Indif. D & I Indif. Matrizes 1 1 1 2 2 2 1 Análise Indireta Indireta Indireta Direta Direta Direta Indireta Relação entre Var. Monotônica Monotônica Gaussiana Gaussiana Monotônica Monotônica N.A Grupos (a priori) Não Sim Não Não Não Não Não Forma da Matriz Ob >> Var Ob>>Var>G Ob ≈ Var Ob >Var Ob >> Var Ob >> Var Ob >> Var Gradiente ambiental restrito restrito amplo amplo restrito restrito Indif. COMPARAÇÃO ENTRE AS DIFERENTES ANÁLISES DE ORDENAÇÃO CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) A B E F H C D G I J A B E F H C D G I J 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) TIPOS • Medidas de similaridade ou distância: Jaccard, Sorensen, Distância Euclidiana, Bray-Curtis. • Algorítimo de aglomeração: UPGMA, WPGMA, Ward, Neighbor-joining, etc... APLICAÇÃO • Organiza entidades (amostras, spp.) em grupos onde a similaridade interna é maximizada • Não existem grupos a priori • Sintetiza a análise para apenas alguns grupos G << N • Identifica ‘outliers’ • Sintetiza as informações de um único grupo de variáveis (não há variáveis predictivas/respostas) CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) A B E F H C D G I J A B E F H C D G I J 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) Twinspan A B E F H C D G I J sp1 sp5 sp2 sp7 sp8 sp3 sp6 sp4 4 5 0 0 1 2 0 0 7 1 8 7 0 0 2 1 0 0 9 6 0 0 0 0 7 5 0 0 0 1 0 1 1 0 4 3 0 0 1 0 0 1 8 7 1 2 0 0 0 1 0 1 5 4 0 1 2 3 0 0 0 2 0 0 1 2 6 8 0 0 0 1 0 1 1 0 5 7 0 1 CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) LIMITAÇÕES • Muito sensível à ‘outliers’ • Sempre procura grupos minimizando diferenças internas e maximizando externas → ordenação não procura grupos • Difícil a determinação do número de grupos e do nível de formação destes, exceto quando bem estruturados • Muitas opções de distâncias/similaridades e de métodos de aglomeração – leva muitas vezes a resultados muito distintos. • Agrupamentos formados por dicotomias, não realísticos em estudos de comunidades – mais aplicáveis a estudos evolutivos. CLASSIFICAÇÃO Análise de Dendrograma (‘Cluster Analysis’) A B E F H C D G I J K 0 10 20 30 40 50 60 70 80 90 100 % ANÁLISES MULTIVARIADAS • Análises ainda muito exploratórias. • Fornecimento de variáveis latentes – promissor em estudos ecológicos. • Grande desenvolvimento de diferentes métodos nas últimas décadas (embora antigas). • Fim ou Meio ? PERMUTAÇÃO, ‘JACNKIFE’, ‘BOOTSTRAP’ & SIMULAÇÕES DE MONTE CARLO • Estatística não paramétrica (uni ou multivariada) • ‘Gerando o Acaso’ (= modelos nulos) PERMUTAÇÃO (análoga à correlação) COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 R = 0,39 P = 0,09 PERMUTAÇÃO (análoga à correlação) COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2 R = 0,39 P = 0,09 R 0,10 IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2 PERMUTAÇÃO (análoga à correlação) COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2 R = 0,39 P = 0,09 R 0,10 0,01 IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2 PERMUTAÇÃO (análoga à correlação) COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2 IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2 R = 0,39 P = 0,09 R 0,10 0,01 0,09 PERMUTAÇÃO (análoga à correlação) COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 COMP PERMUTADO 5 3 5 5 4 6 3 4 3 4 4 1 3 6 1 4 4 7 5 3 4 3 4 4 3 1 5 4 3 1 7 3 2 2 5 2 6 2 3 4 2 7 6 4 6 5 3 1 1 4 6 3 4 6 5 3 4 3 6 7 1 4 3 1 6 3 2 5 2 3 3 4 2 5 5 4 3 2 5 2 4 4 5 4 3 5 1 2 2 6 2 2 7 7 7 2 4 5 7 5 6 6 3 1 4 2 2 5 5 5 5 5 1 3 3 1 5 3 6 3 3 2 6 3 4 4 6 6 2 3 5 2 4 5 2 5 5 3 4 2 4 1 3 2 2 3 4 3 4 6 3 5 5 3 4 6 3 4 4 5 2 5 2 4 3 7 2 4 4 1 3 4 1 2 1 4 1 6 1 4 1 6 4 3 2 3 7 1 3 2 R = 0,39 P = 0,09 R 0,10 0,01 0,09 0,41 -0,44 0,06 0,05 0,26 0,15 IDADE 1 2 3 4 4 5 5 7 6 7 7 8 9 4 3 2 2 3 2 PERMUTAÇÃO (análoga à correlação) R 1º 0,41 2º 0,26 3º 0,15 . 0,10 . 0,09 . 0,06 . 0,05 . 0,01 . -0,05 10º -0,44 0,39 0,39 entre o 1º e o 2º Dez modelos nulos 1/10 = 0,1 Prob, de acaso < 0,1 P = 0,1 R = 0,39 P = 0,09 COMPRIMENTO IDADE 1 1 2 2 3 3 4 4 3 4 2 5 5 5 6 7 4 6 3 7 5 7 4 8 5 9 3 4 4 3 2 2 1 2 6 3 7 2 PERMUTAÇÃO (análoga a teste ‘t’) ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 PERMUTAÇÃO (análoga a teste ‘t’) ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B 3,30 4,11 0,81 XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 4.00 3.33 -0.67 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 4.00 3.33 -0.67 4.20 3.11 -1.09 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 4.00 3.33 -0.67 4.20 3.11 -1.09 3.40 4.00 0.60 3.40 4.00 0.60 4.20 3.11 -1.09 3.00 4.44 1.44 3.30 4.11 0.81 4.00 3.33 -0.67 3.30 4.11 0.81 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) 5 4 3 3 2 3 2 1 7 5 A 5 2 4 4 3 4 2 4 6 2 A 6 4 5 6 1 3 3 3 4 3 A 3 3 6 1 3 3 5 2 5 1 A 3 1 3 2 4 6 3 4 5 6 A 5 5 6 5 3 6 1 4 1 5 A 4 7 2 4 7 3 1 5 3 4 A 2 3 5 4 2 2 3 1 4 4 A 3 6 5 2 4 5 6 4 2 2 A 4 5 3 3 5 7 4 5 3 1 A 3 4 7 5 1 4 4 2 3 3 B 1 3 3 5 6 2 6 6 1 3 B 6 6 1 3 4 5 4 3 3 3 B 4 3 2 2 6 4 3 7 4 5 B 2 4 4 4 5 4 4 6 6 7 B 4 2 1 7 4 1 5 3 2 4 B 2 1 2 1 5 5 5 5 5 4 B 1 5 4 6 3 2 7 2 4 2 B 7 2 4 3 2 1 2 3 2 6 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 XB XA XB -XA 4.00 3.33 -0.67 4.00 3.33 -0.67 4.20 3.11 -1.09 3.40 4.00 0.60 3.40 4.00 0.60 4.20 3.11 -1.09 3.00 4.44 1.44 3.30 4.11 0.81 4.00 3.33 -0.67 3.30 4.11 0.81 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B ESPÉCIE A A A A A A A A A A B B B B B B B B B PERMUTAÇÃO (análoga a teste ‘t’) ESPÉCIEA ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 XB-XA ordenado 1,44 0,81 0,80 0,60 0,60 -0,67 -0,67 -0,67 -1,09 -1,09 0,81 – segundo valor em Dez modelos nulos 2/10 = 0,2 Prob, de acaso < 0,2 P = 0,2 XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 COMP ESPÉCIE 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B PERMUTAÇÃO (análoga a teste ‘t’) BOOTSTRAP (análogo ao teste ‘t’) ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 ESPÉCIE A 1 2 3 4 3 2 5 6 4 3 2 2 2 2 2 3 3 3 4 5 Bootstrap 1 5 2 1 3 4 3 2 4 5 5 Bootstrap 2 BOOTSTRAP COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B XA XB XB-XA 4,1 4,44 0,34 3,3 3,67 0,37 3,3 3,78 0,48 2,6 2,78 0,18 3,6 3,89 0,29 4,2 2,89 -1,31 2,9 4 1,1 3,8 4,22 0,42 3,1 3,22 0,12 4,5 3,11 -1,39 1 1 3 1 3 7 6 6 4 5 A 7 3 2 1 5 7 2 3 2 2 A 6 3 5 3 1 5 4 3 6 4 A 2 3 3 3 1 3 3 2 4 6 A 5 2 2 4 3 4 1 5 2 4 A 5 5 3 3 6 4 1 3 2 5 A 3 2 2 3 2 4 2 6 3 5 A 5 3 6 3 6 3 4 2 2 4 A 4 6 4 2 6 3 5 5 3 5 A 3 5 3 3 3 2 1 3 3 5 A 4 2 2 2 4 4 3 7 4 4 B 4 3 6 4 4 2 4 3 3 3 B 5 5 3 3 1 1 3 3 3 3 B 4 7 3 4 4 2 6 1 4 1 B 4 3 2 1 4 6 5 7 4 4 B 6 1 4 4 4 3 4 5 1 4 B 4 3 6 3 6 1 4 3 5 1 B 4 5 4 3 5 3 4 5 3 4 B 5 4 4 1 3 4 3 4 2 4 B XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 ESPÉCIE A A A A A A A A A A B B B B B B B B B BOOTSTRAP COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B Ord 1º 1,10 2º 0,48 3º 0,42 . 0,37 . 0,34 . 0,29 . 0,18 . 0,12 . -1,31 10º -1,39 XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 0,81 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 BOOTSTRAP COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B Ord 1º 1,10 2º 0,48 3º 0,42 . 0,37 . 0,34 . 0,29 . 0,18 . 0,12 . -1,31 10º -1,39 XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 0,81 – entre o 1º e o 2º Dez modelos nulos 1/10 = 0,1 Prob. de acaso < 0,1 P = 0,1 0,81 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 -1,39 0, 30 1,10 0,81 BOOTSTRAP COMP POP 1 A 2 A 3 A 4 A 3 A 2 A 5 A 6 A 4 A 3 A 5 B 4 B 5 B 3 B 4 B 2 B 1 B 6 B 7 B Ord 1º 1,10 2º 0,48 3º 0,42 . 0,37 . 0,34 . 0,29 . 0,18 . 0,12 . -1,31 10º -1,39 XA = 3,30 XB = 4,11 XB-XA = 0,81 Test ‘t’ P = 0, 31 0,81 – entre o 1º e o 2º Dez modelos nulos 1/10 = 0,1 Prob. de acaso < 0,1 P = 0,1 0,81 ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 -1,39 0, 30 1,10 0,81 JACKNIFE (=CANIVETE) ESPÉCIE A ESPÉCIE B 1, 2, 3, 4, 3, 2, 5, 6, 4, 3 5, 4, 5, 3, 4, 2, 1, 2, 6, 7 ESPÉCIE A 1 2 3 4 3 2 5 6 4 3 2 3 4 3 2 5 6 4 3 Pseudoamostra 1 1 3 4 3 2 5 6 4 3 Pseudoamostra 2 1 2 4 3 2 5 6 4 3 Pseudoamostra 3 ESTATÍSTICA PARAMÉTRICA Distribuição Populacional (desconhecida) Amostra {18, 18, 20, 23 25, 28} Estimativa x = 22 S= 4,05 PRECISÃO Intervalo de confiança 95% (17,8 – 26,2) ‘BOOTSTRAP’ Distribuição Populacional (desconhecida) Amostra Estimativa População estimada Bootstrap 1 Bootstrap 2 Bootstrap 3 Bootsrap 4 Estimativa Bootstrap 1 Estimativa Bootstrap 2 Estimativa Bootstrap 3 Estimativa Bootstrap 4 PRECISÃO Erro padrão Intervalo de confiança ‘SIMULAÇÃO DE MONTE CARLO’ Distribuição Populacional (parâmetros populacionais definidos pela amostra) Distribuição das estimativas construída a partir De múltiplas simulações Simulação 1 Simulação 2 Simulação 3 Simulação 4 (amostra) (amostra) (amostra) (amostra) Estimativa 1 Estimativa 2 Estimativa 3 Estimativa 4 Amostra X S E1 E4 E3 E2 E... ‘SIMULAÇÃO DE MONTE CARLO’ Loc A = {2, 2, 3, 4, 2, 5, 3, 2, 6, 2, 3, 4, 6, 2, 1, 4, 3, 7, 2, 3, 4, 4, 5, 8, 5, 2, 1, 3, 4, 4, 3} N= 31 Loc B = {2, 2, 3, 2, 4, 2, 3, 2, 8, 9, 2, 9, 3, 2, 3, 3, 3, 9} N=18 MÉDIA (Loc A+Loc B) = 3,17 S= 2,1 Simulações: amostras com n= 31 e n= 18 (Loc A e Loc B) de Distr. Normal (X= 3,15 e S = 2,1) Calcular diferenças entre as médias de Loc A e Loc B das simulações Média (Loc A) – Média (Loc B) Distribuição das diferenças entre média das simulações Média (Loc Asim)- Média(Loc Bsim) TESTES DE HIPÓTESE MULTIVARIADOS POR ALEATORIZAÇÃO TESTE DE MANTEL A M O S T R A S AMOSTRAS MATRIZ DE SIMILARIDADE MATRIZ DE DISTÂNCIA A M O S T R A S AMOSTRAS A M O S T R A S ALEATORIZAÇÃO CORRELAÇÃO R = 0,40 R1 = 0,38 R2 = 0,36 R3 = 0,47 R4 = 0,15 R5 = 0.10 ............... 98% R = 0,40 TESTE DE MANTEL PREMISSAS • As mesmas da correlação linear APLICAÇÃO • Compara duas ou mais matrizes de similaridades Biótica × Distância geográfica Biótica × Ambiental Biótica × Modelo Biótica × Distância geográfica × Ambiental • Não paramétrico mas monotônico • Elimina o problema da dependência dos dados (autocorrelação) • Não apresenta graficamente a estruturação, apenas testa a hipótese de dependência entre as matrizes. TESTE DE MANTEL PARCIAL Biótica × Distância geográfica × Ambiental BIÓTICA ESPACIAL (DISTÂNCIA) AMBIENTAL CORRELAÇÃO Espúria ? TESTE DE MANTEL PARCIAL Biótica × Distância geográfica × Ambiental BIÓTICA ESPACIAL (DISTÂNCIA) AMBIENTAL AMBIENTAL (resídual) BIÓTICA (residual) TESTE DE MANTEL TESTEDE MANTEL A M O S T R A S AMOSTRAS MATRIZ DE SIMILARIDADE × A A A B B B B MATRIZ DO MODELO 1 1 1 0 0 0 0 A A A B B B B 1 1 0 0 0 0 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 Biótica × Modelo (ANOSIM & PERMANOVA) TESTE DE MANTEL ANOSIM & PERMANOVA • Permutação de ‘similaridades’ • ANOSIM (não paramétrica) ordenação por postos (maior >...>...>menor) • PERMANOVA(semi-paramétrica) estatística ‘F’ dos dados permutados permite os mesmos modelos da ANOVA (ou MANOVA) cálculo de interações TESTE DE MANTEL A M O S T R A S AMOSTRAS MATRIZ DE SIMILARIDADE × A A A B B B B MATRIZ DO MODELO 1 1 1 0 0 0 0 A A A B B B B 1 1 0 0 0 0 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 Biótica × Modelo (ANOSIM & PERMANOVA) Fim
Compartilhar