Baixe o app para aproveitar ainda mais
Prévia do material em texto
NT241 - Análise Multivariada - Coeficientes 1 Distâncias e coeficientes Para uma matriz de dados X, com N variáveis e m amostras :- ikx é o valor observado para variável k na amostra i, para variáveis contínuas. ikx é a média das observações para amostra i, para todas as variáveis de 1 a N. N é o número total de variáveis. M é o número total de amostras (UTOs). Para dados binários, as formulas utilizam a seguinte tabela :- UTO i + - + a b U T O j - c d onde a é o número total de variaveis onde amostras i e j ambos tinham o valor "1", b onde amostra i tinha o valor "0" e amostra j o valor "1", etc. distâncias/coeficientes que utilizem dados quantitativos - Distância euclidiana quadrada N k jkikij xxd 1 22 )( ijd b c2 ( ) para dados binários, Distância euclidiana simples ij ijd d 2 ijd b c ( ) para dados binários, Distância euclidiana quadrada média ij ijd d N 2 2 ijd b c N 2 ( ) para dados binários, Distância euclidiana média NT241 - Análise Multivariada - Coeficientes 2 ij ijd d N 2 ijd b c N ( ) para dados binários, Distância Manhattan total {"city block metric"} N k jkikMij xxd 1 Mijd b c ( ) para dados binários, Distância Manhattan média {"Mean Character Difference"} N k jkikMij xxd N 1 1 Mijd b c N ( ) para dados binários Bray - Curtis BC ik k N jk ik jk k Nd x x x x 1 1 ( ) BCd b c a b c ( ) [ ( )]2 para dados binários "Canberra metric” incluindo zero duplo CANij ik jk ik jkk N d x x x xN 1 1 ( ) CANijd b c N ( ) para dados binários "Canberra metric” excluindo 0 duplo igual ao anterior, mas excluindo comparações onde ambos as amostras tem o valor 0. (veja Clifford & Stephenson, 1975). Forma original e mais comum deste coeficiente. para dados binários, CANijd b c a b c ( ) ( ) , excluindo zero duplo Morisita Lij ik jk i j i j C n n N N 2 ( ) onde i ik ik i i n n N N ( ) ( ) 1 1 nik = no. de indivíduos em amostra i, espécie k, e Ni = no. total de indivíduos em amostra i. Morisita modificado por Horn igual ao anterior, mas i ik i n N 2 2 NT241 - Análise Multivariada - Coeficientes 3 Distância corda ijd 2 1( cos ) onde cos ij ik jk k M ik k M jk k M x x x x 1 2 1 2 1 Diferença de tamanho 2 11 2 )(1 N k jk N k ikij xxd N ou 2 2)( N cb d ij para dados binários Diferença de forma 2 11 2 1 2 )(11 )( N k jk N k ik N k ij xxxxd NjkikN ou 2 2)()( N cbcbN d ij para dados binários Correlação ir x x x x x x x x j ik i jk j ik i jk j ( )( ) ( ) ( )2 2 ijr ad bc a b c d a c b d ( ) ( )( )( )( ) (dados binários) Marczewski-Steinhaus )( ),min(2 11 1 M k jk M k ik M k jkik St xx xx S ou = SSOR para dados binários coeficientes que utilizem dados binários - Concordância simples {"Simple matching"} SMS a d N ( ) Jaccard JACS a a b c ( ) Dice/Sorenson/Czekanowski SORS a a b c 2 2( ) NT241 - Análise Multivariada - Coeficientes 4 Kulczynski KULS a a b a a c 1 2 [ ( ) ( ) ] Ochiai OCHS a a b a c [( )( )] Baroni - Urbani & Buser BUBS ad a ad a b c ( ) Rogers-Tanimoto RTS a d a d b c ( ) ( ) ( )2 Hamann HS a d b c a b c d ( ) ( ) ( ) Yule YS ad bc ad bc Chi - quadrado ij N ad bc a b c d a c b d 2 2 ( ) ( )( )( )( ) Chi - quadrado com correção de Yates ij NN ad bc a b c d a c b d 2 2 2 ( ) ( )( )( )( ) Coeficients para misturas de varíaveis Coeficiente de Gower W é o peso para cada comparação. Para cada variável, k, se Xik ou Xjk está faltando, então wk = 0.0. para variáveis quantitativas : 0.11 minmax wXX XX S k kk jkik k para variáveis multiestado S k = 1.0 se X ik = X jk w k = 1.0 para variáveis binárias S k = 1.0 se X ik = X jk = 1 w k = 1.0 (=SJAC) N k k N k k G w Sw S k 1 1 Depto. de Botânica - NT241 - Análise Multivariada para Ecologia e Taxonomia Propriedades de coeficientes sensível a coeficiente riqueza dominância total de spp. Jaccard ++ - - Sorenson ++ - - distância eucl. ++ ++ ++ distância eucl. quad. +++ +++ +++ distância corda + + - seg. van Tongeren em Jongman et al., 1987 Depto. de Botânica - NT241 - Análise Multivariada para Ecologia e Taxonomia Coeficientes métricos e não métricos Distâncias distância d d2 Euclidiana sim não Manhattan sim sim Bray-Curtis não não Canberra sim sim Semelhanças coeficiente 1 - s √(1-s) Concordância simples sim sim Jaccard sim sim Sorenson/Czekanowski não sim Kulczynski não Rogers/Tanimoto sim Ochiai não sim Steinhaus não Gower sim Correlação 1 - cij √(1-cij) correlação não sim tabela baseada nas informações de Digby & Kempton (1987) e Legendre e Legendre (1983) coeficientes coefficient properties2
Compartilhar