Buscar

A_coeficientes with properties

Prévia do material em texto

NT241 - Análise Multivariada - Coeficientes 1
Distâncias e coeficientes
Para uma matriz de dados X, com N variáveis e m amostras :-
ikx é o valor observado para variável k na amostra i, para variáveis contínuas.
ikx é a média das observações para amostra i, para todas as variáveis de 1 a N.
N é o número total de variáveis.
M é o número total de amostras (UTOs).
Para dados binários, as formulas utilizam a seguinte tabela :-
UTO i
+ -
+ a b
U
T
O
j
- c d
onde a é o número total de variaveis onde amostras i e j ambos tinham o valor "1", b onde amostra i tinha o
valor "0" e amostra j o valor "1", etc.
distâncias/coeficientes que utilizem dados quantitativos -
Distância euclidiana quadrada



N
k
jkikij xxd
1
22 )( ijd b c2  ( ) para dados binários,
Distância euclidiana simples
ij ijd d 2
ijd b c ( ) para dados binários,
Distância euclidiana quadrada média
ij
ijd
d
N
2
2
 ijd
b c
N
2 
( )
para dados binários,
Distância euclidiana média
NT241 - Análise Multivariada - Coeficientes 2
ij
ijd d
N

2
ijd
b c
N
 ( )
para dados binários,
Distância Manhattan total {"city block metric"}



N
k
jkikMij xxd
1
Mijd b c ( ) para dados binários,
Distância Manhattan média {"Mean Character Difference"}



N
k
jkikMij xxd N 1
1
Mijd
b c
N
 ( )
para dados binários
Bray - Curtis
BC
ik
k
N
jk
ik jk
k
Nd
x x
x x







1
1
( )
BCd
b c
a b c
 
 
( )
[ ( )]2
para dados binários
"Canberra metric” incluindo zero duplo
CANij
ik jk
ik jkk
N
d
x x
x xN



1
1 ( ) CANijd
b c
N
 ( )
para dados binários
"Canberra metric” excluindo 0 duplo
igual ao anterior, mas excluindo comparações onde ambos as amostras tem
o valor 0. (veja Clifford & Stephenson, 1975). Forma original e mais
comum deste coeficiente.
para dados binários, CANijd
b c
a b c
 
 
( )
( )
, excluindo zero duplo
Morisita
Lij
ik jk
i j i j
C n n
N N


2
( ) 
onde
i
ik ik
i i
n n
N N


 ( )
( )
1
1
nik = no. de indivíduos em amostra i, espécie k,
e Ni = no. total de indivíduos em amostra i.
Morisita modificado por Horn
igual ao anterior, mas
i
ik
i
n
N
2
2
NT241 - Análise Multivariada - Coeficientes 3
Distância corda
ijd  2 1( cos )
onde cos
ij
ik jk
k
M
ik
k
M
jk
k
M
x x
x x
 
 

 
1
2
1
2
1
Diferença de tamanho
2
11
2 )(1 


N
k
jk
N
k
ikij xxd N
ou 2
2)(
N
cb
d ij
 para dados binários
Diferença de forma
2
11
2
1
2
)(11 )(  


N
k
jk
N
k
ik
N
k
ij xxxxd NjkikN
ou 2
2)()(
N
cbcbN
d ij
 para dados binários
Correlação
ir x x x x
x x x x
j
ik i jk j
ik i jk j

 
 


( )( )
( ) ( )2 2 ijr
ad bc
a b c d a c b d
 
   
( )
( )( )( )( )
(dados binários)
Marczewski-Steinhaus
)(
),min(2
11
1





 M
k
jk
M
k
ik
M
k
jkik
St
xx
xx
S ou = SSOR para dados binários
coeficientes que utilizem dados binários -
Concordância simples {"Simple matching"} SMS
a d
N

( )
Jaccard JACS
a
a b c

 ( )
Dice/Sorenson/Czekanowski SORS
a
a b c

 
2
2( )
NT241 - Análise Multivariada - Coeficientes 4
Kulczynski
KULS
a
a b
a
a c




1
2
[
( ) ( )
]
Ochiai OCHS
a
a b a c

 [( )( )]
Baroni - Urbani & Buser
BUBS
ad a
ad a b c
 
  ( )
Rogers-Tanimoto RTS
a d
a d b c
 
  
( )
( ) ( )2
Hamann HS
a d b c
a b c d
   
  
( ) ( )
( )
Yule YS
ad bc
ad bc
 

Chi - quadrado
ij
N ad bc
a b c d a c b d
2 2
 
   
( )
( )( )( )( )
Chi - quadrado com correção de Yates
ij
NN ad bc
a b c d a c b d
2
2
2

 
   
( )
( )( )( )( )
Coeficients para misturas de varíaveis
Coeficiente de Gower
W é o peso para cada comparação. Para cada variável, k, se Xik ou Xjk está faltando, então wk = 0.0.
para variáveis quantitativas :   0.11
minmax



 wXX
XX
S k
kk
jkik
k
para variáveis multiestado S
k
= 1.0 se X
ik
= X
jk
w
k
= 1.0
para variáveis binárias S
k
= 1.0 se X
ik
= X
jk
= 1 w
k
= 1.0 (=SJAC)



 N
k
k
N
k
k
G
w
Sw
S
k
1
1
Depto. de Botânica - NT241 - Análise Multivariada para Ecologia e Taxonomia 
Propriedades de coeficientes 
 sensível a 
coeficiente riqueza dominância total de spp. 
Jaccard ++ - - 
Sorenson ++ - - 
distância eucl. ++ ++ ++ 
distância eucl. quad. +++ +++ +++ 
distância corda + + - 
 seg. van Tongeren em Jongman et al., 1987
Depto. de Botânica - NT241 - Análise Multivariada para Ecologia e Taxonomia 
Coeficientes métricos e não métricos 
 Distâncias 
distância d d2 
Euclidiana sim não 
Manhattan sim sim 
Bray-Curtis não não 
Canberra sim sim 
 Semelhanças 
coeficiente 1 - s √(1-s) 
Concordância simples sim sim 
Jaccard sim sim 
Sorenson/Czekanowski não sim 
Kulczynski não 
Rogers/Tanimoto sim 
Ochiai não sim 
Steinhaus não 
Gower sim 
 Correlação 
 1 - cij √(1-cij) 
correlação não sim 
tabela baseada nas informações de Digby & Kempton (1987) e Legendre e Legendre (1983) 
	coeficientes
	coefficient properties2

Continue navegando