Buscar

ANALISEMULTAula_1b_2023

Prévia do material em texto

Escolhendo 
variáveis/descritores/caracteres
Coeficientes - Distâncias
Transformação
SUS-5020
Técnicas de Modelagem para 
Estudos Ambientais
Fácil de observar ?
Objetivo ?
Homologia
H
o
m
o
l
o
g
i
a
Outras considerações
◼ Caracteres logicamente redundantes
◼ Caracteres invariantes
◼ Quantos caracteres ?
◼ Caracteres ponderados ?
modo “Q” e “R”
◼ modo Q
◼ estamos interessados 
em comparações entre 
objetos (amostras)
◼ “espaço A” 
◼ Jaccard
◼ Sorenson
◼ distância euclidiana
◼ modo R
◼ estamos interessados 
em relações entre 
descritores 
(caracteres, espécies)
◼ “espaço I”
◼ correlação (Pearson)
◼ distância qui-quadrado
Coeficientes e distâncias
UTO i
+ -
UT
O j
+ a b
- c d
a + b
c + d
a + c b + d p = a +b +c + d
d = zero duplo!Cross-classification ~ 
classificação cruzada
Coeficientes e distâncias
UTO i
+ -
UTO 
j
+ a b
- c d
SMS
a d
N
=
+( )
◼ Concordância Simples
(N = a + b + c+ d)
Simétrico Binário –
Qualivativo - zero-duplo!
Modo Q
Coeficientes e distâncias
UTO i
+ -
UTO 
j
+ a b
- c d
◼ Rogers-Tanimoto
◼ Yule
YS
ad bc
ad bc
=
−
+
RTS
a d
a d b c
=
+
+ + +
( )
( ) ( )2ij
N ad bc
a b c d a c b d
2
2
 =
−
+ + + +
( )
( )( )( )( )
◼ Chi - quadrado
Simétrico Binário –
Qualitativo - zero-duplo!
Modo Q
O problema do zero duplo!
Ecologia x Taxonomia
Percepção do universo amostral
Coeficientes e distâncias
UTO i
+ -
UTO 
j
+ a b
- c d
◼ Jaccard
JACS
a
a b c
=
+ +( ) SORS
a
a b c
=
+ +
2
2( )
◼ Dice/Sorenson/
Czekanowski
Assimétrico Binário –
Qualivativo - zero-duplo!
Modo Q
Outros coeficientes
◼ Kulczynski
◼ Ochiai
◼ Steinhaus
KULS
a
a b
a
a c
=
+
+
+
1
2
[
( ) ( )
]
OCHS
a
a b a c
=
+ +[( )( )]
)(
),min(2
11
1


==
=
+
=
M
k
jk
M
k
ik
M
k
jkik
St
xx
xx
S
◼= Ssor para binários
Não-métrico
Assimétricos quantitativos (Kulczynski e Steinhaus) – adequados para dados de abundância de espécies
Compara os sites em 
termos da abundância 
mínima de cada 
espécie pelo somatório 
das abundâncias de 
todas as espécies em 
cada site
Média dos somatórios das abundâncias mínimas pelo total da 
abundância em cada site
Média geométrica das razões do total de espécies 
em cada site Assimétrico qualitativo
Ex: Coeficiente de Steinhaus
Abundância das Espécies A B W
Site x1 7 3 0 5 0 1 16
Site x2 2 4 7 6 0 3 22
Mínimo 2 3 0 5 0 1 11
S17 (x1, x2) = ___W___ = ___2W___
(A + B )/2 (A + B )/2
S17 (x1, x2) = __2 X 11___ = 0.579
16+ 22
Coeficientes para dados mistos
◼ Gower = 
◼ Wk é o peso para cada comparação. 
Para cada variável, k, se Xik ou Xjk
está faltando, então wk = 0.0.
◼ para variáveis quantitativas : 
◼ para variáveis multiestado Sk = 1.0 
se Xik = Xjk, wk = 1.0
◼ para variáveis binárias
Sk = 1.0 se Xik = Xjk = 1 
wk = 1.0 [ou 0 se ambos são 0]
0.1
)(
1
minmax
=
−
−
−= w
XX
XX
S k
kk
jkik
k


=
p
k
p
kk
Gow
w
wS
S
1
1
Coeficientes e distâncias

=
−=
N
k
jkikij xxd
1
22
)(
◼ Distância 
euclidiana
ij ijd d=
2
xj2 – xi2
xj1 – xi1
Distâncias métricas 
desenvolvidas para 
descritores quantitativos, 
ocasionalmente para 
semiquantitativos!
Tamanho e forma
2
11
2
)(
1

==
−=
N
k
jk
N
k
ikij xxd
N
2
2)(
N
cb
d ij
−
=
Diferença de tamanho
ou 
para dados binários
2
11
2
1
2
)(
11 )(  −
===
−−=
N
k
jk
N
k
ik
N
k
ij xxxxd
NjkikN
2
2)()(
N
cbcbN
d ij
−−+
=
Diferença de forma
ou 
para dados binários
Coeficientes e distâncias
◼ Distância 
manhattan
=
−=
N
k
jkikMij xxd
1
BC
ik
k
N
jk
ik jk
k
Nd
x x
x x
=
−
+
=
=


1
1
( )
◼ Distância 
Bray-Curtis
CANij
ik jk
ik jkk
N
d
x x
x xN
=
−
+=

1
1 ( )
◼ Distância 
Canberra
A distância entre dois
descritores de dois objetos é a
soma da distância da abcissa do
descritor y1 e da ordenada y2.
Variante da D. Manhattan que
exclui os zeros duplos. Nela a
diferença entre espécies
abundantes contribui menos do
que a abundância das espécies
raras. É um coeficiente métrico.
Os valores de similaridade não
mudam com a inserção dos
zeros-duplos, mas é uma
distância semimétrica. Sua
formulação utiliza W, A e B.
Contribuição de espécies
abundantes e raras similares
Dados quantitativos - adequados para composição de comunidades
D = 1 - 2W_
A + B
◼ Distância corda
◼ distância euclidiana simples
◼ 1 | I1 
◼ 2 6,9282 | I2 
◼ 3 1,4142 5,8310 | I3 
◼ 1 2 3
◼ distância corda 
◼ 1 | I1 
◼ 2 0,0000 | I2 
◼ 3 0,2748 0,2748 | I3 
◼ 1 2 3
variáveis
in V1 V2 V3 
I1 1,0 1,0 1,0
I2 5,0 5,0 5,0
I3 1,0 2,0 2,0
A distância corda é máxima quando espécies encontradas em dois 
sites são completamente diferentes
. Abordagem que destaca dados de 
composição de espécies
. Calcula distância euclidiana depois que os 
sites são vetorizados para ter comprimento 
equivalente a 1
. Destaca maior similaridade entre sites com o 
mesmo conjunto e proporcionalidade de 
abundância entre as espécies
. Zero é o valor quando o conjunto de espécies 
e as proporções são as mesma e √2 para sites 
que não compartilham nenhuma espécie
Não muda com 
zeros duplos
Dados centralizados
sp
2
1
1 sp1
x1
x2
D3 (x1, x2)
D4 (x1, x2)
X = pares de sites
D3 = distância corda com distância euclidina
D4 = distância corda com métrica geodésica
Coeficientes e distâncias
◼ Correlação
ir
x x x x
x x x x
j
ik i jk j
ik i jk j
=
− −
− −


( )( )
( ) ( )2 2
Propriedades de coeficientes e 
distâncias
Uma distância é métrica se :
1. É simétrica d(x,y) = d(y,x)
Uma distância é métrica se :
1. É simétrica d(x,y) = d(y,x)
2. Indivíduos não idênticos podem ser 
distinguidos – se d(x,y) ≠ 0 então x ≠ y
Uma distância é métrica se :
1. É simétrica d(x,y) = d(y,x)
2. Indivíduos não idênticos podem ser 
distinguidos – se d(x,y) ≠ 0 então x ≠ y
3. Indivíduos idênticos não podem ser 
distinguidos – se temos elementos idênticos 
(x,x), então d(x,x) = 0
Uma distância é métrica se :
1. É simétrica d(x,y) = d(y,x)
2. Indivíduos não idênticos podem ser distinguidos – se 
d(x,y) ≠ 0 então x ≠ y
3. Indivíduos idênticos não podem ser distinguidos – se 
temos elementos idênticos (x,x), então d(x,x) = 0
4. Desigualdade triangular:
dado 3 entidades (x,y,z) então
d(x,z) ≤ d(x,y) + d(y,z)
◼x
◼d(x,y)
◼y
◼z
◼d(x,z)
◼d(y,z)
◼y
◼x
◼z
coeficientes- métrico/não-métrico
escolhendo coeficientes – Legendre 
& Legendre (1998)
◼e
tc.
Efeitos de “dados faltando”
1 0,0 
2 2,0 0,0 
3 1,73 0,0 0,0 
 1 2 3 
 
 
 A B 
1 2 3 1 2 3 
0 1 1 0 ? 1 
0 1 1 0 1 ? 
1 1 1 1 1 1 
0 0 0 0 0 0 
0 1 1 0 1 1 
1 0 0 1 0 ? 
1 0 0 1 0 0 
1 1 1 1 1 1 
0 0 0 0 0 0 
0 0 0 0 0 0 
 
1 0,0 
2 2,24 0,0 
3 2,24 0,0 0,0 
 1 2 3 
 
◼Distância euclidiana 
ddd 231312
+= !
231312 ddd +
10000
1000
100
10
5 2 1
11,4142135622,2360679773,16227766
10
31,6227766
100
0
2000
4000
6000
8000
10000
12000
0
20
40
60
80
100
120
Transformação - raíz quadrado
Transformando variáveis
1
2
5
10
100
1000
10000
10000
1000
100
10
52 1
0
0,301029996
0,698970004
1
2
3
4
0
2000
4000
6000
8000
10000
12000
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
Log(x)X
transformação - logarítmo
1
2
5
10
100
1000
10000
◼Transformando variáveis
Parâmetros para Espécies : Teste 
RelDe x RelDo
Psyc mapo
Pera glab
Malo arbo
Tern bras
Eute edul
Psyc nuda
Sloa guia
Cupa oblo
Hyer alch
Ocot pulc
Atta dubi
Calo bras
Scle denu
Astr acul
Case obli
Eccl rami
Psyc laci
Lica octa
Andi frax
Ilex thee
Myrc pubi
Alch trip
Clus criu
Laci luci
Mani subs
Viro gard
Cord sell
Bros guia
Myrc race
Case sylv
Xylo lang
Mico cabu
Inga edul
Blep sali
Mico cinn
Endl pani
Ocot acip
Nect oppo
Guar macr
Amai inte
Myrc sple
Anib viri
Mico dode
Roll seri
Mata inte
Tibo mutaOcot eleg
Chry f lex
Pout beau
Heis silv
Tapi guia
Bali pedi
Prothept
Wein paul
Rich granGuap oppo
Guar guid
Psid catt
Garc gard
Ocot dispOcot venu
Jaca pube
Anib f irm
Byrs ligu
Poso lati
Myrc bras
Euge sp.1
Sche anguCamp guav
Euge oblo
Pari exce
Myrc mult
Inga sp.
Cocco sp.Caly conc
Cedr f iss
Euge neogPter rohr
Dahl pinn
Moll schoApar cord
Eryt ampl
Matay sp.
Tabe umbe
Cabr canjHirt hebe
Rapa guia
Euge stigMico cuba
Ilex pseu
Rapa ferr
Ilex amar
Cous cont
Mayte sp.Inga sess
Mico cine
Alch glan
Pour guia
Euge bocaRapa venoRubiaceae
Inga lanc
Myrc spec
Dipl cuspViro bicuGord frut
Zant rhoi
Cous micr
Ficus sp.Euge pruiBath aust
Vite polyOura parvSw ar submGuat austCalyp sp.Hedy bras
Humi dentTibouchinEuge sulcCecr pachTabe aff.Mico rigiMarl tomePime cf.Marl obscMyrt sp.1
Xylo bras
Tabe cass
Mapr guiaStyr cf.Cryp sali
Ficu pulc
Neom glomVoch bifaTachigaliPout sp.Euge umbeEuge handEuge cf.
Nect cf.
Marli sp.
Syag roma
Prad lactMoll boraRapa hermSenn multIxor heteAiou saliOrmo arbo
Tric clau
Cybi peruEuge schuMyrc bicaMyrc tiju
Euge cf.
Euge cathAbar brac
Pipt macrEuge melaEuge sp.1Podo seloMeli seloCari streEuge exceChio cf.Clet scabOcot cf.Roup brasTetr granTetr rubrRubi espiOcot silvRapa cf.Nect aff.Aspi olivMyrc hebeAegi sellEuge cf.Euge moseEuge sp.8Daph raceEuge sp.1Quii glazRapa umbeMayt robuZoll ilicMoll cyatPsyc suteVerno sp.Soro bonpOcot moseBros glasSymp laxiPout sp.Euge sp.2Psych sp.Marl eugeMyrc paluOcot cf.Euge sp.1Euge cf.Guap hirsSiph guilCaly striCaly luciOcot bracMyrs guiaMyrc cf.
RelDe
8.587.576.565.554.543.532.521.510.50-0.5-1-1.5-2-2.5
R
e
lD
o
7
6.8
6.6
6.4
6.2
6
5.8
5.6
5.4
5.2
5
4.8
4.6
4.4
4.2
4
3.8
3.6
3.4
3.2
3
2.8
2.6
2.4
2.2
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
◼sem log
Parâmetros para Espécies : Teste 
RelDe x RelDo
Psyc mapo
Pera glab
Malo arbo
Tern bras
Eute edul
Psyc nuda
Sloa guiaCupa oblo
Hyer alch
Ocot pulc
Atta dubi
Calo bras
Scle denu
Astr acul
Case obli
Eccl rami
Psyc laci
Lica octa
Andi frax
Ilex thee
Myrc pubi
Alch trip
Clus criu
Laci luci
Mani subs
Viro gard
Cord sell
Bros guia
Myrc race
Case sylv
Xylo lang
Mico cabuInga edul
Blep sali
Mico cinn
Endl pani
Ocot acip
Nect oppo
Guar macr
Amai inte
Myrc sple
Anib viri
Mico dode
Roll seri
Mata inte
Tibo mutaOcot eleg
Chry f lex
Pout beau
Heis silv
Tapi guia
Bali pedi
Prot hept
Wein paul
Rich granGuap oppo
Guar guid
Psid catt
Garc gard
Ocot dispOcot venu
Jaca pube
Anib f irm
Byrs ligu
Poso lati
Myrc bras
Euge sp.1
Sche anguCamp guav
Euge oblo
Pari exce
Myrc mult
Inga sp.
Cocco sp.
Caly conc
Cedr f iss
Euge neog
Pter rohr
Dahl pinn
Moll scho
Apar cord
Eryt ampl
Matay sp.
Tabe umbe
Cabr canjHirt hebe
Rapa guia
Euge stigMico cuba
Ilex pseu
Rapa ferr
Ilex amar
Cous cont
Mayte sp.
Inga sess
Mico cine
Alch glan
Pour guia
Euge boca
Rapa veno
Rubiaceae
Inga lanc
Myrc spec
Dipl cusp
Viro bicuGord frut
Zant rhoi
Cous micr
Ficus sp.Euge prui
Bath aust
Vite poly
Oura parvSw ar subm
Guat austCalyp sp.
Hedy bras
Humi dent
Tibouchin
Euge sulcCecr pach
Tabe aff.
Mico rigi
Marl tome
Pime cf.
Marl obscMyrt sp.1
Xylo bras
Tabe cass
Mapr guiaStyr cf.
Cryp sali
Ficu pulc
Neom glomVoch bifa
Tachigali
Pout sp.
Euge umbe
Euge hand
Euge cf.
Nect cf.
Marli sp.
Syag roma
Prad lact
Moll bora
Rapa herm
Senn mult
Ixor heteAiou sali
Ormo arbo
Tric clau
Cybi peruEuge schu
Myrc bicaMyrc tiju
Euge cf.
Euge cathAbar brac
Pipt macr
Euge mela
Euge sp.1Podo selo
Meli selo
Cari streEuge exce
Chio cf.
Clet scabOcot cf.Roup bras
Tetr gran
Tetr rubrRubi espiOcot silvRapa cf.
Nect aff.
Aspi olivMyrc hebeAegi sell
Euge cf.
Euge mose
Euge sp.8
Daph raceEuge sp.1Quii glaz
Rapa umbe
Mayt robuZoll ilic
Moll cyat
Psyc sute
Verno sp.Soro bonpOcot mose
Bros glasSymp laxi
Pout sp.Euge sp.2Psych sp.
Marl euge
Myrc paluOcot cf.Euge sp.1Euge cf.Guap hirs
Siph guilCaly striCaly luciOcot brac
Myrs guiaMyrc cf.
RelDe
5.85.65.45.254.84.64.44.243.83.63.43.232.82.62.42.221.81.61.41.210.80.60.40.2
R
e
lD
o
76.86.66.46.265.85.65.45.254.84.64.44.243.83.63.43.23
2.82.6
2.4
2.2
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
◼com log
	Slide 1: Escolhendo variáveis/descritores/caracteres Coeficientes - Distâncias Transformação 
	Slide 2: Fácil de observar ?
	Slide 3: Objetivo ?
	Slide 4: Homologia
	Slide 5
	Slide 6: Outras considerações
	Slide 7: modo “Q” e “R”
	Slide 8: Coeficientes e distâncias
	Slide 9: Coeficientes e distâncias
	Slide 10: Coeficientes e distâncias
	Slide 11: O problema do zero duplo! Ecologia x Taxonomia Percepção do universo amostral
	Slide 12: Coeficientes e distâncias
	Slide 13: Outros coeficientes
	Slide 14: Ex: Coeficiente de Steinhaus 
	Slide 15: Coeficientes para dados mistos
	Slide 16: Coeficientes e distâncias
	Slide 17: Tamanho e forma
	Slide 18: Coeficientes e distâncias
	Slide 19
	Slide 20: Dados centralizados
	Slide 21: Coeficientes e distâncias
	Slide 22: Propriedades de coeficientes e distâncias
	Slide 23: Uma distância é métrica se :
	Slide 24: Uma distância é métrica se :
	Slide 25: Uma distância é métrica se :
	Slide 26: Uma distância é métrica se :
	Slide 27: coeficientes- métrico/não-métrico
	Slide 28: escolhendo coeficientes – Legendre & Legendre (1998)
	Slide 29: Efeitos de “dados faltando” 
	Slide 30: Transformando variáveis
	Slide 31
	Slide 32
	Slide 33

Continue navegando