Baixe o app para aproveitar ainda mais
Prévia do material em texto
Escolhendo variáveis/descritores/caracteres Coeficientes - Distâncias Transformação SUS-5020 Técnicas de Modelagem para Estudos Ambientais Fácil de observar ? Objetivo ? Homologia H o m o l o g i a Outras considerações ◼ Caracteres logicamente redundantes ◼ Caracteres invariantes ◼ Quantos caracteres ? ◼ Caracteres ponderados ? modo “Q” e “R” ◼ modo Q ◼ estamos interessados em comparações entre objetos (amostras) ◼ “espaço A” ◼ Jaccard ◼ Sorenson ◼ distância euclidiana ◼ modo R ◼ estamos interessados em relações entre descritores (caracteres, espécies) ◼ “espaço I” ◼ correlação (Pearson) ◼ distância qui-quadrado Coeficientes e distâncias UTO i + - UT O j + a b - c d a + b c + d a + c b + d p = a +b +c + d d = zero duplo!Cross-classification ~ classificação cruzada Coeficientes e distâncias UTO i + - UTO j + a b - c d SMS a d N = +( ) ◼ Concordância Simples (N = a + b + c+ d) Simétrico Binário – Qualivativo - zero-duplo! Modo Q Coeficientes e distâncias UTO i + - UTO j + a b - c d ◼ Rogers-Tanimoto ◼ Yule YS ad bc ad bc = − + RTS a d a d b c = + + + + ( ) ( ) ( )2ij N ad bc a b c d a c b d 2 2 = − + + + + ( ) ( )( )( )( ) ◼ Chi - quadrado Simétrico Binário – Qualitativo - zero-duplo! Modo Q O problema do zero duplo! Ecologia x Taxonomia Percepção do universo amostral Coeficientes e distâncias UTO i + - UTO j + a b - c d ◼ Jaccard JACS a a b c = + +( ) SORS a a b c = + + 2 2( ) ◼ Dice/Sorenson/ Czekanowski Assimétrico Binário – Qualivativo - zero-duplo! Modo Q Outros coeficientes ◼ Kulczynski ◼ Ochiai ◼ Steinhaus KULS a a b a a c = + + + 1 2 [ ( ) ( ) ] OCHS a a b a c = + +[( )( )] )( ),min(2 11 1 == = + = M k jk M k ik M k jkik St xx xx S ◼= Ssor para binários Não-métrico Assimétricos quantitativos (Kulczynski e Steinhaus) – adequados para dados de abundância de espécies Compara os sites em termos da abundância mínima de cada espécie pelo somatório das abundâncias de todas as espécies em cada site Média dos somatórios das abundâncias mínimas pelo total da abundância em cada site Média geométrica das razões do total de espécies em cada site Assimétrico qualitativo Ex: Coeficiente de Steinhaus Abundância das Espécies A B W Site x1 7 3 0 5 0 1 16 Site x2 2 4 7 6 0 3 22 Mínimo 2 3 0 5 0 1 11 S17 (x1, x2) = ___W___ = ___2W___ (A + B )/2 (A + B )/2 S17 (x1, x2) = __2 X 11___ = 0.579 16+ 22 Coeficientes para dados mistos ◼ Gower = ◼ Wk é o peso para cada comparação. Para cada variável, k, se Xik ou Xjk está faltando, então wk = 0.0. ◼ para variáveis quantitativas : ◼ para variáveis multiestado Sk = 1.0 se Xik = Xjk, wk = 1.0 ◼ para variáveis binárias Sk = 1.0 se Xik = Xjk = 1 wk = 1.0 [ou 0 se ambos são 0] 0.1 )( 1 minmax = − − −= w XX XX S k kk jkik k = p k p kk Gow w wS S 1 1 Coeficientes e distâncias = −= N k jkikij xxd 1 22 )( ◼ Distância euclidiana ij ijd d= 2 xj2 – xi2 xj1 – xi1 Distâncias métricas desenvolvidas para descritores quantitativos, ocasionalmente para semiquantitativos! Tamanho e forma 2 11 2 )( 1 == −= N k jk N k ikij xxd N 2 2)( N cb d ij − = Diferença de tamanho ou para dados binários 2 11 2 1 2 )( 11 )( − === −−= N k jk N k ik N k ij xxxxd NjkikN 2 2)()( N cbcbN d ij −−+ = Diferença de forma ou para dados binários Coeficientes e distâncias ◼ Distância manhattan = −= N k jkikMij xxd 1 BC ik k N jk ik jk k Nd x x x x = − + = = 1 1 ( ) ◼ Distância Bray-Curtis CANij ik jk ik jkk N d x x x xN = − += 1 1 ( ) ◼ Distância Canberra A distância entre dois descritores de dois objetos é a soma da distância da abcissa do descritor y1 e da ordenada y2. Variante da D. Manhattan que exclui os zeros duplos. Nela a diferença entre espécies abundantes contribui menos do que a abundância das espécies raras. É um coeficiente métrico. Os valores de similaridade não mudam com a inserção dos zeros-duplos, mas é uma distância semimétrica. Sua formulação utiliza W, A e B. Contribuição de espécies abundantes e raras similares Dados quantitativos - adequados para composição de comunidades D = 1 - 2W_ A + B ◼ Distância corda ◼ distância euclidiana simples ◼ 1 | I1 ◼ 2 6,9282 | I2 ◼ 3 1,4142 5,8310 | I3 ◼ 1 2 3 ◼ distância corda ◼ 1 | I1 ◼ 2 0,0000 | I2 ◼ 3 0,2748 0,2748 | I3 ◼ 1 2 3 variáveis in V1 V2 V3 I1 1,0 1,0 1,0 I2 5,0 5,0 5,0 I3 1,0 2,0 2,0 A distância corda é máxima quando espécies encontradas em dois sites são completamente diferentes . Abordagem que destaca dados de composição de espécies . Calcula distância euclidiana depois que os sites são vetorizados para ter comprimento equivalente a 1 . Destaca maior similaridade entre sites com o mesmo conjunto e proporcionalidade de abundância entre as espécies . Zero é o valor quando o conjunto de espécies e as proporções são as mesma e √2 para sites que não compartilham nenhuma espécie Não muda com zeros duplos Dados centralizados sp 2 1 1 sp1 x1 x2 D3 (x1, x2) D4 (x1, x2) X = pares de sites D3 = distância corda com distância euclidina D4 = distância corda com métrica geodésica Coeficientes e distâncias ◼ Correlação ir x x x x x x x x j ik i jk j ik i jk j = − − − − ( )( ) ( ) ( )2 2 Propriedades de coeficientes e distâncias Uma distância é métrica se : 1. É simétrica d(x,y) = d(y,x) Uma distância é métrica se : 1. É simétrica d(x,y) = d(y,x) 2. Indivíduos não idênticos podem ser distinguidos – se d(x,y) ≠ 0 então x ≠ y Uma distância é métrica se : 1. É simétrica d(x,y) = d(y,x) 2. Indivíduos não idênticos podem ser distinguidos – se d(x,y) ≠ 0 então x ≠ y 3. Indivíduos idênticos não podem ser distinguidos – se temos elementos idênticos (x,x), então d(x,x) = 0 Uma distância é métrica se : 1. É simétrica d(x,y) = d(y,x) 2. Indivíduos não idênticos podem ser distinguidos – se d(x,y) ≠ 0 então x ≠ y 3. Indivíduos idênticos não podem ser distinguidos – se temos elementos idênticos (x,x), então d(x,x) = 0 4. Desigualdade triangular: dado 3 entidades (x,y,z) então d(x,z) ≤ d(x,y) + d(y,z) ◼x ◼d(x,y) ◼y ◼z ◼d(x,z) ◼d(y,z) ◼y ◼x ◼z coeficientes- métrico/não-métrico escolhendo coeficientes – Legendre & Legendre (1998) ◼e tc. Efeitos de “dados faltando” 1 0,0 2 2,0 0,0 3 1,73 0,0 0,0 1 2 3 A B 1 2 3 1 2 3 0 1 1 0 ? 1 0 1 1 0 1 ? 1 1 1 1 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 1 0 ? 1 0 0 1 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0,0 2 2,24 0,0 3 2,24 0,0 0,0 1 2 3 ◼Distância euclidiana ddd 231312 += ! 231312 ddd + 10000 1000 100 10 5 2 1 11,4142135622,2360679773,16227766 10 31,6227766 100 0 2000 4000 6000 8000 10000 12000 0 20 40 60 80 100 120 Transformação - raíz quadrado Transformando variáveis 1 2 5 10 100 1000 10000 10000 1000 100 10 52 1 0 0,301029996 0,698970004 1 2 3 4 0 2000 4000 6000 8000 10000 12000 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 Log(x)X transformação - logarítmo 1 2 5 10 100 1000 10000 ◼Transformando variáveis Parâmetros para Espécies : Teste RelDe x RelDo Psyc mapo Pera glab Malo arbo Tern bras Eute edul Psyc nuda Sloa guia Cupa oblo Hyer alch Ocot pulc Atta dubi Calo bras Scle denu Astr acul Case obli Eccl rami Psyc laci Lica octa Andi frax Ilex thee Myrc pubi Alch trip Clus criu Laci luci Mani subs Viro gard Cord sell Bros guia Myrc race Case sylv Xylo lang Mico cabu Inga edul Blep sali Mico cinn Endl pani Ocot acip Nect oppo Guar macr Amai inte Myrc sple Anib viri Mico dode Roll seri Mata inte Tibo mutaOcot eleg Chry f lex Pout beau Heis silv Tapi guia Bali pedi Prothept Wein paul Rich granGuap oppo Guar guid Psid catt Garc gard Ocot dispOcot venu Jaca pube Anib f irm Byrs ligu Poso lati Myrc bras Euge sp.1 Sche anguCamp guav Euge oblo Pari exce Myrc mult Inga sp. Cocco sp.Caly conc Cedr f iss Euge neogPter rohr Dahl pinn Moll schoApar cord Eryt ampl Matay sp. Tabe umbe Cabr canjHirt hebe Rapa guia Euge stigMico cuba Ilex pseu Rapa ferr Ilex amar Cous cont Mayte sp.Inga sess Mico cine Alch glan Pour guia Euge bocaRapa venoRubiaceae Inga lanc Myrc spec Dipl cuspViro bicuGord frut Zant rhoi Cous micr Ficus sp.Euge pruiBath aust Vite polyOura parvSw ar submGuat austCalyp sp.Hedy bras Humi dentTibouchinEuge sulcCecr pachTabe aff.Mico rigiMarl tomePime cf.Marl obscMyrt sp.1 Xylo bras Tabe cass Mapr guiaStyr cf.Cryp sali Ficu pulc Neom glomVoch bifaTachigaliPout sp.Euge umbeEuge handEuge cf. Nect cf. Marli sp. Syag roma Prad lactMoll boraRapa hermSenn multIxor heteAiou saliOrmo arbo Tric clau Cybi peruEuge schuMyrc bicaMyrc tiju Euge cf. Euge cathAbar brac Pipt macrEuge melaEuge sp.1Podo seloMeli seloCari streEuge exceChio cf.Clet scabOcot cf.Roup brasTetr granTetr rubrRubi espiOcot silvRapa cf.Nect aff.Aspi olivMyrc hebeAegi sellEuge cf.Euge moseEuge sp.8Daph raceEuge sp.1Quii glazRapa umbeMayt robuZoll ilicMoll cyatPsyc suteVerno sp.Soro bonpOcot moseBros glasSymp laxiPout sp.Euge sp.2Psych sp.Marl eugeMyrc paluOcot cf.Euge sp.1Euge cf.Guap hirsSiph guilCaly striCaly luciOcot bracMyrs guiaMyrc cf. RelDe 8.587.576.565.554.543.532.521.510.50-0.5-1-1.5-2-2.5 R e lD o 7 6.8 6.6 6.4 6.2 6 5.8 5.6 5.4 5.2 5 4.8 4.6 4.4 4.2 4 3.8 3.6 3.4 3.2 3 2.8 2.6 2.4 2.2 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 ◼sem log Parâmetros para Espécies : Teste RelDe x RelDo Psyc mapo Pera glab Malo arbo Tern bras Eute edul Psyc nuda Sloa guiaCupa oblo Hyer alch Ocot pulc Atta dubi Calo bras Scle denu Astr acul Case obli Eccl rami Psyc laci Lica octa Andi frax Ilex thee Myrc pubi Alch trip Clus criu Laci luci Mani subs Viro gard Cord sell Bros guia Myrc race Case sylv Xylo lang Mico cabuInga edul Blep sali Mico cinn Endl pani Ocot acip Nect oppo Guar macr Amai inte Myrc sple Anib viri Mico dode Roll seri Mata inte Tibo mutaOcot eleg Chry f lex Pout beau Heis silv Tapi guia Bali pedi Prot hept Wein paul Rich granGuap oppo Guar guid Psid catt Garc gard Ocot dispOcot venu Jaca pube Anib f irm Byrs ligu Poso lati Myrc bras Euge sp.1 Sche anguCamp guav Euge oblo Pari exce Myrc mult Inga sp. Cocco sp. Caly conc Cedr f iss Euge neog Pter rohr Dahl pinn Moll scho Apar cord Eryt ampl Matay sp. Tabe umbe Cabr canjHirt hebe Rapa guia Euge stigMico cuba Ilex pseu Rapa ferr Ilex amar Cous cont Mayte sp. Inga sess Mico cine Alch glan Pour guia Euge boca Rapa veno Rubiaceae Inga lanc Myrc spec Dipl cusp Viro bicuGord frut Zant rhoi Cous micr Ficus sp.Euge prui Bath aust Vite poly Oura parvSw ar subm Guat austCalyp sp. Hedy bras Humi dent Tibouchin Euge sulcCecr pach Tabe aff. Mico rigi Marl tome Pime cf. Marl obscMyrt sp.1 Xylo bras Tabe cass Mapr guiaStyr cf. Cryp sali Ficu pulc Neom glomVoch bifa Tachigali Pout sp. Euge umbe Euge hand Euge cf. Nect cf. Marli sp. Syag roma Prad lact Moll bora Rapa herm Senn mult Ixor heteAiou sali Ormo arbo Tric clau Cybi peruEuge schu Myrc bicaMyrc tiju Euge cf. Euge cathAbar brac Pipt macr Euge mela Euge sp.1Podo selo Meli selo Cari streEuge exce Chio cf. Clet scabOcot cf.Roup bras Tetr gran Tetr rubrRubi espiOcot silvRapa cf. Nect aff. Aspi olivMyrc hebeAegi sell Euge cf. Euge mose Euge sp.8 Daph raceEuge sp.1Quii glaz Rapa umbe Mayt robuZoll ilic Moll cyat Psyc sute Verno sp.Soro bonpOcot mose Bros glasSymp laxi Pout sp.Euge sp.2Psych sp. Marl euge Myrc paluOcot cf.Euge sp.1Euge cf.Guap hirs Siph guilCaly striCaly luciOcot brac Myrs guiaMyrc cf. RelDe 5.85.65.45.254.84.64.44.243.83.63.43.232.82.62.42.221.81.61.41.210.80.60.40.2 R e lD o 76.86.66.46.265.85.65.45.254.84.64.44.243.83.63.43.23 2.82.6 2.4 2.2 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 ◼com log Slide 1: Escolhendo variáveis/descritores/caracteres Coeficientes - Distâncias Transformação Slide 2: Fácil de observar ? Slide 3: Objetivo ? Slide 4: Homologia Slide 5 Slide 6: Outras considerações Slide 7: modo “Q” e “R” Slide 8: Coeficientes e distâncias Slide 9: Coeficientes e distâncias Slide 10: Coeficientes e distâncias Slide 11: O problema do zero duplo! Ecologia x Taxonomia Percepção do universo amostral Slide 12: Coeficientes e distâncias Slide 13: Outros coeficientes Slide 14: Ex: Coeficiente de Steinhaus Slide 15: Coeficientes para dados mistos Slide 16: Coeficientes e distâncias Slide 17: Tamanho e forma Slide 18: Coeficientes e distâncias Slide 19 Slide 20: Dados centralizados Slide 21: Coeficientes e distâncias Slide 22: Propriedades de coeficientes e distâncias Slide 23: Uma distância é métrica se : Slide 24: Uma distância é métrica se : Slide 25: Uma distância é métrica se : Slide 26: Uma distância é métrica se : Slide 27: coeficientes- métrico/não-métrico Slide 28: escolhendo coeficientes – Legendre & Legendre (1998) Slide 29: Efeitos de “dados faltando” Slide 30: Transformando variáveis Slide 31 Slide 32 Slide 33
Compartilhar