Buscar

Capitulo 6 - Consenso e +¡ndices num+®ricos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 1� 
Capítulo 6 
 
 
Consenso e índices numéricos 
 
Árvores de Consenso 
 Em certas circunstâncias é necessário combinar duas ou mais árvores em uma única 
configuração que sintetize a informação original. A necessidade deste procedimento pode 
advir de várias razões. Ocasionalmente pode haver duas hipóteses de autores diferentes que 
sejam temporariamente consideradas plausíveis. Também pode ser necessário combinar 
hipóteses advindas de dados de natureza diferentes (e.g. dados moleculares e morfológicos) 
ou de diferentes tratamentos dos mesmos dados. Entretanto, a mais freqüente utilização de 
árvores de consenso acontece quando existe mais de uma árvore mais parcimoniosa para a 
mesma matriz. Neste caso pode ocorrer a necessidade de se combinar centenas ou até 
milhares de árvores diferentes. 
 A idéia geral que guia a utilização dos consensos é que o grau de concordância 
encontrado entre as várias árvores a serem combinadas é um indicador do grau de 
confiança que pode ser depositado em grupos específicos. Os grupos considerados mais 
“sólidos” são incluídos na árvore de consenso, enquanto que aqueles considerados 
duvidosos são omitidos. Árvores de consenso, portanto, funcionam como um procedimento 
para avaliar grupos quando na presença de hipóteses não-idênticas. Para além deste ponto 
em comum, existem vários tipos diferentes de árvores de consenso, de acordo com o 
critério utilizado para avaliar graus de concordância ou discordância entre os cladogramas 
fundamentais. 
 
Consenso Estrito 
 
 
 Figura 6.1. A-D. Quatro topologias igualmente parcimoniosas (árvores fundamentais) e seus 
componentes. 
 
 O tipo mais simples de consenso é o chamado consenso estrito, originalmente 
proposto por Sokal & Rohlf (1981). Conforme o nome indica, este tipo de consenso é o 
mais restritivo em termos de tolerância a hipóteses contraditórias. O consenso estrito 
considera como aceitáveis apenas aqueles componentes (descendentes de um nó) que 
estejam presentes em todas as árvores a serem combinadas. Considere o exemplo na Figura 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 2� 
6.1A-D. Temos aqui quatro árvores a serem combinadas. Se enumerarmos todos os grupos 
monofiléticos, ou seja seus componentes, de cada uma delas, teremos aqueles representados 
em notação parentética abaixo de sua respectiva árvore. Comparando os grupos, vemos que 
três deles (ABCDEF), (AB) e (DEF) ocorrem nas quatro árvores. Um consenso estrito, 
portanto, irá ter representados apenas aqueles três grupos, e nenhum mais, conforme 
mostrado na Figura 6.2. Se, por outro lado, tivermos as três árvores representadas na Figura 
6.3A-C, constatamos que o único grupo comum a todas é (ABCDE), ou seja, o grupo 
inteiro (Figura 6.3D). Neste caso, o consenso estrito terá apenas aquele grupo representado, 
todos os outros serão colapsados em politomias. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Figura 6.2. Consenso estrito baseado nos cladogramas fundamentais da Figura 6.1. 
 
 
 Figura 6.3. A-C. Três topologias igualmente parcimoniosas. D. Consenso estrito baseado nas 
topologia A-C. 
 
 Fica claro que a árvore de consenso estrito portanto terá apenas um número de nós 
igual ao número dos grupos comuns a todas as arvores combinadas (e.g. três no exemplo da 
Figura 6.3A-C e um no consenso estrito da Figura 6.3A-C). Observe que o consenso estrito 
é insensível a diferentes freqüências dos grupos nas árvores combinadas. Por exemplo, se 
tivermos 1000 árvores a combinar, e determinado grupo esteja presente em 999 delas, mas 
faltando em uma, este grupo não entrará no consenso estrito. 
 
 
Consenso Semi-Estrito 
 O consenso semi-estrito, também chamado consenso de componentes combináveis, 
só foi formalmente publicado por Bremer (1990), embora já fosse implementado há mais 
tempo em alguns programas de análise filogenética. O consenso semi-estrito é semelhante 
ao estrito. A única diferença é que um grupo que não seja contradito em nenhuma árvore é 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 3� 
incluído no consenso. Para entendermos esse detalhe, temos que revisar alguns aspectos 
relativos à compatibilidade de grupos e subgrupos. Dois ou mais grupos são compatíveis 
quando a informação neles contida não é contraditória. Por exemplo, na Figura 6.4A,B 
podemos dizer que o grupo (BCD) existe nas duas árvores apresentadas. Logo, este grupo 
seria parte de um consenso estrito nelas baseado. O grupo (CD), por outro lado, só está 
presente em uma delas (Figura 6.4B). Apesar de não estar presentes nas duas árvores 
originais, observa-se que o grupo (CD) não é contradito pela da Figura 6.4A, onde não 
ocorre. A da topologia da Figura 6.4A não está indicando nenhum grupo oposto a (CD), 
como seriam por exemplo (CB) ou (DB), mas simplesmente não tem nenhuma implicação 
sobre as relações dentro de (BCD). Pode-se dizer que a árvore da Figura 6.4A nem nega 
nem afirma o grupo (CD), mas é simplesmente neutra com relação a essa questão. A 
topologia da Figura 6.4A, portanto, é compatível com o grupo (CD), embora não o 
corrobore. Vê-se então que grupos compatíveis não são necessariamente idênticos, embora 
todos os grupos idênticos sejam necessariamente compatíveis. 
 
 
 
 
 
 
 
 
 Figura 6.4. A-B. Duas topologias igualmente parcimoniosas. 
 
 A diferença entre o consenso estrito e o semi-estrito reside neste detalhe. O 
consenso semi-estrito aceita grupos que estejam presentes em apenas parte das árvores 
originais, desde que não sejam contraditos em nenhuma delas. Assim sendo, o consenso 
semi-estrito das duas árvores na Figura 6.4A,B seria aquele visto na Figura 6.4B, ao passo 
que o consenso estrito seria aquela da Figura 6.4A. 
 
 
 Figura 6.5. A-B. Três topologias igualmente parcimoniosas. C. Consenso semi-estrito baseado nas 
topologia A-B. 
 
 Um fato interessante acerca do consenso semi-estrito é que em certos casos ele pode 
ser mais resolvido (ou seja, ter mais nós) que qualquer uma das árvores originais 
combinadas. Um exemplo é visto na Figura 6.5A-C. Vemos que os grupos (AB), (DEFG) e 
(FG) não coexistem em nenhuma das árvores fundamentais, mas estão os três presentes no 
consenso semi-estrito. Cada árvore original contem três nós, enquanto que o consenso 
contem cinco nós. Tal propriedade não ocorre com o consenso estrito. 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 4� 
 Deve-se lembrar que somente poderá haver diferenças entre o consenso semi-estrito 
e o estrito quando as árvores a serem combinadas contiverem politomias (embora isso não 
seja por si só condição suficiente para que haja a diferença). Com árvores originais 
exclusivamente dicotômicas, os dois tipos de consenso terão sempre resultados idênticos. 
Outro ponto a considerar é que as árvores de consenso, independe do tipo, são sempre 
menos parcioniosas que suas árvores fundamentais. 
 
Consenso de Maioria 
 A última formade consenso que apresentamos é o consenso de maioria (Majority 
Rule consensus). Ao contrário dos demais tipos de consenso, essa forma considera a 
freqüência dos componentes encontrados nas árvores fundamentais. Considere o exemplo 
apresentado na Figura 6.6. 
 
 
 Figura 6.6. Consenso de maioria. A-D. Cladogramas fundamentais. E. Freqüência dos 
componentes. F. Consenso de maioria. 
 
 A freqüência dos componentes (Figura 6.6E) varia em relação às topologias 
fundamentais (Figura 6.6A-D). A árvore de consenso considera os componentes mais 
freqüentes (Figura 6.6F) e informa a freqüência de cada componente (Figura 6.6F). O 
limite mínimo para a inclusão de grupos nessa forma de consenso varia de 50-100%, e fica 
a cargo do investigados estipular limites mínimos para os grupos considerados. 
 Esse tipo de consenso é freqüentemente utilizado e pode até ser obrigatório para 
algumas análises que ao invés de parcimônia utilizam outro critério para a escolha de 
topologias mais condisentes com os dados (i.e., análises probabilísticas como análises 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 5� 
Baeysiana, não discutida aqui. Um pouco de atenção à topologia gerada pelo consenso de 
maioria neste exemplo em comparação às árvores fundamentais revela uma propriedade 
indesejada do consenso de maioria muitas vezes ignoradas por seus usuários. Note que a 
topologia apresentada na árvore de consenso (Figura 6.6F) não existe no conjunto de 
árvores fundamentais (Figuras 6.6A-D). Ou seja, esse tipo de consenso pode gerar uma 
topologia que contempla relações de parentescos que não possui nenhum suporte nos 
dados. No exemplo acima, nenhuma topologia (Figuras 6.6A-D) considera que (AC) é 
grupo irmão de (BDE) como propõe a árvore de consenso (Figuras 6.6F)! 
 
Índices numéricos 
 
 Na ausência de homoplasia, a relação entre árvores e caracteres é direta. Os 
caracteres concordam integralmente com um ou mais grupos monofiléticos do 
dendrograma. Entretanto, as relações entre cladogramas e caracteres raramente são tão 
simples, exatamente por que a homoplasia é um fenômeno muito freqüente. Uma matriz de 
dados pode ter inúmeras árvores igualmente parcimoniosas, ou seja, várias soluções 
igualmente satisfatórias para o mesmo conjunto de caracteres. Alguns caracteres podem 
concordar mais com o cladograma que outros. Da mesma forma, diferentes árvores podem 
concordar mais ou menos com as respectivas matrizes de onde foram derivadas. Existe todo 
um espectro imaginável de graus de concordância entre caracteres e arvores. Para lidar com 
essa complexidade, foram idealizados vários tipos de indicadores numéricos que expressam 
o grau de concordância (ou discordância) entre dados e arvores através de um numero. 
Cada um deles nos fornece informação sobre uma faceta ligeiramente diferente das 
possíveis interações existente entre cladogramas e caracteres. Neste capitulo veremos 
alguns dos indicadores numéricos (coletivamente chamados "estatísticas de arvore") mais 
utilizados atualmente. 
 
 
Comprimento 
 O comprimento da arvore é o mais simples dos indicadores numéricos. A noção 
na realidade já foi utilizada de maneira informal em capítulos prévios. O comprimento de 
uma arvore é simplesmente o conjunto de todas as transformações nela observadas. Mais 
precisamente, é a soma de todas as transformações observadas em todos os ramos do 
dendrograma, e é expressa por número de passos. Cada transformação é computada como 
uma unidade (1), e o comprimento da arvore será sempre um número inteiro positivo. Ao 
calcular o comprimento, temos que sempre manter em mente que no caso de caracteres 
multiestado teremos no mínimo duas transformações por caráter, que serão somadas 
normalmente. 
 
 
 
 
 
 
 
 
 
 
Figura 6.7. Matriz de dados e cladograma mais parcimonioso. 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 6� 
 
 Para entender adequadamente a noção de comprimento, iniciaremos com um 
exemplo simples e depois analisaremos casos progressivamente mais complicados. 
Portanto vejamos primeiramente a situação representada na Figura 6.7. Aqui temos uma 
matriz de 10 caracteres dois-estados e uma única arvore mais parcimoniosa. Note que cada 
caráter mostra apenas uma única transformação nesta árvore, e que portanto temos um total 
de 10 transformações para a árvore inteira. Diz-se neste caso que o comprimento da árvore 
é 10, ou 10 passos. Em árvores sem homoplasia e unicamente com caracteres dois-estados, 
o comprimento será sempre igual ao numero de caracteres na matriz. O raciocínio inverso 
obviamente também e valido. Se encontrarmos uma árvore cujo número de passos seja 
igual ao número de caracteres (ou colunas) da matriz, tendo esta matriz unicamente 
caracteres dois-estados, podemos concluir sem nenhum exame adicional que não existe 
homoplasia no problema. 
 
 
 
 
 
 
 
 
 
 
 Figura 6.8. Matriz de dados e cladograma mais parcimonioso. 
 
 Vejamos agora o exemplo na Figura 6.8. Aqui temos uma matriz com 12 
caracteres dois-estados e uma árvore mais parcimoniosa dela derivada. Somando-se todas 
as transições observadas ao longo dos ramos da arvore, chegamos ao valor de 14. O 
comprimento da arvore, portanto e de 14 passos. Imediatamente podemos dizer que neste 
caso temos homoplasia, do contrário o comprimento seria igual ao número de caracteres, ou 
seja, 12. Mais uma vez frisamos que esta conclusão somente se justifica por que sabemos 
de antemão que todos os caracteres na matriz são dois-estados. Existem dois passos 
adicionais, uma diferença devida a ocorrência de homoplasia. As origens destes dois passos 
adicionais são facilmente localizáveis: são os caracteres 6 e 11. Na árvore vê-se que estes 
dois caracteres exigem mais de uma transformação para se encaixarem no cladograma. 
 
 
Índices 
 
 Conforme já foi observado, os caracteres podem concordar em maior ou menor 
medida com hipóteses de relações filogenéticas. Existem vários graus imagináveis de 
concordância e discordância, dependendo da complexidade do caso. Para se lidar com essa 
questão e permitir a comparação do grau de concordância entre caracteres e árvores, foram 
criados alguns indicadores que expressam tal concordância por meio de um número. Vários 
índices já foram idealizados, cada um mais apropriado para expressar uma determinada 
faceta das possíveis interações entre dados e cladogramas. Dois destes têm sido utilizados 
com muita freqüência e atualmente são incluídos como parte integrante de estudos 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 7� 
filogenéticos aplicados. 
 
Índice de Consistência 
 O chamado índice de consistência (comumente abreviado por ic, ou ci, em inglês) é 
um dos mais antigos dos indicadores numéricos atualmente em uso, e também um dos mais 
simples. Foi originalmente proposto por Kluge & Farris (1969), e é até hoje utilizado sem 
grandes modificações. O índice de consistência pode se aplicar a duas situações diferentes. 
A primeira é quando ele expressa o grau de concordância entre um caráter individual e uma 
hipótese, o chamado índice de consistência unitário ou individual. Esta versão do índice de 
consistência é a relação entre onúmero de transições presentes na série de transformação 
de um determinado caráter e o número de transformações que este caráter apresenta em 
uma determinada árvore. Por exemplo, considere um caráter com 3 estados (0, 1 e 2). Esta 
série de transformação possui portanto duas transformações. Se este caráter apresentar 
quatro transformações em uma determinada árvore, dizemos que seu ic é igual a 0.5, ou 
seja, 2 (número de transformações na série de transformação) dividido por 4 (número de 
passos na árvore). É freqüente que se represente o número de transformações na série por 
m, e o número de passos observado na árvore por s. Sendo assim, o índice de consistência 
pode ser representado como: 
ci=m/s 
 No caso de caracteres dois estados, o numerador será sempre igual a 1, nos 
multiestados esse valor será maior de acordo com o número de transformações observadas 
em sua série de transformação. 
 No caso de um caráter exibir na árvore o mesmo número de passos de sua série de 
transformação, teremos o numerador igual ao denominador, o que resulta em um ci=1. Este 
é o máximo valor que o índice de consistência pode apresentar, e representa a situação em 
que o caráter não mostra nenhuma homoplasia em uma determinada árvore. É fácil 
entender que na medida em que o caráter apresenta mais homoplasia, o denominador 
aumenta, enquanto que o numerador permanece sempre com o mesmo valor. Portanto, 
quanto mais homoplasia o caráter apresenta, menor o seu ci. Um ci de 1 significa que o 
caráter se encaixa perfeitamente na hipótese, enquanto que um ci menor que 1 significa a 
presença de homoplasia. Quanto mais baixo for o ci, maior será o grau de homoplasia 
observado. Desta forma, pode-se dizer que um caráter binário com ci=0.9 é menos 
homoplástico que um de ci=0.2. 
 O ci nunca atinge a marca zero, por mais homoplasia que um caráter apresente. Isto 
acontece porque para que m/s resultasse em zero, m teria de ser zero, ou s infinito, o que 
nunca ocorre já que todo caráter mostra pelo menos uma transformação e o número de 
passos é necessariamente finito. Entretanto, como não existe um limite para s, o ci pode se 
aproximar ilimitadamente de zero, sem nunca efetivamente atingir esse valor. No caso de 
autapomorfias (ou seja, transformações que ocorrem somente em um único terminal), o ci 
será sempre igual a 1. Isto acontece porque autapomorfias não podem jamais apresentar 
homoplasia, já que nenhuma configuração imaginável de terminais resultaria em um 
número adicional de passos. Portanto neste caso s será sempre igual a m, e ci portanto igual 
a 1. 
 O índice de consistência também pode ser utilizado para expressar o grau de 
concordância entre uma hipótese e o conjunto total de caracteres, ou seja, entre uma árvore 
e sua correspondente matriz de dados. Neste caso, não se mede o grau de concordância 
entre uma árvore e um caráter em específico, mas sim entre uma árvore e todos os 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 8� 
caracteres tomados como um conjunto. Este é o chamado índice de consistência conjunto 
ou global (normalmente abreviado por CI, em maiúsculas). A noção do índice de 
consistência conjunto é muito semelhante a do unitário. Seu cálculo também segue as 
mesmas linhas, representando uma função entre a soma de todas as transições observadas 
na matriz de dados como um todo e o número de passos (ou comprimento) do cladograma: 
 
CI=Σm/Σs 
 
 Por exemplo, se uma matriz apresenta um total de 10 transformações, e uma árvore 
nela baseada apresenta comprimento de 20 passos, diz-se que o IC da árvore é igual a 0.5, 
ou seja, 10 dividido por 20. O número total de transformações observadas numa matriz 
costuma ser representado por M, enquanto que o comprimento de uma árvore é 
representado por S. Portanto, a fórmula para o cálculo do índice de consistência global 
seria: 
 
CI=M/S. 
 
 No caso de matrizes contendo exclusivamente caracteres dois-estados, o cálculo de 
CI é particularmente direto, sendo simplesmente a divisão do número total de caracteres na 
matriz pelo comprimento da árvore. Nestes casos em particular, M é igual ao número de 
caracteres, já que cada caráter apresenta uma única transformação. Este não é o caso 
quando existem caracteres multiestados na matriz, já que cada multiestado apresenta mais 
de uma transformação. Nestes casos M será evidentemente maior que o número de 
caracteres. Deve-se portanto estar atento para a presença de multiestados na matriz ao se 
calcular o CI. 
 O índice de consistência global, assim como o unitário, é máximo quando o número 
de transformações observado na árvore é igual àquele presente na matriz. Neste caso, M é 
igual a S, e portanto CI=1. Tal situação indica que não existem homoplasias no cladograma. 
Na medida em que o número de passos na árvore aumenta em relação às transformações na 
matriz, o quociente M/S se torna progressivamente menor, se afastando de 1. Quanto menor 
o CI, mais homoplasias existem na árvore. Novamente da mesma forma que o ci, o CI 
nunca chega a zero. Também não há limites para o quanto o CI pode se aproximar de zero, 
já que não há limites para S. 
 O índice de consistência global pode ser empregado como indicador do grau 
relativo de parcimônia de árvores. Para uma determinada matriz, a árvore mais 
parcimoniosa será aquela com maior CI. Caso haja várias árvores igualmente 
parcimoniosas, todas elas terão o mesmo valor de CI e vice-versa. A razão desta correlação 
é simples: as árvores mais parcimoniosas minimizam o valor de S, e por conseguinte 
resultam em um incremento do quociente M/S. Árvores menos parcimoniosas, por sua vez, 
têm o efeito contrário sobre o índice. O valor de M para uma mesma matriz é 
evidentemente constante independentemente da árvore, portanto o fator determinante do 
valor maior ou menor de CI é S. 
 Tem sido freqüentemente observado que a presença de autapomorfias em uma 
matriz tende a aumentar o CI (Brooks et al., 1986). Isto ocorre porque tais caracteres 
adicionam sempre uma unidade tanto a M quanto a S, e nunca aumentam S em relação a M. 
Desta forma, sua inclusão tende a “inflacionar” a estimativa do CI. Por essa razão, 
autapomorfias são comumente eliminadas do cálculo de CI (Carpenter, 1988), uma 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 9� 
sugestão freqüentemente seguida mas não unânime (cf. Yeates, 1992). Da mesma forma, 
caracteres ditos invariáveis (ou seja, aqueles que estão presentes em todos os terminais) 
também tendem a inflacionar o CI, e deveriam igualmente ser omitidos para cálculos de CI 
(Carpenter, 1988; Yeates, 1992). 
 
Índice de Retenção 
 O índice de consistência, apesar de sua simplicidade e ampla utilização, sofre de 
algumas características indesejáveis. Consideremos uma análise filogenética para 10 
terminais na qual um caráter A ocorre com estado 1 em dois deles e 0 em oito. Um outro 
caráter, B, ocorre com estado 1 em quatro terminais e 0 em seis. Digamos que no 
cladograma mais parcimonioso o caráter A necessite de dois passos (por exemplo, 
transformação 0-1 independentemente em dois terminais), enquanto que o caráter B 
também necessite de dois passos (por exemplo, uma transformação 0-1 em um terminal e 
outra na base de um grupo formado por três terminais). O ic dos dois caracteres será igual a 
0.5 em ambos os casos (com m=1 e s=2). Entretanto, ao observarmos a situação em mais 
detalhe, vemos que os dois caracteres não são iguais em seunível de homoplasia. O caráter 
A não está nos fornecendo nenhuma informação sobre a estrutura do cladograma, e é tão 
homoplástico como é possível ser naquela situação. O caráter B, por outro lado, ainda nos 
fornece alguma informação sobre o monofiletismo de três dos terminais. O caráter B não é 
tão homoplástico quanto seria possível dadas as circunstâncias. Claramente, há uma 
diferença entre os dois caracteres à qual o índice de consistência não é sensível. Este índice 
não discrimina a proporção de homoplasia possível no caráter. 
 Para suprir estas deficiências, foi criado o índice de retenção (ir). O ir foi 
inicialmente proposto no programa Hennig86 (de S. Farris, 1988), e publicado 
primeiramente em Farris (1989) e Fitzhugh (1989, com crédito a Farris). O índice de 
retenção é também de cálculo bastante simples, mas um pouco mais complexo que o ic. Em 
sua fórmula, há o recurso a uma outra variável, g, que expressa o máximo de homoplasia 
que um caráter pode apresentar, dadas as proporções de distribuição de seus estados nos 
terminais. Para caracteres dois-estados, este máximo é igual ao número de terminais que 
apresentam o estado menos freqüente. No exemplo acima, g será igual a 2 no caráter A e 4 
no caráter B. Para caracteres multiestados, o cálculo de g é um pouco mais complexo, e 
pode ser feito da seguinte maneira. Considera-se os terminais como formando uma 
politomia total, cada um dos terminais com o respectivo estado do caráter cujo g se quer 
determinar. Na raiz da politomia, se considera cada um dos estados como sendo o estado 
primitivo, e estima-se, para cada um deles, o número de passos total para explicar todas as 
outras distribuições. Dos números de passos obtidos, o menor valor corresponde ao g do 
multiestado. 
 Uma vez de posse do valor de g, as restantes variáveis são aquelas utilizadas no 
cálculo do ic, e o índice de retenção é definido como: 
 
ir=(g-s)/(g-m). 
 
 No exemplo acima, temos que o ir do caráter A é (2-2)/(2-1)= 0, enquanto o do 
caráter B é (4-2)/(4-1)=0.67. Desta forma, vemos que o índice de retenção claramente 
expressa a diferença entre os dois caracteres, indicando que o caráter B é mais informativo 
na hipótese mais parcimoniosa. Ao contrário do índice de consistência, o de retenção pode 
chegar a zero, como no caráter A, quando a homoplasia observada é a máxima possível. 
nã
o d
ist
rib
uir
Princípios de Sistemática e Biogeografia – Capítulo 6: Consenso e índices numéricos 
 10� 
Isto indica que o caráter não tem nenhuma informação congruente com a hipótese. No outro 
extremo, temos que o ir chega a 1 quando não há homoplasia. Para autapomorfias, o ir 
resulta em 0/0, o que é indeterminado. O resultado faz sentido, já que não é coerente 
indagar sobre o máximo de homoplasia em um caráter que por definição não pode 
apresentar homoplasia. Freqüentemente este resultado é erroneamente expresso nos 
programas como 1, embora alguns simplesmente informem "aut" quando se pede o ir de 
uma autapomorfia. O índice de retenção para uma árvore inteira, ou índice de retenção 
conjunto – ou global, (RI), é calculado como o somatório das variáveis da fórmula para 
todos os caracteres, como: 
 
IR=(Σg-Σs)/(Σg-Σm). 
 
 É comum representar-se Σg como G, Σs como S e Σm como M. O índice de 
retenção global também se diferencia do de consistência por não ser sensível à influência 
das autapomorfias. Assim, não existe o fenômeno de "inflação" do RI. 
 O índice de retenção deriva de vários outros indicadores numéricos menos 
utilizados. O primeiro deles é a medida de homoplasia (h), que expressa o número de 
passos excedentes do mínimo (para cada caráter ou para o cladograma). Considerando os 
símbolos utilizados previamente, temos que: 
 
h=s-m. 
 
 Por sua vez, o chamado coeficiente de distorção (cd) foi proposto por Farris (1973) 
como: 
 
cd=h/(g-m). 
 
 O índice de retenção é algebricamente obtido ao se fazer o complemento de cd, 
como 1-cd, ou 1-[h/(g-m)] ou 1-[(s-m)/(g-m)], que é igual a (g-s)/(g-m). Repare que como o 
índice de retenção é o complemento do coeficiente de distorção, então ir+cd=1. No 
exemplo acima, o cd do caráter A é 1 e o do caráter B é 0.33. O artifício da 
complementaridade é utilizado para que os valores assumidos pelo ir variassem na mesma 
direção do ic (quanto mais homoplasia, menor o valor numérico do índice). 
 
 
 
 
Literatura Citada:

Outros materiais