Buscar

Análise filogenética

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

DESCRIÇÃO
Análise filogenética: conceitos, aplicações e métodos de análises.
PROPÓSITO
Análise filogenética é a chave para a compreensão da evolução dos organismos vivos. A partir
de seus conceitos e aplicações é possível compreender a história da vida na Terra, inferir o
passado e predizer o futuro, corroborando para o conhecimento biológico e fortalecendo a
conservação dos seres vivos.
OBJETIVOS
MÓDULO 1
Reconhecer os conceitos e as terminologias filogenéticas
MÓDULO 2
Reconhecer os principais mecanismos de construção de uma árvore filogenética
INTRODUÇÃO
A análise filogenética é uma representação gráfica que demostra as relações evolutivas entre
organismos. A partir da filogenia, ou seja, do estudo da relação evolutiva entre as espécies,
podemos compreender melhor a vida, seu comportamento ao longo do tempo, e prever as
forças que podem ou não modificar a história. Podemos também entender as peculiaridades de
um organismo recém-descoberto simplesmente por conhecer a filogenia, as relações de
parentescos, porque dois organismos próximos entre si possuem qualidades semelhantes.
Atualmente, diversas disciplinas incluem o estudo e a construção de árvores filogenéticas,
principalmente no campo da Biologia, como Genética, Sistemática, Ecologia, Biomedicina e
Bioinformática.
Assim, ao longo desse conteúdo, iremos estudar as análises filogenéticas. Para isso, vamos
conhecer as aplicações, os principais conceitos e as terminologias utilizadas em um
cladograma (árvores filogenéticas) e diferenciar o cronograma de filograma e árvores não
enraizadas. Em seguida, descreveremos os principais conceitos de grupos filogenéticos e
entenderemos como são construídas as árvores filogenéticas.
MÓDULO 1
 Reconhecer os conceitos e as terminologias filogenéticas
ANÁLISE FILOGENÉTICA: PRINCIPAIS
APLICAÇÕES
O termo árvore filogenética é usado para se referir às histórias evolutivas ramificadas, isto é,
a história de um ancestral e todos os seus descendentes ao longo do tempo representadas por
ramos e troncos — como uma árvore — que se relacionam a partir de um parentesco próximo
comum. Inferir uma árvore da história evolutiva é importante porque organiza o pensamento a
partir da evolução, da forma natural dos acontecimentos ao longo das transformações e do
tempo.
 COMENTÁRIO
Se pensarmos que todos os indivíduos existentes atualmente possuem ancestrais e que estes
ancestrais possuem outros ancestrais, então vamos logo compreender que a história desses
dois organismos convergirá em certo ponto.
As histórias evolutivas de dois organismos diferentes levam a um ancestral comum, que vai
estar mais afastado de acordo com a relação entre os dois organismos de estudo. Por
exemplo, o ancestral do homem com o chipanzé está muito mais próximo no tempo do que o
ancestral do homem com uma samambaia.
 ATENÇÃO
Nesse contexto, o estudo filogenético nos ajuda a compreender a origem e a ordem de
desenvolvimento das características dos seres vivos atuais. Como sabemos, as características
se modificam ao longo do tempo, e assim, é possível traçar uma organização lógica de
transformações de determinada feição.
A partir de uma árvore filogenética, por exemplo, podemos compreender quando surgiu as
sementes ou as flores dentro do reino vegetal.
Vamos observar, com isso, que a semente é uma novidade evolutiva muito mais antiga que as
flores. A observação de que muitas espécies possuem flores determina um padrão que é um
indício de proximidade de parentesco relativo.
Todas essas constatações podem ser inferidas a partir de uma árvore filogenética.
CARACTERÍSTICAS HOMÓLOGAS E
CARACTERÍSTICAS ANÁLOGAS
A árvore filogenética também nos auxilia a compreender se uma característica é homóloga ou
análoga.
As características homólogas são aquelas que podem ser comparadas porque possuem
origem, estrutura e desenvolvimento similares.
 EXEMPLO
O membro superior de um crocodilo pode ser comparado à asa de um morcego, mas não pode
ser comparada à asa de uma mosca (uma possui penas e ossos, a outra possui nervuras e
quitina). Neste último caso, a asa é apenas uma característica análoga (pela função de voar),
mas não apresenta origem, estrutura e desenvolvimento comuns.
Na imagem a seguir, vemos que crocodilos, pássaros, baleias, humanos, cavalos e morcegos
apresentam os membros superiores com características homólogas, ou seja, eles possuem os
mesmos ossos, em posições semelhantes.
Reconhecer a história evolutiva de um conjunto de organismos nos permite organizar os seres
a partir de um critério mais informativo e útil para a inteligência humana. Atualmente, os
cientistas procuram agrupar os organismos que possuem maior grau de parentesco entre si,
estes grupos são denominados táxons.
javascript:void(0)
TÁXONS
Táxon é um conjunto de organismos que formam uma unidade associada a um nível
dentro de um sistema de classificação, por exemplo, espécies, gêneros, famílias etc. Para
designar táxons, procura-se elementos que estejam mais próximos entre si do que com
qualquer outro elemento de fora do táxon. Para delimitá-los, nada é mais útil do que o
conhecimento da árvore filogenética.
A criação de um sistema que organiza os seres vivos a partir do seu grau de parentesco possui
um grande poder preditivo. Se, por exemplo, descobrimos uma substância medicinal
importante em uma espécie de fungo, provavelmente, os táxons próximos também produzem
esta substância, talvez de forma mais abundante e eficiente.
Se fósseis de um crânio pré-histórico recém-encontrado é homólogo ao crânio humano atual,
podemos inferir que a fisiologia daquele ser vivo antigo era próxima a dos humanos atuais.
Uma constatação considerada tão óbvia hoje, mas que só foi possível ser percebida e
credibilizada pelo conhecimento da árvore filogenética.
 
Foto: Shutterstock.com
Árvores filogenéticas ajudam a compreender a história dos genes. Infere-se que um gene
antigo se duplicou dentro de um organismo e, ao se diferenciar um do outro, produziu a
diversidade de propriedades e as funções conhecidas hoje.
A história de cada gene percorreu o DNA dos seres vivos ao longo tempo, o que poderia ter
sido o início da multiplicidade de organismos e suas complexidades. Com as árvores
filogenéticas, também podemos compreender a história de cada pedaço do material genético.
Os genes também podem ser classificados em famílias e subfamílias, e auxiliar na
compreensão das suas propriedades.
 SAIBA MAIS
Com a análise filogenética, é possível rastrear doenças humanas, sendo uma importante
ferramenta de controle e prevenção. Este foi o caso da síndrome respiratória aguda grave
(SARS), uma doença viral que surgiu na Ásia por volta de 2002. Foi analisado o DNA viral de
pacientes infectados demonstrando que a origem das cepas era de um coronavírus, um grupo
de vírus já conhecido que infecta o sistema respiratório e digestivo de mamíferos e aves.
A partir da análise dos diversos DNAs encontrados em humanos, morcegos, aves, vacas,
civetas (pequeno mamífero asiático) e outros, traçou-se a história do ancestral ao descendente
e, assim, descobriu-se que o vírus deve ter se originado em morcegos, passando para civetas
e mais tarde para humanos.
A importância desse estudo fica mais evidente quando consideramos que, quase 20 anos
depois, a evolução desse vírus causaria uma das maiores pandemias da história humana!
A construção da árvore filogenética possui diversas funcionalidades, desde as mais científicas
e amplas, como a classificação dos seres vivos ou a evolução de determinada característica,
como os frutos; mas também aplicações mais diretas, como a descoberta da origem biológica
de determinado microrganismo patológico ou uma espécie vegetal invasora.
ÁRVORE FILOGENÉTICA
Conceitualmente, uma árvore filogenética, ou cladograma, representa a história evolutiva de
um conjunto de terminais (por exemplo, táxons) conectados por suas ancestralidades.
Denominamos terminais as extremidades dos ramos daárvore que podem ser representadas,
dentro de uma filogenia, por espécies ou conjuntos de espécies (gêneros, famílias, ordens...),
mas também podem ser organismos fósseis, indivíduos de uma população, ou mesmo genes.
ANCESTRALIDADE
A ancestralidade é a conexão entre um ancestral e seus descendentes.
javascript:void(0)
 
Imagem: Shutterstock.com
Uma árvore genealógica, ou pedigree, é um diagrama que demonstra as relações entre
gerações de indivíduos, isto é, entre pais e filhos. Observar a completa história genealógica de
uma população nos mostrará a existência de múltiplas gerações durante um longo período de
tempo — o que define uma linhagem populacional.
Se aumentarmos ainda mais a escala de observação evolutiva, perceberemos múltiplas
linhagens populacionais se intercalando periodicamente a partir de um fluxo gênico.
Graficamente, isso poderia ser representado em diversas linhas interlaçadas.
 SAIBA MAIS
Com isso, chegamos ao conceito de linhagem evolutiva, que significa a história das relações
entre as diversas linhagens populacionais de uma mesma espécie durante um longo intervalo
de tempo.
Podemos comparar os diversos níveis de linhagem a partir de uma árvore, em que as folhas
são os indivíduos, cada galho representa uma população (linhagem populacional) e o tronco
representa a linhagem da espécie (linhagem evolutiva).
 Comparação dos diversos níveis de linhagem pode ser feita a partir de uma árvore.
Uma linhagem evolutiva pode sofrer divisão originando duas linhagens separadas posteriores,
evento que denominamos cladogênese — a origem de ramos. A ocorrência desses eventos
na natureza acontece por causa do surgimento de alguma barreira que impede o fluxo gênico
entre dois conjuntos de populações. As barreiras podem ser:
BARREIRA GEOGRÁFICA
Diz-se que a barreira é geográfica quando o espaço físico impede a permuta de material
genético; por exemplo, quando algumas sementes são dispersas para uma ilha remota e esses
indivíduos não conseguem mais se relacionar reprodutivamente com os indivíduos da
população mãe. A barreira geográfica é mais evidente.
BARREIRA TEMPORAL
Ocorre quando uma população fica reprodutiva em uma estação do ano diferente das demais,
impossibilitando a troca genética. Se a barreira permanecer durante um longo tempo, estas
populações evoluirão independentes, tendendo a se diferenciarem entre si por causa da
ocorrência de mutações genéticas, um processo biológico importante que modifica e
movimenta a natureza.
As barreiras podem produzir divergências de dois tipos principais: alopátrica e simpátrica.
Vejamos a seguir.
DIVERGÊNCIA ALOPÁTRICA
Quando ocorre o isolamento geográfico entre duas populações, alo: diferentes; pátrica: casa.

DIVERGÊNCIA SIMPÁTRICA
Quando uma barreira ocorre por diferença temporal, ecológica, fisiológica, por exemplo, mas
sem que haja isolamento geográfico, sim: mesma; pátrica: casa.
 ATENÇÃO
Um ponto importante deve ser observado, caso a barreira seja transitória, ou seja, se não
houver modificações inviabilizando a reprodução e seus descendentes, o fluxo gênico é
reestabelecido. Quando, porém, ocorre um longo período de isolamento, gerando modificações
que não permitem mais o acasalamento ou descendentes viáveis, o isolamento deixa de ser
um evento extrínseco (ocorre só por causa do efeito geográfico) e passa a ser um evento
intrínseco, com sua própria fisiologia, o que impede o fluxo gênico.
Compreender o passado para construir uma árvore filogenética, não tendo vivido nele e sem
um livro contando a história detalhada, é uma tarefa complexa; mas já existem metodologias
confiáveis que nos permitem fazer inferências com credibilidade. A principal fonte de
informação são todos os organismos vivos atuais e todos os fósseis encontrados.
A construção da árvore filogenética começa no tempo atual e vai estimando as relações no
tempo passado. Os fósseis servem como retratos de um período da evolução e fornecem
importantíssimas compreensões.
Em uma árvore filogenética, como observamos a seguir, o fóssil é representado por um ramo
em que seu ponto terminal está em uma idade anterior a atual (setas azuis). Todas as espécies
vivas, entretanto, terminam alinhadas na parte mais extrema do gráfico, representando a idade
atual (representado pela seta vermelha).
 Árvore filogenética representando ancestralidade.
TERMINOLOGIAS DO CLADOGRAMA
Uma árvore filogenética, ou cladograma, é um gráfico com linhas retas denominadas ramos —
linhagens em evolução —, conectadas por nós — divisão das linhagens. Possui duas
propriedades fundamentais:
1) deve ser direcionada, com início, meio e fim, representando tempo transcorrido;
2) deve ser acíclica, ou seja, os ramos que divergem não se fundem mais.
O gráfico pode ser construído em formato diagonal, retangular ou circular, como mostra as
imagens a seguir.
 Formato das árvores filogenéticas.
Os topos das árvores são denominados terminais e possuem rótulos que representam os
nomes das espécies (os táxons terminais) ou um conjunto de espécies relacionadas (gêneros,
famílias, ordens...). O nó também representa o último ancestral comum dos organismos de
uma linhagem filha.
Os ramos internos são aqueles que possuem dois nós nas extremidades, enquanto os ramos
externos são aqueles que possuem um nó e uma extremidade livre. O ponto no qual o gráfico
se inicia é denominado raiz da árvore, onde está o ancestral mais antigo de todos os táxons
da árvore. A raiz também é um ramo externo, mas na posição oposta aos táxons terminais,
estando geralmente sem etiqueta.
ETIQUETA
Etiqueta em uma árvore filogenética é o local onde se escreve o nome que representa a
extremidade de um ramo terminal no gráfico filogenético. Esse nome pode ser um táxon,
um gene ou uma característica. Às vezes, o autor do gráfico pode optar por deixar
ausente estes nomes, mas eles sempre estarão implícitos.
javascript:void(0)
A imagem a seguir apresenta essas terminologias.
 Terminologias utilizadas em um cladograma.
Para apontar determinado pedaço do gráfico filogenético nos estudos de filogenética, usamos o
termo clado, que significa “um ancestral e todos os seus descendentes” (significa também um
grupo monofilético, que estudaremos a seguir).
Dentro de uma mesma árvore filogenética, existem diversos clados que podem ser compostos
por dois ou mais táxons terminais e um ou mais nós; porém o mais importante é compreender
que um clado inclui todos os descendentes de um ancestral comum. Para apontar determinado
ramo ao lado de outro, usamos a terminologia grupo irmão.
Por exemplo, na imagem a seguir, o grupo 1 é um clado, que é irmão do grupo 2, outro clado.
 Árvore filogenética ilustrando dois clados (1 e 2) e um grupo irmão.
 ATENÇÃO
Um ponto importante a respeito do gráfico de árvore é que a ordem dos ramos terminais pode
ser visualizada de diferentes maneiras porque os seus ramos estão permanentemente
conectados entre si. Se rodarmos um ramo em seu próprio eixo, as relações não se modificam,
o que pode ser útil para organizar melhor um gráfico.
Porém, se cortarmos um ramo e colarmos em outra parte, as relações serão modificadas, o
que não pode acontecer. Dessa forma, a topologia da árvore — a ordem de ramificação — é
sempre a mesma quando giramos os ramos em seu próprio eixo, mas ela se altera se
cortarmos e colarmos ramos em outros lugares.
 A topologia não se modifica ao girarmos a árvore.
Clados podem ser descritos textualmente, sendo representados por parênteses. Por exemplo:
 EXEMPLO
Vamos supor que temos uma árvore com três táxons, A, B e C, conforme demostrado na figura
a seguir.
 Árvore filogenética mostrando três táxons: A, B e C.
Ao observarmos na imagem acima, vemos que o táxon A é mais próximo filogeneticamente de
B do que de C (A e B possuem um ancestral mais próximo entre si). Podemos então descrever
as relações da seguinte maneira: ((AB) C). Este formato, denominado Newick, é muito utilizado
em programas de computação.COMPATIBILIDADE ENTRE CLADOGRAMAS
DIFERENTES
A árvore filogenética possui diversos atributos, mas a principal função dela é representar todas
as relações existentes entre todos os seres vivos extintos do nosso planeta.
Isso seria algo operacionalmente impossível porque existem muitos organismos e fósseis
sendo descobertos constantemente.
Além disso, um terminal pode representar uma espécie, mas pode se multiplicar em
subespécies, variedades ou populações de uma espécie. Portanto, a aplicação do método só
possui utilidade porque o gráfico filogenético possui a propriedade de resiliência em
simplificações. Isso quer dizer que podemos construir uma árvore filogenética somente para
determinado conjunto de espécies porque se espera encontrar a mesma estrutura das
relações, mesmo não estando incluídos todos os táxons existentes na análise.
Vamos entender no exemplo a seguir:
 EXEMPLO
Ao observamos as duas árvores a seguir, vemos que a árvore 2 possui somente sete terminais,
subdividida em três grupos: A, B e C, mas representando as mesmas relações da árvore 1, que
está completa (com nove terminais). Veja que o grupo B continua sendo irmão do grupo A
(possui um ancestral comum mais recente entre si).
 A árvore 2 é uma simplificação da árvore 1.
Espera-se que uma árvore possua a propriedade de que, mesmo “podando” alguns ramos
terminais (retirando alguns táxons da análise), as relações básicas se mantenham as mesmas
entre os terminais restantes. Nesse caso, dizemos que uma árvore menor possui a propriedade
de compatibilidade. Podemos exemplificar isso na imagem a seguir.
 EXEMPLO
Ao cortar a linha tracejada indicada na árvore 1, o resultado será exatamente a árvore 2.
 A árvore 2 é uma simplificação da árvore 1.
A propriedade das relações resistirem com a simplificação dos terminais utilizados numa
análise é um atributo importante porque permite estimar relações mais profundas (antigas)
dentro da árvore da vida. Por exemplo:
Em uma tentativa de querer compreender as relações entre as espécies de rosas existentes,
só é possível compreender se uma rosa é mais próxima de um coqueiro ou uma samambaia
podando (retirar da análise) a maior parte da imensa quantidade de espécies que existem entre
essas linhagens, tão diferentes dentro do reino vegetal.
 
Foto: Shutterstock.com
 ATENÇÃO
Vale lembrar que dois terminais em uma árvore estão conectados pelo mesmo nó, portanto, se
retirarmos alguns ramos adjacentes, o caminho continua o mesmo, o que denominamos
propriedade acíclica da árvore, isto é, um único caminho sendo percorrido em uma única
direção.
CRONOGRAMA, FILOGRAMA E ÁRVORES NÃO
ENRAIZADAS
Como sabemos, um cladograma representa a evolução histórica de um conjunto de
descendentes partindo de um ancestral comum ao longo do tempo, mas é preciso tomar alguns
cuidados ao se falar sobre a antiguidade. Um ancestral só é mais antigo que outro se eles
estão no mesmo caminho em direção à raiz.
Em um cladograma comum, não podemos saber qual ancestral é mais antigo quando eles
estão em caminhos diferentes, pois os ramos são meramente proporcionais ao espaço da
figura no papel.
Um cronograma, por outro lado, é um cladograma mais sofisticado, construído a partir do
conhecimento das idades dos nós ancestrais, geralmente fornecidas por fósseis ou idades
geológicas relacionadas. Nesse tipo de gráfico, o comprimento dos ramos é proporcional ao
tempo em que cada divergência deu origem (o nó).
 Cronograma.
Outro cladograma mais sofisticado é o filograma, que possui comprimentos de ramos
proporcionais às mudanças evolutivas de cada linhagem. Nessa configuração, a árvore é
montada a partir de ramos com tamanhos diversos, ora podendo ser muito curto ora muito
longo. Esse tipo de gráfico é muito útil para o estudo dos padrões de evolução das
características das linhagens ao demonstrar que determinado ramo tem maior tendência
evolutiva que outro. O ramo mais longo acumula mais mudanças evolutivas porque evoluiu
mais rapidamente do que um ramo curto.
 Filograma.
Se um filograma foi construído pela análise de um gene específico, podemos inferir que o gene
evoluiu mais rápido em uma linhagem do que em outra com ramo mais curto. Pode ser que
todos os outros genes (não analisados) tenham evoluído mais rapidamente na linhagem que
apresentou ramo longo, mas essa conclusão será mais bem embasada se corroborar com a
análise de outros genes.
A imagem a seguir compara o filograma com o cronograma.
 Filograma e cronograma, mostrando politomia, grupo irmão, comprimento e idade dos
ramos.
Além disso, em uma árvore filogenética, podemos mostrar os ancestrais comuns, nesse caso,
a árvore é chamada enraizada, ou não, na chamada árvore não enraizada. A seguir,
conseguimos observar as diferenças entre as duas árvores.
 
Imagem: Leandro Cardoso Pederneiras
ÁRVORE ENRAIZADA
Quando ela possui um ponto de origem no tempo, o ancestral comum de todos os ramos, e os
terminais estão orientados para uma idade mais recente, o que nos permite discernir o caminho
da evolução e a transformação dos caracteres.

 
Imagem: Leandro Cardoso Pederneiras
ÁRVORES NÃO ENRAIZADAS
Mostram apenas as relações entre espécies e suas aproximações, mas não mostra quem é o
ancestral comum de todos os ramos.
Para encontrarmos o ponto de enraizamento de um cladograma, devemos incluir na análise um
grupo irmão, que nada mais é do que espécies próximas ao grupo interno, reconhecidas por
não fazerem parte desse grupo. O nó onde o grupo irmão se conecta ao grupo interno será o
nó mais profundo, o ancestral comum mais antigo, e o ponto de enraizamento.
INCERTEZAS FILOGENÉTICAS
Até o momento, vimos árvores filogenéticas dicotômicas, também chamadas de binárias,
aquelas que um evento de divergência gera exatamente duas linhagens filhas. Como
divergências entre linhagens é um evento relativamente raro, acreditar no surgimento de
linhagens dicotômicas é razoável.
 Árvores dicotômicas.
No entanto, temos casos em que mais de duas linhagens surgem em um único ancestral
comum ao mesmo tempo, algo raríssimo, mas não completamente impossível. A esse caso
chamamos de politomias.
 
Imagem: Ag.Ent/Wikimedia Commons/Domínio Público
Em termos gráficos, quando essa situação é retratada em uma árvore, a melhor maneira de
interpretar é pela ocorrência de uma incerteza filogenética.
 ATENÇÃO
Precisamos sempre lembrar que a construção de uma árvore filogenética parte de dados
observados pelo homem e que, por representar apenas uma fração dos dados, pode ser
insuficiente para resolver todos os relacionamentos: são apenas hipóteses das relações
evolutivas reais.
O que é incerteza filogenética?
Incerteza filogenética ocorre quando não é possível compreender a ordem de ocorrência de
duas ou mais divergências evolutivas, criando assim um ponto com múltiplas origens, uma
politomia.
Normalmente, quando executamos análises filogenéticas a partir dos diversos programas e
métodos existentes, mais de uma árvore ótima pode ser encontrada, nesse caso,
precisaremos sintetizar o conhecimento em uma única árvore para facilitar a análise. Para
solucionar esse problema, uma árvore consenso é criada geralmente a partir do seguinte
critério (estrito): todos os ramos serão dicotômicos, mas aqueles ramos que estiverem em
posições diferentes entre árvores serão colapsados (unidos) em uma politomia.
Na imagem a seguir, vemos três ramos que emergem o nó A, simbolizando uma politomia
formada graficamente pelo colapso (união) dos ramos envolvidos. Além disso, vemos o ramo
triangular preto mais alto na filogenia, significando um colapso de ramos, mas, nesse caso, o
objetivo do autor foi simplificar propositalmente o gráfico.
 Nó colapsado tem o mesmo significado que politomia.
A politomia, portanto, representa incerteza nesses casos.
GRUPOS FILOGENÉTICOS
A Biologia começou uma nova fase a partir da teoria da evolução no século XIX. Antes disso,
os organismos eram basicamente classificadospor suas semelhanças. Entretanto, nos dias
atuais, os pesquisadores acreditam que um conjunto de organismos pode ser mais bem
agrupado pelo critério da ancestralidade comum e pelo uso da árvore filogenética.
 SAIBA MAIS
A taxonomia, área que busca estudar a classificação, a nomenclatura e a identificação dos
organismos, agora podia usar esta grande ferramenta. As novas premissas da Biologia levaram
a antiga taxonomia a se unir a filogenética, transformando-se definitivamente em um ramo da
Sistemática, disciplina que estuda a evolução da biodiversidade. Isso deixou claro que não é
possível criar um sistema de classificação sem uma árvore filogenética, porque classificação,
parentescos e cladogramas estão no mesmo lado da moeda.
A taxonomia busca classificar os organismos a partir de um sistema hierárquico (níveis
taxonômicos). Por exemplo, uma espécie está contida em um gênero, que está contido em
uma família, que está contida em uma ordem, e depois em uma classe, em um filo e em um
reino.
 Classificação dos organismos.
Com o avanço das técnicas de construção de árvores filogenéticas, diversos grupos
taxonômicos propostos pelas antigas classificações foram reanalisados, dessa vez, buscando a
classificação evolutiva. Com isso, foram verificados que muitos táxons (como os gêneros, as
famílias) já eram completos, isto é, compostos por todos os descendentes de um ancestral
comum, mas também se verificou que alguns grupos não continham todos os descendentes
existentes.
Assim, uma terminologia importante entrou em vigor:
 
Imagem: Petter Bøckman, revisada por Peter Brown/Wikimedia Commons/ CC BY-SA 3.0
GRUPO MONOFILÉTICO
Conjunto de táxons que contêm um único ancestral comum e todos os seus descendentes
conhecidos.
GRUPO PARAFILÉTICO
Conjunto de táxons que contêm um único ancestral comum e quase todos os descendentes, ou
seja, faltam poucos para virarem monofilético.
GRUPO POLIFILÉTICO
Conjunto de táxons que não inclui o ancestral comum de todos os seus membros.
Atualmente, a taxonomia busca elaborar um sistema de classificação a partir de grupos
monofiléticos e para isso é preciso obter árvores filogenéticas.
INTRODUÇÃO À ANÁLISE FILOGENÉTICA
Assista ao vídeo em que o especialista Leandro Cardoso Pederneiras falará sobre os conceitos
e terminologias de árvore filogenética, linhagens evolutivas e ancestralidade.
VEM QUE EU TE EXPLICO!
Análise filogenética: Principais aplicações.
Análise filogenética: Principais aplicações.
Árvore filogenética.
Árvore filogenética.
Grupos filogenéticos.
Grupos filogenéticos.
VERIFICANDO O APRENDIZADO
1. VIMOS QUE, CONCEITUALMENTE, UMA ÁRVORE FILOGENÉTICA, OU
CLADOGRAMA, REPRESENTA A HISTÓRIA EVOLUTIVA DE UM
CONJUNTO DE TERMINAIS CONECTADOS POR SUAS
ANCESTRALIDADES. SOBRE AS ÁRVORES FILOGENÉTICAS, ANALISE
AS AFIRMATIVAS A SEGUIR E ASSINALE A ALTERNATIVA CORRETA:
A) Uma linhagem evolutiva é dita como a completa história genealógica de uma única
população.
B) Linhagem populacional é constituída por um conjunto de linhagens populacionais de uma
mesma espécie durante um longo intervalo de tempo.
C) Uma barreira geográfica formadora de cladogênese significa uma população que se torna
reprodutível num tempo diferente das demais, impossibilitando a troca genética.
D) Quando duas populações se isolam por um longo tempo, não permitindo mais a troca
genética entre as populações, mesmo quando se conectam geograficamente, dizemos que
houve um evento extrínseco de divergência.
E) Quando duas populações se isolam por diferença temporal, mas sem o isolamento
geográfico, dizemos que houve uma divergência simpátrica.
2. VIMOS QUE, COM O AVANÇO DA FILOGENIA, MUITOS TÁXONS JÁ
ERAM COMPLETOS, ISTO É, COMPOSTOS POR TODOS OS
DESCENDENTES DE UM ANCESTRAL COMUM, MAS TAMBÉM SE
VERIFICOU QUE ALGUNS GRUPOS NÃO CONTINHAM TODOS OS
DESCENDENTES EXISTENTES. ASSIM, FOI ADOTADA A TERMINOLOGIA
PARA GRUPO MONIFILÉTICO, PARAFILÉTICO E POLIFILÉTICO. OS
GRUPOS MONOFILÉTICOS SÃO AQUELES QUE APRESENTAM:
A) Um conjunto de táxons que contêm um único ancestral comum e todos os seus
descendentes conhecidos.
B) Um conjunto de táxons que contêm um único ancestral comum e quase todos os
descendentes.
C) Um conjunto de táxons que não inclui o ancestral comum de todos os seus membros.
D) Um conjunto de táxons que não têm um ancestral comum, mas tem todos seus
descendentes conhecidos.
E) Vários ancestrais comuns para cada conjunto de táxon.
GABARITO
1. Vimos que, conceitualmente, uma árvore filogenética, ou cladograma, representa a
história evolutiva de um conjunto de terminais conectados por suas ancestralidades.
Sobre as árvores filogenéticas, analise as afirmativas a seguir e assinale a alternativa
correta:
A alternativa "E " está correta.
 
A linhagem evolutiva é constituída por um conjunto de linhagens populacionais, que, por sua
vez, é a completa história genealógica de uma única população. A barreira geográfica
formadora de cladogênese é o espaço físico que impede a permuta de material genético. O
evento extrínseco é uma divergência momentânea que é reestabelecida quando a barreira
desaparece e as populações se entrecruzam novamente. Quando uma barreira ocorre por
diferença temporal, ecológica, fisiológica, por exemplo, mas sem isolamento geográfico,
denominamos de divergência simpátrica.
2. Vimos que, com o avanço da filogenia, muitos táxons já eram completos, isto é,
compostos por todos os descendentes de um ancestral comum, mas também se
verificou que alguns grupos não continham todos os descendentes existentes. Assim,
foi adotada a terminologia para grupo monifilético, parafilético e polifilético. Os grupos
monofiléticos são aqueles que apresentam:
A alternativa "A " está correta.
 
Grupo monofilético é um conjunto de táxons que contêm um único ancestral comum e todos os
seus descendentes conhecidos. Grupo parafilético é um conjunto de táxons que contêm um
único ancestral comum e quase todos os descendentes. Grupo polifilético é um conjunto de
táxons que não inclui o ancestral comum de todos os seus membros.
MÓDULO 2
 Reconhecer os principais mecanismos de construção de uma árvore filogenética
INTRODUÇÃO AOS MÉTODOS DE ANÁLISE
FILOGENÉTICA
Agora que já conhecemos a importância da árvore filogenética para a Biologia atual,
precisamos compreender um pouco mais como funciona sua construção.
Denominamos inferência filogenética a análise metodológica que gera um cladograma.
Existem diversas metodologias, mas começaremos com a inferência hennigiana e a máxima
parcimônia, por serem um marco histórico fundamental e a base para muitos conceitos. Esse
processo requer três etapas fundamentais, são elas:
A construção de uma matriz de dados.
A escolha da árvore compatível com os dados.
Uma análise estatística para verificar a confiabilidade dos clados e da árvore.
No entanto, devemos primeiro escolher o conjunto de espécies que vamos trabalhar.
Mas como fazermos essa escolha?
A escolha depende da pergunta que cada pesquisa procura responder. Se o desejo é saber,
por exemplo, as relações entre briófitas, pteridófitas, gimnospermas e angiospermas, algumas
espécies representando cada um desses grupos serão suficientes.
Mas, se o objetivo da pesquisa é compreender as relações somente entre as espécies de
embaúbas (angiosperma), um gênero de plantas com 70 espécies presentes em toda a
América Tropical, deve-se incluir na pesquisa a maior parte possível de espécies dessa árvore.
Além disso, devemos incluir na pesquisa um grupo irmão que será o ponto de enraizamento
do cladograma indicando a direção, ou polarização, da evolução dos táxons e caracteres.
 
Foto: Leandro Cardoso Pederneiras
 Embaúba na Mata Atlântica do Estado do Rio de Janeiro.
Depois de determinar o conjunto de organismos que a pesquisa incluirá, devemos selecionar
os tipos de caracteres que serão utilizados para montar uma matriz de dados. Para isso,
devemos escolher os caracteres que variam entre espécies e que possuem algumgrau de
herança. Por exemplo, a matriz de dados deve ser construída com o nome de todos os
caracteres na primeira linha e todos os táxons na primeira coluna, originando assim uma
matriz de táxon × caractere, que vamos chamar de matriz Z, conforme a seguir.
Táxon/caractere 1 2 3 4
A 0 0 0 1
B 1 2 0 1
C 1 2 1 1
D 0 1 0 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Você deve ter visto na matriz que cada caractere apresenta um número, mas o que esses
números significam?
Para cada caractere, existe um conjunto de estados, ou seja, condições específicas atribuídas
ao caractere. Por exemplo:
 
Imagem: Shutterstock.com
CARACTERE FORMA DA FOLHA DE UMA PLANTA
Pode estar no estado arredondado, lanceolado ou curvo.

 
Foto: Shutterstock.com
CARACTERE COR DO FRUTO
Pode estar no estado vermelho ou amarelo.
Cada estado de caractere deve ser codificado com um número, sendo zero, o estado
encontrado no grupo irmão. Os caracteres e os estados são levantados antes de iniciar a
análise filogenética, e os códigos são de livre escolha, mas o padrão é que o número 0
represente o provável estado mais ancestral dos conjuntos dos estados dentro de determinado
caractere.
Por exemplo, a matriz a seguir apresenta os parâmetros que assumimos para a construção da
matriz Z.
Quando analisamos a cor do fruto, vemos que o estado amarelo deve ser mais ancestral que o
vermelho.
Número Caractere Estado
1 Cor do fruto Amarelo (0), Vermelho (1)
2 Forma da folha Arredondada (0), Lanceolada (1), Curva (2)
3 Número de pétalas Quatro (0), Cinco (1)
4 Raízes aéreas Ausente (0), Presente (1)
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Ao observarmos o quadro, vemos que o caractere cor de fruto apresenta dois estados: amarelo
e vermelho. O estado amarelo (0) deve ser mais ancestral do que o vermelho (1).
Porém a escolha de códigos diferentes para os estados não afeta os resultados. Dois
pesquisadores podem optar pela ordem numérica que achar mais correta, mas isso não é feito
de qualquer maneira. Procura-se imaginar a mais provável ordem de transformações (entre
estados) ocorridas na natureza.
Quando um caractere possui apenas dois estados, ele é considerado binário; quando possui
mais de dois estados, ele é polimórfico. Por exemplo:
 
Imagem: Shutterstock.com
Binário
Cor do fruto – vermelho (0), amarelo (1).
javascript:void(0)
 
Imagem: Masur/ Wikimedia Commons / CC-BY-SA-3.0
Polimórfico
Forma da folha – oval (0), triangular (1), elíptico (2) ou lanceolada (3).
Até o ano de 1990, as matrizes de dados eram construídas pelos dados morfológicos, por
exemplo, cor do fruto, forma da folha, número de pétalas etc. Atualmente, o uso de sequências
de DNA se tornou viável e acessível, sendo a forma mais promissora de construção de uma
matriz.
Isso permitiu um ganho importante para as matrizes de dados, por exemplo:
javascript:void(0)
 EXEMPLO
Ao comparar dados morfológicos entre espécies, é possível encontrar em média 30 ou 40
caracteres úteis para a filogenia. Ao trabalhar com o sequenciamento de genes, que possuem
geralmente 300 a 1000 pares de bases de comprimento, os caracteres úteis podem aumentar
bastante.
Considerando que um DNA é formado por uma cadeia de nucleotídeos que pode ser Adenina
(A), Citosina (C), Guanina (G) ou Timina (T). Isto quer dizer que cada posição de um
nucleotídeo (um sítio) em um DNA é um caractere que pode ter até quatro estados: A, C, G ou
T.
Com a matriz de táxons × caractere em mãos, podemos seguir para as etapas da escolha da
árvore mais compatível com os dados, o que significa buscar a melhor reconstrução da história
filogenética a partir de dados amostrados (a matriz). Para isso, veremos a seguir o que significa
inferência hennigiana, máxima parcimônia, métodos de distância e de probabilidades.
INFERÊNCIA HENNIGIANA
Como vimos, atualmente existem diferentes metodologias empregadas para a construção de
uma árvore filogenética. Assim, neste conteúdo, buscaremos compreender as primeiras
abordagens históricas.
É importante ressaltar que nem sempre existiu uma forma metodológica clara para essa
construção. Podemos dizer que a filogenia moderna iniciou com a publicação das regras de
Willi Hennig em 1966 — o que chamamos de inferência hennigiana.
 
Foto: Irma Henng/Wikimedia Commons/ CC-BY-SA-3.0
 Willi Hennig (1913-1976), biólogo alemão é considerado o pai da sistemática moderna.
Hennig introduziu dois princípios que foram subsequentemente melhorados, mas serviram de
caminho para os avanços futuros:
O primeiro princípio observou que a evolução seguia o caminho de uma árvore; e o segundo,
que os caracteres não retrocedem em seus estados anteriores nem evoluem em estados iguais
de forma independentes (ou seja, para Hennig não poderia ocorrer homoplasias), mas
possuem uma direção progredindo do estado ancestral — plesiomórfico — para o estado
derivado — apomórfico —, perceptível pelo estudo da matriz de dados. Um conjunto de
terminais que possuem uma apomorfia é considerado um clado, sendo esse o critério para a
construção do cladograma.
HOMOPLASIAS
Semelhança estrutural decorrente de convergência evolutiva (entre duas linhagens
independentes entre si) ou reversão (a condição de um caractere retroceder ao estado
anterior), e não de ancestralidade comum.
javascript:void(0)
Estudaremos esses conceitos a partir do próprio cladograma e do caractere cor do fruto, que,
segundo o exemplo anterior (matriz Z), pode ser amarelo (0) ou vermelho (1). Na imagem, a
seguir, na árvore 1, a seta preta representa o ponto onde houve a mudança das condições do
caractere, no caso, estava em 0 (amarelo) e se transformou em 1 (vermelho). Logo, podemos
concluir que o estado vermelho é mais recente (apomórfico) que o amarelo (plesiomórfico)
quando comparamos outros pontos de sua própria linhagem (seta pontilhada dentro do
cladograma).
 Evolução do caractere cor do fruto na árvore filogenética.
Outra forma de representar uma mudança de estados na árvore é a partir de um traço preto
cruzando a linhagem do cladograma. Na imagem a seguir, na árvore 2, observamos que isso
ocorreu três vezes, em momentos diferentes, que foram representadas no gráfico por t1, t2 e t3
(t = tempo ou momento).
 Evolução de caracteres: paralelismo e reversão.
 ATENÇÃO
Percebam agora que em dois lugares diferentes (t1 e t2) ocorre a mudança de amarelo para
vermelho. Isso representa um paralelismo, duas linhagens independentes produzem a mesma
transformação de um caractere.
Se continuarmos observando a árvore 2, perceberemos que ocorreu uma outra transformação
da cor do fruto no ponto t3. Porém, neste caso, o estado anterior era vermelho (agora dizemos
que está em uma condição anterior, ou plesiomórfica) e passou para amarelo (estado mais
recente nesta linhagem, ou apomórfico). Este é o caso da reversão, porque voltou a ter
condição do ancestral DE (seta).
A inferência hennigiana, com isso, forneceu um método objetivo para usar a variação
observada nos caracteres e reconstruir a história evolutiva, um marco para a Biologia. Essa
metodologia, no entanto, no senso estrito do uso, não pode ser utilizada em larga escala
porque é notável a existência de homoplasias (convergência ou reversão de estados de
caracteres) na natureza. Mas, se permitirmos homoplasias, árvores filogenéticas podem ser
construídas com mais flexibilidade e realismo. Além disso, nas homoplasias, um caractere
pode suportar ramos independentes, trazendo um maior número de caminhos para a árvore
(veremos esse conceito com mais detalhes a seguir).
Precisamos agora de um método de otimalidade, uma métrica capaz de decidir quais árvores
são melhores. O primeiro método proposto foi a máxima parcimônia.
MÁXIMA PARCIMÔNIA
A máxima parcimônia parte do princípio de que a melhor árvore filogenética é satisfeita pelo
menor número de transformações dos caracteres ao longo dos ramos, ou seja, é aquelana
qual aconteceu um menor número de transformações ao longo da evolução. A implementação
ocorre em três passos básicos:
1) numa dada árvore filogenética, inserimos as mudanças de estado de cada caractere em
busca do número mínimo de mudanças, ou passos, que possam responder à topologia
apresentada;

2) calculamos o comprimento da árvore somando a quantidade de passos que foram
exigidos;

3) repetimos o mesmo processo em todas as árvores alternativas e comparamos os valores
dos comprimentos, o mais curto é considerado a história evolutiva mais provável.
Vamos supor que temos três táxons (A, B e C) e um grupo irmão (X) caracterizados pelos
dados da matriz que vou chamar de W, conforme o quadro a seguir:
Táxon/caractere 1 2 3 4
A 1 0 0 0
B 1 1 1 0
C 1 1 1 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Para três táxons, temos a possibilidade de três diferentes topologias; por exemplo, se temos os
táxons (A, B e C), as relações só podem ser estas: (A (BC)), ((AB) C) ou ((AC) B). Veja a
representação a seguir:
 Três arvores filogenética para 3 táxons diferentes (A, B e C).
Se analisarmos as mudanças de estados dos quatro caracteres, partindo do princípio de que o
estado ancestral de todos os caracteres é aquele apresentado no grupo irmão, vamos obter
diversos caminhos de transformações que levarão as características das espécies atuais (A, B
e C).
A seguir, traçamos os três caminhos possíveis e que os passos na matriz W nos indica, vamos
conhecer melhor?
 Três árvores filogenéticas criadas a partir dos dados da matriz W.
Na imagem, os números entre parênteses são os códigos do caractere na matriz W. As setas
representam a transformação do estado do caractere em parênteses, elas podem ser
apontadas para qualquer lado. Agora, vamos analisar as árvores em separado:
Táxon/caractere 1 2 3 4
A 1 0 0 0
B 1 1 1 0
C 1 1 1 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
ÁRVORE A
A matriz W diz que o caractere 1 possui a condição 0 no táxon X e 1 nos demais táxons (ABC),
logo, esta mudança foi compartilhada por todos os três táxons de uma só vez.
javascript:void(0)
Táxon/caractere 1 2 3 4
A 1 0 0 0
B 1 1 1 0
C 1 1 1 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Para representarmos isso na árvore, colocamos a seta na linhagem comum à ABC, no caso a
raiz.
O caractere 2 somente teve transformação nos táxons B e C (do estado 0 para 1), por isso
temos uma seta indicando essa mudança na parte comum dos dois táxons, pois será herdada
para todos seus descendentes.
Para o táxon A, não houve mudança nos caracteres 2, 3 e 4, por isso a ausência de setas no
ramo do táxon A.
No caractere 4 só ocorreu modificação no táxon C, logo a seta é exclusiva da linhagem
representada pelo ramo externo que vai dar origem a C.
ÁRVORES B E C
Realizando a mesma análise na árvore B e C, podemos perceber que a árvore A apresenta
quatro modificações (ou passos ou comprimentos representados pelas setas vermelhas), para
responder corretamente aos dados da matriz táxon × caractere. As outras opções necessitam
de seis passos.
Táxon/caractere 1 2 3 4
A 1 0 0 0
B 1 1 1 0
C 1 1 1 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
RESULTADO
Portanto, pelo critério da parcimônia, a árvore A seria a escolhida como a hipótese mais
provável.
 SAIBA MAIS
No exemplo anterior, esse seria o caractere 1 na árvore A, que pertence aos 3 táxons. Um
caractere é parcimoniosamente não informativo quando é exclusivo de um terminal, o que
denominamos como autapomorfia, no exemplo anterior, esse seria o caractere 4 na árvore A,
que só pertence ao táxon C.
Podemos chamar de caracteres parcimoniosamente informativos aqueles que são
compartilhados entre subconjuntos de terminais, levantando a hipótese de que existe um
ancestral comum que também possui tal estado de caractere.
PARCIMÔNIA
Assista ao vídeo a seguir em que o especialista explica a parcimônia, método de escolha de
árvores filogenéticas.
ÁRVORES ÓTIMAS
Uma das maiores dificuldades da construção de uma árvore filogenética é a quantidade de
hipóteses que podem existir.
 EXEMPLO
Se temos 3 terminais (A, B e C), teremos 3 possíveis topologias: (A (BC)), (B (AC)) ou (C (AB).
Quando temos 4 terminais esse número aumenta para 15 hipóteses. Mas com 10 terminais já
teremos 34 milhões de possibilidades e 20 terminais ultrapassando 8 setilhões.
Como, geralmente, as pesquisas trabalham com mais de 20 terminais, não é possível calcular
os passos em todas as árvores. No entanto temos algumas alternativas, pois não
conseguiríamos realizar essa verificação de forma manual, nem os processadores e as
memórias dos computadores tradicionais suportam este cálculo num tempo hábil.
O método mais utilizado para a busca da melhor árvore se chama poda e reenxerto de
subárvore (subtree pruning and regrafting – SPR). Essa é uma técnica de busca heurística,
que encontra uma solução mais rápida, um atalho, em detrimento da precisão. Não é garantido
descobrir a árvore ótima, mas geralmente acontece ou chegamos bem próximo.
HEURÍSTICA
Uma pesquisa que é designada para encontrar as árvores ótimas num espaço de
possibilidades de árvores sem necessariamente considerar todas as possíveis árvores.
A técnica SPR corta um ramo e cola em outra parte da própria árvore criando árvore por
rearranjo. Esta nova árvore não é muito diferente da árvore de origem porque muitos clados
continuam existindo. Assim, a técnica SPR percorre um espaço multidimensional de árvores
que estão conectadas umas às outras, procurando aquela com menor número de passos numa
cadeia lógica e contínua.
javascript:void(0)
 Método de poda e reenxerto de subárvore.
O algoritmo computacional calcula o comprimento de todas as árvores adjacentes a uma
árvore inicial e, se houver uma com menor comprimento, esta será a nova árvore, assim
sucessivamente. A busca termina num ponto do espaço multidimensional onde não é mais
possível caminhar sem melhorar o último resultado.
 ATENÇÃO
Recomenda-se executar mais de uma SPR e comparar os resultados encontrados.
DADOS MOLECULARES
Como já aprendemos, o avanço das técnicas filogenéticas sofreu um grande aporte com o
advento da Biologia molecular a partir de 1990. Atualmente, é relativamente fácil obter
sequências de DNA de qualquer indivíduo em um laboratório de Biologia molecular ou em
bancos de dados na internet, como o National Center for Biotechnology Information (NCBI).
Uma sequência de DNA usada na filogenia pode ser um gene, um espaço entre genes ou sítios
repetitivos do DNA.
O que importa para fins de criação de uma matriz de táxon × caracteres é a ordem em que os
nucleotídeos estão dispostos em cada sequência e suas variações entre cada terminal.
O caractere, neste sentido, é a posição (sítio) do nucleotídeo (numerado 1, 2, 3 etc.) e os
estados do caractere são os nucleotídeos (A, C, G e T). Porém, sequências de DNA possuem
tamanhos diferentes entre espécies e só podemos comparar uma com a outra se soubermos
exatamente onde elas são homólogas.
Para conseguir encontrar a homologia, posicionamos uma sequência em cima da outra em
busca de um conjunto de nucleotídeos idênticos entre todas as espécies, isso se chama
alinhamento das sequências de DNA.
 
Imagem: Leandro Cardoso Pederneiras
As oito sequências estão uma em cima da outra e desalinhadas.
As oito sequências agora foram deslocadas (para direita ou para a esquerda) para que ocorra o
pareamento das bases e o alinhamento.
Esta tarefa não é realizada manualmente, mas por programas computacionais que
avaliam quais são as melhores homologias, por exemplo, os programas MAFFT,
MUSCLE, CLUSTAL.
INFERÊNCIA FILOGENÉTICA COM
MODELOS EVOLUTIVOS
Iremos agora explorar um pouco mais sobre os modelos evolutivos, um pré-requisito para
executar análises de máxima verossimilhança e bayesiana.Você sabe o que é um modelo de evolução?
Um modelo de evolução é um modelo de substituição que estabelece os limites e caminhos
que os estados de caracteres podem seguir e suas taxas relativas de modificação. Os modelos
utilizados dependem somente do estado atual de cada caractere, independentemente de como
esse estado veio a acontecer. Por exemplo, ao lançar uma moeda, ela pode dar cara ou
coroa, mas a probabilidade de cair cara em um lançamento de moeda independe se o
resultado anterior foi cara ou coroa.
 COMENTÁRIO
Para o nosso estudo, vamos focar no DNA, que é a maior fonte de informações que temos para
gerar uma filogenia. Cada sequência de DNA possui sítios de nucleotídeos que podem conter
quatro estados de base: A, C, G e T.
A modificação de um sítio da sequência de DNA em um estado novo possui algumas
particularidades. Para ocorrer, primeiro uma base precisa ser removida e depois uma nova
base precisa ser inserida no mesmo local. Quatro possíveis alternativas podem ocorrer, sendo
que, se a base anexada for a mesma que a removida, não poderemos ver a modificação.
TAXA DE SUBSTITUIÇÃO (Μ )
É a velocidade que ocorre mutações dentro de uma sequência. No caso do DNA, haverá 16
taxas de substituições (temos 4 bases e 4 possibilidades de substituição, sendo assim 16 taxas
de substituições), sendo que 12 são visíveis e 4 invisíveis (quando uma base é trocada por
outra igual).
Como cada uma das 12 mudanças possíveis — tipo de mudança — deva ocorrer com a
mesma frequência e como a taxa geral de mudança visível é μ, a taxa na qual cada uma
das 12 mudanças ocorre é μ / 12.
Por exemplo, se soubéssemos de antemão que a taxa de substituição (μ) é de 24 mudanças
por minuto, então pela fórmula, teríamos:
Taxa 
Taxa de mudança = 24 / 12
Taxa de mudança: 2 mudanças por minuto
Agora, se pudéssemos observar as modificações de um sítio específico de DNA durante
100 minutos, quantas mudanças esperaríamos?
2 mudanças ----------------- 1 minuto
X ------------- 100 minutos
X = 100 x2
X = 200 mudanças
Dessa forma, esperaríamos observar 200 mudanças de cada tipo de substituição. Assim, a
matriz de substituição mostra o número esperado de cada tipo de mudança sobre
determinado tempo.
TAXA DE MUDANÇAS INSTANTÂNEAS
É a taxa pela qual determinada base (A, C, G, T) mudará para cada uma das outras. Se
tivermos uma taxa de substituição (μ) de 24 mudanças por minuto e se existem 3 alternativas
de mudanças para cada base (1 base pode ser alterada por 3 diferentes), então podemos
calcular pela fórmula:
Taxa de mudança instantânea= μ / 3
Vamos pensar agora em termos de construção de uma árvore filogenética. O que queremos
inferir é quanto tempo dois táxons estão separados entre si. Como o fator tempo traz maiores
complexidades na análise, buscamos responder a essa pergunta determinando a distância
evolutiva que, para dados de sequência de DNA, é o número médio de substituições que
ocorrem em cada posição dos nucleotídeos.
 ATENÇÃO
Como não sabemos a história de modificações ocorridas no passado em cada sítio do DNA,
uma maneira de tentarmos inferir isso é estimando a probabilidade que cada uma das quatro
bases muda em função da taxa de substituição (μ) e do tempo (t). Desejamos, por tanto, uma
matriz de probabilidade de substituição entre cada mudança de base durante um período.
Essa matriz é derivada da matriz de mudanças instantâneas.
Buscamos agora a história de cada transformação de um estado ancestral para o estado
descendente. Existem infinitas possibilidades (ou caminhos) de começar, por exemplo, em uma
citosina e terminar em uma timina. O caminho mais simples é uma transformação direta (C
para T), mas também podem ter ocorrido mudanças intermediárias (C para G, G para C e C
para T).
A matemática, a partir da álgebra matricial e do cálculo, nos ajuda a transformar uma matriz de
taxas instantâneas em uma matriz de probabilidade de substituição derivada. A base dos
logaritmos naturais (e) emerge quando integramos matematicamente histórias alternativas
possíveis. A matriz de probabilidade criada, pode ser observada a seguir:
A C G T
A 1/4 + 3/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt
C 1/4 - 1/4e-4/3μt 1/4 + 3/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt
G 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 + 3/4e-4/3μt 1/4 - 1/4e-4/3μt
T 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 - 1/4e-4/3μt 1/4 + 3/4e-4/3μt
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Nosso objetivo não é adentrar em cálculos matemáticos, mas para termos uma pequena noção
do que a matriz nos diz, podemos pensar que se μt (taxa de substituição μ, multiplicada pelo
tempo t) for pequeno, isto é, o tempo de observação foi relativamente muito curto, então, e-4/3μt
estará próximo de 1 porque qualquer número elevado à potência 0 tem o valor 1.
 ATENÇÃO
Isso significa que o estado inicial possui 100% de chance de ser o mesmo após o tempo
inferido. Isso faz sentido porque se quase nenhum tempo passou, a probabilidade do caractere
ainda estar no estado ancestral é muito grande.
Por outro lado, se μt for muito grande, e-4/3μt estará próximo de 0, o que significa que a
probabilidade de estar em qualquer um dos quatro estados é ¼, ou seja, 0,25.
Com isso, podemos perceber que, se encontrarmos o valor μ, estaremos próximos da distância
evolutiva, e isto será útil para reconstruções filogenéticas. Um dos modos de estimar μ é
observando a mudança de troca de bases não somente de uma única posição dentro de um
gene no DNA, mas também em uma sequência completa.
 EXEMPLO
Se observássemos 40 diferenças entre duas sequências de 100 bases de nucleotídeos em 10
minutos, vemos que:
Com 40 modificações (μ), em que podem ocorrer em 100 bases de nucleotídeos, temos que a
taxa de mudança é:
Taxa de mudança = 40 / 100
Taxa de mudança = 0,4 alterações em cada posição da sequência toda
Esse, no entanto, seria um cálculo subestimado, pois não estamos contando com as
modificações não observadas. Por exemplo, uma base A substituída por outra base A na
mesma posição, ou então as diferentes alterações (3,4 ou mais alterações) que podem ocorrer
na mesma posição, sem percebermos. Além disso, tínhamos 100 bases de nucleotídeos e
apenas 40 com substituições, isso quer dizer que em 60 bases não houve mudança.
Probabilidade de não mudar as bases = 60 / 100
Assim, a probabilidade de não mudar, ou de não perceber a alteração, porque a mesma base
está no lugar, é de 0,6.
Como já foi mencionado, a matriz de probabilidade de substituição nos mostra que só
precisamos encontrar o valor de μt. Para tanto, utilizaremos a probabilidade de não mudar a
base (0,6) e a probabilidade de A mudar para A, ou seja, não alterar a base:
De acordo com a matriz de dados baseado no modelo Jukes e Cantor (1969), essa
probabilidade é dada pela fórmula:
Probabilidade de mudar de A para A: 14+34e-43μt
Mas vimos que essa probabilidade é 0,6, assim, temos:
14+34e-43μt=0,6
Resolvendo essa equação, descobre-se que a distância evolutiva, μt, é 0,572, e μ = 0,057
substituições / minuto.
Esse modelo simples de evolução que estudamos foi desenvolvido por Jukes e Cantor, em
1969 — modelo JC69, e se resume no seguinte conceito:
Todas as quatro bases ocorrem na mesma frequência.
Cada tipo de substituição (T para C, C para T etc.) ocorre a uma taxa igual.
A taxa de substituição é a mesma para todas as posições de nucleotídeos dentro da sequência
estudada.
 SAIBA MAIS
O modelo JC69 foi o precursor e a partir dele surgiram outros modelos mais flexíveis e mais
próximos da realidade, como, por exemplo, o F81, o HKY e o GTR.
MÉTODOS DE DISTÂNCIA
Agora que conhecemos um pouco sobre modelos evolutivos, compreenderemos os conceitos
gerais que estão por trás dos métodos filogenéticos baseados em distância. Essa
metodologia parte do princípio de que:
Se soubermos as verdadeiras distâncias evolutivas entre cada par de táxons, isto é, o número
médio de substituições de bases em umasequência de DNA, então essa distância será capaz
de retornar uma árvore.
Precisamos inicialmente construir uma matriz de distância de pares, que é calculada pela
diferença entre cada par de táxons dividida pelo total de caracteres examinados na matriz. Por
exemplo, ao analisar a matriz táxon x caractere com quatro espécies (A-D), sendo X o grupo
irmão, e quatro caracteres (1-4), que chamaremos de Q, conforme mostrado a seguir, vemos
que A e B diferem em dois caracteres (1 e 2).
Táxon/caractere 1 2 3 4
A 0 0 0 1
B 1 2 0 1
C 1 2 1 1
D 0 1 0 1
X 0 0 0 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Vamos agora analisar a diferença entre os caracteres em relação a espécie:
ESPÉCIE A E B
As espécies A e B diferem em dois caracteres (1 e 2), marcados em azul, em um total de 4
examinados, temos que a distância entre os táxons é:
Distância = 2 / 4
Distância = 0,5
ESPÉCIE B E C
A espécie B e C diferem em apenas 1 caractere (3), marcado em roxo, nos 4 analisados, então
a distância entre os táxons é:
Distância = 1 / 4
Distância = 0,25
ESPÉCIE C E D
Se C difere de D em três caracteres (1, 3 e 4), marcados em laranja, então a distância é:
Distância = 3 / 4
Distância evolutiva = 0,75
Distância evolutiva em relação ao X (grupo irmão):
DE X PARA A
javascript:void(0)
javascript:void(0)
javascript:void(0)
javascript:void(0)
Houve a mudança no caractere 4, assim a distância é 0,25.
DE X PARA O TÁXON B
Houve mudança nos caracteres 1, 2 e 4, assim a distância é 0,75.
DE X PARA O TÁXON C
Houve mudança nos 4 caracteres (1, 2, 3 e 4), então a distância é 1.
DE X PARA O TÁXON D
Houve mudança em dois caracteres (2 e 4), então a distância é 0,5.
A partir desse raciocínio, conseguimos criar uma matriz comparando a distância evolutiva entre
os pares.
Táxon X A B C D
X 0
A 0,25 0
B 0,75 0,5 0
C 1 0,75 0,25 0
D 0,5 0,25 0,5 0,75 0
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Para fins de cladograma, a distância genética entre dois táxons será a soma do comprimento
de todos os ramos no caminho entre dois táxons. Assim, a partir de uma matriz de distância de
pares, poderíamos desenhar um filograma.
No exemplo a seguir, temos oito táxons (A—H) com a matriz de distâncias genéticas e o
cladograma resultante.
javascript:void(0)
javascript:void(0)
javascript:void(0)
 Filograma mostrando a distância genética.
Se quisermos saber a distância entre os táxons A e C, basta seguirmos o caminho das setas
vermelhas que encontraremos os valores 9 + 5 + 5 = 19. Se quisermos encontrar a distância
entre D e F, podemos seguir a trilha das setas azuis: 4 + 3 + 1 = 8.
O próximo passo é corrigir a matriz de distância de pares a partir das expectativas calculadas
sob um dos modelos evolutivos apresentados anteriormente. A distância entre pares acumula-
se mais lentamente que a verdadeira distância evolutiva porque várias mudanças são
silenciosas, isto é, ocorrem no mesmo local. Usando o modelo JC69, uma distância de pares
pode ser convertida em uma distância evolutiva usando a relação esperada entre a distância
de pares e distância evolutiva. Esses cálculos são feitos por meio de algoritmos de
computador.
Com a matriz corrigida, o objetivo agora é construir um filograma que seja o mais consistente
com esses dados. O método neighbor-joining, que traduzido do inglês seria “juntando
vizinhos”, assim como outros métodos de distância, conduz uma serie de cálculos em cima da
matriz a partir de um algoritmo. É um método muito rápido que encontrará uma árvore com
base em distâncias entre pares, porém ele não permite avaliar a diferença entre duas árvores
porque não atribui uma medida de qualidade à árvore.
MÁXIMA VEROSSIMILHANÇA
O critério de máxima verossimilhança é um passo além da parcimônia, pois envolve a busca da
árvore que possui maior probabilidade de se encaixar nos dados.
Uma forma simples de compreendermos esse processo é com o exemplo do saco de moedas.
 
Imagem: Shutterstock.com
Vamos supor que temos um saco com 100 moedas dentro dele temos:
50% dessas moedas são honestas (moedas que possuem 50% de chances de cair cara) e
50% são tendenciosas (moedas que 75% de chances de cair cara). Portanto, existem duas
hipóteses: a moeda é honesta ou tendenciosa.
 
Imagem: Shutterstock.com
Caso retiremos ao acaso uma moeda do saco, não saberemos o tipo da moeda selecionada
porque elas são idênticas.
Precisamos agora de informações extras para inferir qual tipo de moeda temos em mãos.
Vamos supor que jogamos a moeda para cima 10 vezes e nas 10 vezes caiu cara. Sem
cálculos matemáticos, podemos fazer a pergunta:
10 lançamentos da moeda com 10 resultados em cara suportam melhor qual das duas
hipóteses, uma moeda honesta ou tendenciosa? Obviamente que a tendenciosa.
 
Imagem: Shutterstock.com
Matematicamente falando, podemos saber qual a probabilidade de ocorrer o resultado de 10
caras em 10 lançamentos para cada hipótese.
No caso da moeda honesta, cada lançamento tem 50% de chance de ser cara (50% = 50/100 =
0,5). Logo, 10 lançamentos calculamos da seguinte maneira:
Probabilidade=0,510=0,001
Isso significa que existem 0,0001% de chances desse resultado ocorrer com uma moeda
honesta.
 
Imagem: Shutterstock.com
Vejamos agora a chance de ocorrer esse resultado com a moeda tendenciosa (75%), então
teríamos:
Probabilidade=0,7510=0,056
O que significa que existem 0,056% de chance desse resultado sair com a moeda tendenciosa.
 
Imagem: Shutterstock.com
A razão de verossimilhança pode ser avaliada a partir da fórmula:
Razão de verossimilhança = 0,056/0,001 = 56
Assim, concluímos que a moeda tendenciosa possui 56 vezes mais chances de ser a moeda
selecionada ao acaso no saco. Essa medida é usada como suporte probatório para uma
hipótese sobre a outra.
Essa mesma lógica também pode ser usada para a escolha de árvores filogenéticas. O objetivo
neste novo caso será escolher a topologia da árvore e os comprimentos dos ramos pela
melhor probabilidade, ou seja, buscar dentre as árvores a mais verossímil de acordo com os
dados fornecidos e com base no modelo evolutivo.
Assim, a hipótese agora será todas as possíveis topologias e comprimentos de ramos, e os
dados observados serão fornecidos pela matriz táxon × caractere. Os cálculos serão feitos a
partir de um modelo evolutivo previamente estabelecido que atuará nas diferenças de
frequências e taxas evolutivas, adequando os dados a uma natureza mais flexível e próxima do
real.
INFERÊNCIA BAYESIANA
Agora, compreenderemos uma forma ainda mais sofisticada de escolher a melhor árvore.
Como vimos anteriormente, a máxima verossimilhança (maximum likelihood – ML) busca a
árvore que tem maior probabilidade de dar origem aos dados observados, pela comparação
de hipóteses. A probabilidade encontrada em uma árvore em ML não significa a chance de ser
a árvore verdadeira entre todas as hipóteses, mas significa que os dados em determinada
topologia possuem determinada chance de acontecer.
 ATENÇÃO
Observando todos os resultados, é possível deduzir qual é a melhor hipótese. Veja que não é
possível saber exatamente a probabilidade de aquela árvore ser a verdadeira entre todas as
outras. É nesse ponto que a inferência bayesiana inova, ela julga as árvores baseada na
probabilidade posterior e nos informa qual a probabilidade de determinada topologia de
árvore ser verdadeira.
A inferência bayesiana foi desenvolvida por Thomas Bayes, no século XVIII. É um método que
calcula a probabilidade posterior a partir de um teorema.
 
Imagem: Mark Riehl/ Wikimedia Commons / CC-BY-SA-4.0
O teorema de Bayes calcula a probabilidade de uma hipótese, após ser fornecido alguns
dados, ou seja, a possibilidade de um evento ocorrer entre outros. Para isso incorpora
informações prévias sobre a probabilidade de hipóteses alternativas, conforme analisamos na
fórmula a seguir:
 Teorema de Bayes. Pr refere-se à probabilidade, D aos dados e H a hipótese.
No teorema,a linha vertical é lida como “fornecida”. Por exemplo, Pr (H | D) deve ser lido como
“a probabilidade da hipótese fornecidos os dados”.
Aplicando o teorema de Bayes às análises filogenéticas, teremos os seguintes paralelos:
Pr (H) é a probabilidade de uma topologia ser a verdadeira entre todas as outras.
Pr (D|H) é a verossimilhança de cada hipótese.
A diferença agora é que o valor será integrado com Pr (H) para todos os parâmetros. Descobrir
esse valor representa uma grande dificuldade quando existem muitas possibilidades de
árvores, mas o maior desafio na filogenia é calcular o denominador — Pr (D) (probabilidade
prévia dos dados) — do teorema de Bayes. A probabilidade anterior dos dados, Pr (D), é
calculada a partir do somatório de todas as árvores, mas é impossível de ser calculada a partir
de 10 táxons, pois existe mais de 34 milhões de possibilidades de topologias.
A parcimônia e a máxima verossimilhança conseguem atribuir uma pontuação em cima de uma
árvore isolada, mas na inferência bayesiana precisamos conhecer todas as probabilidades, ou
seja, tudo. Para solucionar esse problema, utiliza-se a metodologia da cadeia Markoviana
Monte Carlo (MCMC).
 SAIBA MAIS
O método MCMC explora o fato de que, embora não possamos calcular facilmente a
probabilidade posterior real, podemos calcular as probabilidades posteriores relativas de
diferentes árvores. Para isso, começamos em algum ponto no espaço de parâmetros e
calculamos a probabilidade, Pr (D | H). Assim, dados nosso modelo de evolução e os
parâmetros especificados por nossa localização no espaço de parâmetros, podemos calcular
com relativa facilidade a probabilidade associada a esse ponto na paisagem. O próximo passo
é propor aleatoriamente uma nova combinação de parâmetros e calcular a nova probabilidade.
A MCMC decide se aceita ou não a troca de uma topologia por outra (e todos os parâmetros
conjuntos) de forma parecida com a busca heurística. A diferença é que a MCMC pode aceitar
um ponto pior do que o anterior. Isso ocorre raramente, mas permite vagar infinitamente por
diversas condições (só depende do número de gerações predefinido) e calcular o tempo gasto
em cada local do espaço paramétrico. O tempo que os cálculos demoram em cima de um
conjunto de dados será proporcional à probabilidade posterior.
No gráfico a seguir, é possível observarmos de forma mais simplificada o percentual de tempo
em que as gerações MCMC gastam no espaço de cada uma das três topologias (A, B e C).
Uma geração MCMC sempre aceita o novo parâmetro quando possui melhor probabilidade
posterior. Isso determina quando uma cadeia irá se mover da árvore atual para uma nova
árvore. Entretanto, as vezes a cadeia MCMC pode aceitar uma condição pior do que o anterior.
 Espaço paramétrico simplificado mostrando o percentual de tempo em que as gerações
MCMC gastam no espaço de cada uma das três topologias (A, B e C).
Por fim, para os estudos de filogenia, os pesquisadores precisam avaliar os resultados: o mais
importante é saber se determinados clados possuem confiabilidade. A inferência
bayesiana avalia os ramos a partir da frequência que ele apareceu no conjunto de árvores
visitadas quando a MCMC estava na região paramétrica ótima.
 EXEMPLO
Um clado aparece em 9500 árvores entre 10 mil, então a probabilidade posterior (PP) será de
0,95, um ótimo resultado, uma vez que PPs acima de 0,9 são consideradas seguras.
 SAIBA MAIS
Outra forma de verificar o grau de confiança de um clado é pelos índices, isto é, valores
numéricos que ficam geralmente acima de cada ramo. Um dos principais é o bootstrap (BS),
que possui valores de 0 a 100%, sendo valores acima de 80% considerados ramos seguros.
Existe também a probabilidade posterior (PP), com valores de 0 a 1, sendo os valores acima de
0,95 considerados fortes.
VEM QUE EU TE EXPLICO!
Métodos de análise filogenética.
Métodos de análise filogenética.
Inferência hennigiana.
Inferência hennigiana.
Máxima parcimônia.
Máxima parcimônia.
VERIFICANDO O APRENDIZADO
1. A ANÁLISE DE PARCIMÔNIA E INFERÊNCIA HENNIGINA FORAM UM
MARCO PARA A COMPREENSÃO DA EVOLUÇÃO DOS SERES VIVOS
PORQUE TROUXE UMA METODOLOGIA LÓGICA E APLICÁVEL EM TODA
A BIOLOGIA. ESSA ABORDAGEM FOI A BASE PARA TODOS OS
POSTERIORES AVANÇOS E, POR ISSO, SEUS CONCEITOS E
TERMINOLOGIAS SÃO FUNDAMENTAIS NA ÁREA. SOBRE A MÁXIMA
PARCIMÔNIA, ASSINALE A ALTERNATIVA CORRETA: 
 
I. UM DOS PRINCÍPIOS DA PARCIMÔNIA É QUE A MELHOR ÁRVORE É
AQUELA QUE POSSUI O MAIOR NÚMERO DE PASSOS. 
 
II. UM CARACTERE É PARCIMONIOSAMENTE NÃO INFORMATIVO
QUANDO NÃO É POSSÍVEL INFERIR NADA SOBRE ELE. 
 
III. CARACTERES PARCIMONIOSAMENTE INFORMATIVOS SÃO AQUELES
COMPARTILHADOS ENTRE SUBCONJUNTOS DE TERMINAIS,
LEVANTANDO A HIPÓTESE DE QUE EXISTE UM ANCESTRAL COMUM. 
 
É CORRETO O QUE SE AFIRMA EM:
A) I
B) II
C) III
D) I e II
E) I e III
2. UMA ABORDAGEM MAIS PROMISSORA, PÓS-MÁXIMA PARCIMÔNIA,
FORAM AS ANÁLISES QUE UTILIZAVAM MODELOS EVOLUTIVOS PARA
BUSCAR A MELHOR ÁRVORE SOBRE DADOS DE PROBABILIDADE E
DISTÂNCIA GENÉTICA. BASEANDO-SE NESSES CONCEITOS,
SELECIONE A ALTERNATIVA CORRETA:
A) O estabelecimento de um modelo de evolução é fundamental para todos os métodos de
busca de árvore, exceto na análise bayesiana.
B) A taxa de substituição (μ) é a frequência em que as bases podem ser retiradas sobre um
pool de possibilidades.
C) Distância evolutiva, para dados de sequência de DNA, é o número médio de substituições
que ocorrem em cada posição dos nucleotídeos.
D) Neighbor-joining é um método que permite calcular a diferença entre as duas árvores.
E) A máxima verossimilhança busca a melhor árvore calculando a probabilidade da árvore
verdadeira sobre todas as possibilidades.
GABARITO
1. A análise de parcimônia e inferência hennigina foram um marco para a compreensão
da evolução dos seres vivos porque trouxe uma metodologia lógica e aplicável em toda
a Biologia. Essa abordagem foi a base para todos os posteriores avanços e, por isso,
seus conceitos e terminologias são fundamentais na área. Sobre a máxima parcimônia,
assinale a alternativa correta: 
 
I. Um dos princípios da parcimônia é que a melhor árvore é aquela que possui o maior
número de passos. 
 
II. Um caractere é parcimoniosamente não informativo quando não é possível inferir
nada sobre ele. 
 
III. Caracteres parcimoniosamente informativos são aqueles compartilhados entre
subconjuntos de terminais, levantando a hipótese de que existe um ancestral comum. 
 
É correto o que se afirma em:
A alternativa "C " está correta.
 
O princípio da máxima parcimônia é a escolha da melhor árvore pelo conceito dos passos
mínimos, isso quer dizer que a melhor hipótese deve ser aquela que é respondida com mais
simplicidade pelos dados. Os caracteres parcimoniosamente informativos são aqueles
compartilhados por vários terminais em uma árvore filogenética, levantando a hipótese da
existência de um ancestral comum. Um caractere é parcimoniosamente não informativo
quando é exclusivo de um terminal.
2. Uma abordagem mais promissora, pós-máxima parcimônia, foram as análises que
utilizavam modelos evolutivos para buscar a melhor árvore sobre dados de
probabilidade e distância genética. Baseando-se nesses conceitos, selecione a
alternativa correta:
A alternativa "C " está correta.
 
Modelos evolutivos são utilizados principalmente por métodos probabilísticos como máxima
verossimilhança e bayesiana. A taxa de substituição (μ) pode ser dita como a velocidade de
ocorrência de mutações dentro de uma sequência de DNA. A distância evolutiva no DNA é o
número de substituições que ocorrem em cada nucleotídeo. O método neighbor-joining não
avalia a diferença entre duas árvores porque não atribui uma medida de qualidade à árvore. A
máxima verossimilhança busca a árvore que tem maior probabilidade de dar origem aos dados
observados, comparando hipóteses.
CONCLUSÃO
CONSIDERAÇÕES FINAIS
Ao longo deste conteúdo, conhecemos todas as terminologias e conceitos que estãopor trás
das árvores filogenéticas. Aprendemos que ramos, nós, ancestrais comuns, descendentes,
táxons e terminais são nomes que fazem parte dessa metodologia. Vimos que podemos
trabalhar com uma parte dos táxons em uma análise filogenética, pois a tendência é encontrar
uma estrutura semelhante de relações caso incluíssemos um conjunto de táxons completo. Por
fim, vimos que os cientistas buscam compreender as classificações taxonômicas encontrando
grupos monofiléticos.
Além disso, estudamos que a máxima parcimônia procura obter a melhor árvore pelo critério
dos passos mínimos, enquanto os métodos de verossimilhança e bayesiano procuram a melhor
resposta por probabilidades aplicadas a modelos pré-definidos. Os métodos de distância são
ferramentas rápidas na tomada de decisão e formas métricas robustas para avaliar a
confiabilidade dos clados que estão em foco.
AVALIAÇÃO DO TEMA:
REFERÊNCIAS
BAUM, D. A.; SMITH, S. D. Tree thinking. An Introduction to Phylogenetic Biology. Roberts
and Company Publishers, 2013.
FELSENSTEIN, J. Inferring phylogenies. Sunderland, MA: Sinauer associates, 2004. p. 664.
HENNIG, W. Phylogenetic systematics. University of Illinois Press, Urbana, 1996.
JUDD, W. S. et al. Plant systematics: a phylogenetic approach. 3. ed. Sunderland, MA:
Sinauer, 1999.
JUKES, T. H.; CANTOR, C. R. Evolution of protein molecules. Mammalian protein
metabolism, 1969.
LEMEY, P.; SALEMI, M.; VANDAMME, A. M. (Eds.). The phylogenetic handbook: a practical
approach to phylogenetic analysis and hypothesis testing. Cambridge University Press, 2009.
NELSON, G.; PLATNICK, N. I. Systematics and biogeography: cladistic and vicariance.
Columbia University Press, 1981.
RADFORD, A. E.; DICKINSON, W.C.; MASSEY, J. R.; BELL, C. R. Vascular plant
systematics. Harper et Row, 1974.
SIMPSON, M. G. Plant Systematics. 2. ed. Elsevier Academic Press, 2010. p. 752.
EXPLORE+
Explore o site do Tree of Life Web Project. Procure uma linhagem de organismos de seu
interesse. Observe a grandiosidade da biodiversidade e das relações da vida no planeta
Terra.
Para estimular o desejo de aprender filogenética, procure em livros, artigos didáticos ou
científicos sobre a evolução de algum organismo de seu interesse. Por exemplo, a
evolução dos cães, das plantas com flores (angiospermas). Procure imagens, veja as
mudanças das formas, busque imaginar o tempo agindo e os motivos que levaram alguns
organismos a sobreviverem e outros a se extinguirem.
Para revisar os conteúdos abordados, leia o artigo Análise filogenética: conceitos
básicos e suas utilizações como ferramenta para virologia e epidemiologia
molecular, de Caldart e outros colaboradores (2016).
CONTEUDISTA
Leandro Cardoso Pederneiras
 CURRÍCULO LATTES
javascript:void(0);

Outros materiais