Buscar

Reconstruções Filogenéticas

Prévia do material em texto

1
Evolução molecular:
Reconstruções 
Filogenéticas
Prof. Fabrício R Santos
Sistemática e Taxonomia
• Sistemática é o estudo dos relacionamentos entre 
grupos de organismos e a classificação hierárquica 
em diferentes táxons – é um antigo ramo da 
biologia clássica. 
 A Taxonomia é parte da Sistemática 
e se refere à nomenclatura e 
identificação de espécies. Seus 
princípios foram inicialmente 
estabelecidos por Carolus Linnaeus
(1707-1778).
Taxonomia e Classificação Hierárquica
O sistema taxonômico desenvolvido inicialmente por 
Linnaeus tem duas características principais: 
i) a designação de um nome duplo (binômio) a cada 
espécie, e ii) um sistema de agrupamento destas espécies.
Um binômio (nome latino de 2 partes) é designado unicamente 
para cada espécie, no qual o primeiro é o nome genérico, e os 
dois nomes são ditos específicos.
Trichechus inunguis
Homo sapiens
Arabidopsis thaliana
Escherichia coli
Chromobacterium violaceum
O sistema de classificação das espécies segue uma hierarquia 
de categorias crescentes que formalizam o agrupamento de 
organismos, o qual deve ser feito a partir do reconhecimento 
da história de ancestralidade comum das espécies. 
A nomenclatura binomial da espécie é a primeira 
etapa no agrupamento: espécies derivadas do 
mesmo ancestral comum imediato são geralmente 
agrupadas no mesmo gênero. 
As demais categorias são mais amplas, isto é, 
agrupam táxons de acordo com ancestrais comuns 
mais e mais antigos:
• Gêneros são agrupados em uma Família, pois 
compartilham um ancestral comum recente.
• Famílias são agrupadas em Ordens, que se 
agrupam em Classes, que são agrupadas em Filos, 
que se agrupam em Reinos e um dos 3 Domínios. 
A Sistemática Filogenética conecta a 
diversidade biológica à história evolutiva
Filogenia = A história evolutiva de uma espécie ou grupo de espécies 
relacionadas.
Filogenia é geralmente representada como árvores filogenéticas 
que traçam relacionamentos evolutivos inferidos, revelando a 
história de ancestralidade comum entre espécies. 
Sistemática = O estudo e classificação da diversidade biológica em um 
contexto evolutivo.
A diversidade biológica reflete episódios passados de especiação 
e macroevolução.
Taxonomia = Identificação , nomeação e classificação de espécies; é um 
componente da sistemática. 
2
Organismos podem ser 
representados em um 
diagrama (árvore) que 
ilustra seus 
relacionamentos 
evolutivos. 
Usando dados 
morfológicos e 
moleculares, podemos 
estimar os ancestrais 
comuns inferidos pelos 
pontos de divergência 
nas árvores 
filogenéticas.
Que são árvores?
Charles Darwin (1837) 
Anotações sobre padrões de especiação nos Tentilhões de Galápagos
OTU 1
OTU 2
OTU 3
OTU 4
OTU 5
OTU 6
Árvore Filogenética
15 4 3 2678
No de diferenças
n1
n2
n3
n4
n5
n
OTU unidade taxonômica operacional - populações, espécies ou grupos
nó interno - ~ ancestral comum do passado
tempo
antiga recente
raiz
Topologias equivalentes
Por quê árvores?
Por quê representamos evolução como árvore e 
não outro tipo de gráfico?
CA DBA B C D
Ciclo, reticulação
A
BC
D
• Evolução é divergência – espécies se modificam 
com o tempo - Transformacionismo
Darwin: “Descendência com modificação”
• Por várias razões, reticulação torna-se um 
fenômeno raro com o tempo – provavelmente no 
Pré-Cambriano as reticulações devido a 
transferências gênicas horizontais, fusões de 
células, etc, eram muito comuns.
• Reticulações são difíceis de se representar.
3
Sang et al., 1997
Árvores reticuladas
Ex: espécies híbridas
de Paeonia sp.
Grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Cladograma Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Grus sp
leucogeranus antigone
rubicanda
vipio
japonensis
americana
grus
nigricollis
monachus
canadensis
Bugeranus
virgo
paradisea
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Árvore sem raiz
Árvore filogenética 
para os tentilhões
de Galápagos.
Estas 13 espécies
habitam as Ilhas 
Galápagos. Esta 
árvore é baseada
em estudos 
comparativos de
estruturas do corpo, 
especialmente forma 
e tamanho dos bicos, 
e nos estudos de 
campo sobre 
isolamento 
reprodutivo e 
comportamento 
alimentar. 
Conexão entre classificação e filogenia
A natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de 
táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons 
subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo.
4
Árvores filogenéticas baseadas em sistemática
Dois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram 
usados para construir esta árvore de espécies de ursos e procionídeos.
Antiga controvérsia sobre afinidades entre 
focas, leões marinhos e morsas
A relação filogenética entre 
Phoecidae, Odobaenidae e 
Otaridae já foi extremamente 
discutida. Hoje é considerada 
um grupo monofilético, a 
família Pinnipedia, mas focas 
já foram consideradas grupo 
irmão de Lontras 
(Mustelidae) 
Qual relação entre procariotos e eucariotos?
Qual a origem das mitocôndrias e dos cloroplastos?
Árvores filogenéticas podem nos 
dar informações sobre o
passado remoto
Classificação: Reinos e Domínios
Atualmente a sistemática filogenética reconhece 3 domínios
Origem dos 3 domínios da vida no Pré-Cambriano
5
R
iq
u
ét
si
as
M
it
o
cô
n
d
ri
as
outras bactérias
Archaea
Eucariotos
Nature, 1998
Grupos irmãos de 
ciclídeos do
Lago Tanganika na 
África oriental
Árvores nos informam sobre processos recentes de 
diversificação de populações e espécies
Árvore MP C0I (E. Michel, 1999)
Árvores filogenéticas e epidemiologia
Dentista com HIV deu 
origem a um surto
regional nos EUA
Freeman e Herron, 1998
p
a
c
ie
n
te
 B
-x
p
a
c
ie
n
te
 B
-y
p
a
c
ie
n
te
 A
-x
p
a
c
ie
n
te
 E
-y
p
a
c
ie
n
te
 E
-x
p
a
c
ie
n
te
 C
-x
p
a
c
ie
n
te
 C
-y
D
e
n
ti
s
ta
-y
p
a
c
ie
n
te
 A
-y
p
a
c
ie
n
te
 G
-x
p
a
c
ie
n
te
 G
-y
D
e
n
ti
s
ta
X
L
C
0
2
-x
L
C
0
3
-x
L
C
0
2
-y
L
C
0
9
L
C
3
5
p
a
c
ie
n
te
 D
-x
p
a
c
ie
n
te
 D
-y
L
C
0
3
-y
p
a
c
ie
n
te
 F
-x
p
a
c
ie
n
te
 F
-y
H
IV
L
I
Filogenias de agentes infecciosos permitem traçar surtos e pandemias, 
assim como auxiliam nas estratégias de controle de epidemias como da 
gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum.
Reconstruções filogenéticas e 
Conservação da Biodiversidade
• Filogenética pode ser extremamente útil para estudos de 
biodiversidade (inventariamento e classificação) e 
estabelecimento de prioridades conservacionistas. 
• Medidas de diversidade que utilizam filogenias de 
sequências de DNA estão agora sendo usadas para 
implementar planos de conservação de espécies, priorizar 
unidades de conservação, definir unidades de manejo etc.
• Ex: filogenias (e filogeografia) são usadas para identificar 
ESUs (unidades evolutivamente significantes), as quais 
representam populações importantes para manter a 
dinâmica evolutiva de uma espécie.
10-20 milhões de anos 
marinho
africano
amazônico
Filogenias dos peixes-bois (Trichechus sp)
Vianna et al 2006 Mol Ecol 
marinho
africano
amazônico
Populações do clado III do 
peixe-boi marinho 
(Trichechus manatus) 
possuem uma distribuição 
restrita às Guianas e ao 
Brasil, portanto são 
unidades evolutivas 
independentes (ESU) das 
demais nesta espécie.
Árvore sem raiz (rede MJ) da região 
controle do DNAmt
Vianna et al 2006 Mol Ecol
6
B0665
B0663
B0655
B0653
B0654
B0656
B0369
B0367
B0368
B0609
B0647
B0317
B0329
B0326
B0658
B0644
B0657
B0677
B0678B0646
B0291
B0292
B0290
B0680
B0643
B0660
B0281
B0285
B1189
B1301
B1188
B1296
B1186
B1303
B0525
B0524
B0515
B0511
B0513
B0528
B0535
B0562
B1148
B1147
B1150
99
99
99
99
90
99
99
99
99
99
99
99
99
99
99
91
99
99
99
82
90
D. ochropyga
D. ferruginea
R. ardesiaca
D. squamata
B0335
P. leucoptera
M. loricata
T. major
D. plumbeus
F. serrana
D. mentalis
H. atricapillus
S. cristatus
T. doliatus
T. caerulescens
T. ambiguus
T. pelzelni
Árvore NJ COI em 
Thamnophilidae
Vilaça et al. 2006
Termos filogenéticos
• Homologia
• Analogia
• Convergência, Reversão
• Plesiomorfia – estado ancestral – “0” 
(Simplesiomorfia)
• Apomorfia – estado derivado – “1” 
(Autapomorfia - Sinapomorfia)
Homologia: 
um caráter (ancestral ou derivado) compartilhado 
entre duas ou mais espécies, o qual estava presente 
no ancestral comum destas.
Analogia: 
caráter “compartilhado”, geralmente não-presente
no ancestral comum (i.e., o caráter evolui duas 
vezes, independentemente): evolução convergente 
(ou paralela) e reversão ao estado ancestral. A este
caráter recorrente damos o nome de Homoplasia.
Analogia
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia; 
Origem independente – evolução paralela ou convergente .
Homologia Ancestral (0)
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);
é ancestral porque está presente na base da árvore, no 
ancestral comum de todas 4 spp atuais.
Homologia Derivada (1)
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 2 aparece um caráter homólogo derivado
(sinapomorfia). Aconteceu uma transição do estado “basal” ou 
primitivo no ancestral imediato destas duas spp ou OTUs.
7
Convergência: origem independente do 
caráter (i.e., duas linhagens fixam 
paralelamente um “fenótipo” similar).
Reversão: origem e subseqüente perda, ou 
mutação “de volta” ao caráter ancestral (i.e., 
reversão ao estado plesiomórfico).
Origem das Homoplasias Evolução Convergente = Aquisição de características 
similares em espécies de diferentes linhas evolutivas,
devido ao compartilhamento de nichos ecológicos
similares, sendo a seleção natural responsável por 
moldar adaptações análogas.
Exemplos: 
asas de pássaros e morcegos
bicos de aves e monotremados
Evolução convergente também se dá no nível 
molecular: sequências de DNA e proteínas podem 
sofrer mudanças paralelas, reversões, etc
Evolução
Convergente e
Seleção Natural
Similaridades aparentes 
entre marsupiais 
australianos e mamíferos 
placentários em outros 
continentes.
Estas espécies ocupam 
nichos parecidos nos 
diferentes continentes.
Um grupo monofilético:
é um grupo de táxons que inclui o 
ancestral comum e todos seus
descendentes
Exemplo de grupo
não-monofilético: Répteis
Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos
O ancestral comum mais recente
dos répteis também deu origem 
aos mamíferos e aves
Filogenia dos grandes símios sem cauda
Famílias monofiléticas
HominidaePongidaeHyllobatidae
8
Filogenia dos grandes símios sem cauda
Famílias parafiléticas
HominidaePongidaeHyllobatidae
Esta classificação equivocada 
não representa a história 
evolutiva das espécies
Abordagens filogenéticas
Fenética 
(Taxonomia numérica)
Cladística 
(Sistemática Filogenética)
Fenética
• Abordagem Clássica (desde Linnaeus).
• Agrupa espécies baseada na similaridade
fenotípica (ou genotípica).
• Usa todas características distinguíveis.
• Ex: métodos baseados em distâncias 
(UPGMA)
Análise de vários 
caracteres
(fenótipos, sítios polimórficos 
de DNA, freq. alélicas, etc.) 
Matriz de 
dissimilaridade 
em base ao número 
de diferenças
Construção 
de árvore
filogenética
FenogramaA B C
A
B
C
3
7 6
0
0
0
A B CA B
A
B
C
Relações de 
similaridade
MÉTODOS FENÉTICOS
Cladística
• A Teoria Evolutiva postula que grupos de 
organismos relacionados descendem de um 
ancestral comum.
• Sistemática Filogenética (Cladística) é um método 
de classificação taxonômica baseado na história 
evolutiva. 
 Foi desenvolvido em 1950 por 
Willi Hennig, um entomologista 
alemão.
Cladística 
• Baseia-se no padrão de ancestralidade comum e 
modificação das espécies e não em mera 
similaridade.
• Deve usar apenas caracteres derivados 
(apomórficos) compartilhados (sinapomórficos ou 
homólogos derivados).
• Portanto, objetiva traçar a história evolutiva real, o 
padrão de descendência com modificação.
• Ex: métodos baseados em caracteres (parcimônia).
9
Análise de vários caracteres 
com estados ancestrais (0) e 
derivados (1)
Construção 
de árvore filogenética
Cladograma
A B C
A
B
C
Relações de 
ancestralidade comum
MÉTODOS CLADÍSTICOS
D E
1
2
3
4
5
6
7
8
E
D
1
2 3
4
5 6
7 8
Caracteres utilizados
SimNãoNãoCladística
SimSimSimFenética
Homologias
Derivadas
Homologias
Ancestrais
Analogias
Besouro BorboletaCavalo
“Eventos Reais”
Besouro BorboletaCavalo
Fenética Cladística
Besouro BorboletaCavalo
Jacaré AveLagarto
“Eventos reais”
JacaréAve Lagarto
Fenética Cladística
Jacaré AveLagarto
10
Análise Filogenética
• Dado um conjunto de dados 
(caracteres morfológicos, 
alinhamento de múltiplas
sequências de DNA e proteína, etc), 
pode-se determinar (ou inferir) o 
relacionamento ancestral dentre as
espécies.
Esp.1 Esp.2 Esp.3 Esp.4
Tem
p
o
Não-resolvida
ou filogenia tipo “estrela” 
Filogenia 
parcialmente resolvida
Completamente resolvida,
filogenia bifurcada
A A A
B
B B
C
C
C
E
E
E
D
D D
Politomia ou multifurcação uma bifurcação
O objetivo da inferência filogenética é resolver a ordem de
ramificação das linhagens nas árvores evolutivas: 
Há 3 possíveis árvores sem raiz para 
4 táxons (A, B, C, D)
A C
B D
árvore 1
A B
C D
árvore 2
A B
D C
árvore 3
Métodos de reconstrução (ou inferência) filogenética objetivam 
descobrir qual das árvores é a “mais provável".
Espera-se que esta seja a “verdadeira” árvore biológica — aquela que 
seguramente represente a história evolutiva dos táxons analisados –
mas esta é formalmente chamada de árvore inferida a partir dos 
dados, cuja confiança pode ser testada por diferentes métodos.
O número de árvores sem raiz aumenta 
exponencialmente com o número de táxons
# táxons
3
4
5
6
7
8
9
10
.
.
.
.
30
# árvores sem raiz
1
3
15
105
945
10,935
135,135
2,027,025
.
.
.
.
-3,58 x 10
36
CA
B D
A B
C
A D
B E
C
A D
B E
C
F
Inferir relacionamentos evolutivos entre os
táxons requer enraizar a árvore: 
Note que nesta árvore 
enraizada, o táxon A não 
está mais estreitamente 
relacionado ao táxon B
em relação a C ou D
como sugerido acima.
A
B
C
Raiz D
A B C D
Raiz
árvore enraizada
árvore sem raiz
O enraizamento em outra posição: 
A
B
C
raiz
D
árvore sem raiz
Note que nesta árvore
enraizada, táxon A é mais
estreitamente relacionado ao
táxon B, enquanto o C é mais 
relacionado ao D.
C D
raiz
árvore enraizada
A
B
11
Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares 
distintos para produzir cinco árvores enraizadas diferentes
árvore sem raiz:
A C
B D
árvore c/raiz 
4 C
D
A
B
4
árvore c/raiz 
3 A
B
C
D
3
árvore c/raiz 
5 D
C
A
B
5
árvore c/raiz 
2 A
B
C
D
2
árvore c/raiz 
1 B
A
C
D
1
Estas árvores representam cinco histórias evolutivas diferentes
entre os táxons, dependendo de onde se coloca a raiz !
# táxons
3
4
5
6
7
8
9
.
.
.
.
30
# árvores 
sem raiz
1
3
15
105
945
10.395
135.135
.
.
.
.
~3,58x10
36
# raízes
3
5
7
9
11
13
15
.
.
.
.
57
# árvores 
com raiz
3
15
105
945
10.395
135.135
2.027.025
.
.
.
.
~2,04x10
38
x =
CA
B D
A D
B E
C
A D
B E
C
F
Cada árvore sem raiz pode teoricamente ser enraizada 
em qualquer lugar ao longo de qualquer de seus ramos
H C G G C H C G H
Árvores alternativas sobre relações 
evolutivas entre os três “grandes símios”
A árvore do meio é considerada a árvorecientífica “verdadeira” 
para a história evolutiva destas três espécies
Há dois modos principais de enraizar árvores:
Pelo grupo externo (outgroup ):
Usa táxons de referência (o “outgroup”) 
que sabidamente se situam fora do grupo 
de interesse (o “ingroup”). Requer 
conhecimento a priori sobre 
relacionamentos entre os táxons. O 
outgroup pode ser uma espécie (ex: aves 
para enraizar uma árvore de mamíferos) ou 
cópias de genes duplicados (ex: -globina 
para enraizar -globinas).
outgroup
A
B
C
D
10
2
3
5
2
Pelo ponto-médio ou distância:
enraiza a árvore no ponto médio entre os 
dois táxons mais distantes na árvore, tal 
como determinado pelo tamanho dos 
ramos. Pressupõe que os táxons evoluem 
coordenadamente (evolução constante 
entre linhagens). Esta suposição está 
embutida em alguns métodos fenéticos de 
construção de árvores tal como o UPGMA.
d (A,D) = 10 + 3 + 5 = 18
Ponto-médio = 18 / 2 = 9
Todos estes rearranjos mostram o mesmo 
relacionamento evolutivo entre táxons
B
A
C
D
A
B
D
C
B
C
A
D
B
D
A
C
B
A
C
D
árvore 
enraizada 1
B
A
C
D
A
B
C
D
Todas estas árvores são idênticas
Reconstruções 
filogenéticas com dados 
moleculares 
12
Variabilidade genética
Fenotípica
Morfológica
Funcional
Protéica
DNA
Macromutações
SNP’s – mutações de ponto
Inserções de retroposons
Microssatélites
POP1
A - 0,4
B - 0,2
C - 0,9
D - 0,1
E - 0,2
POP2
A - 0,6
B - 0,5
C - 0,8
D - 0,3
E - 0,1
POP3
A - 0,3
B - 0,2
C - 0,9
D - 0,2
E - 0,4
Freqüências alélicas
Freqüência de um dos alelos em cinco locos 
bialélicos (A-E) em 3 populações (pop1, 2, 3)
Frequências alélicas servem apenas para comparações fenéticas
intra-específicas.
Microssatélites
AT
AT
AT
AT
AT
CCG
CCG
CCG
CCG
CA CA CA CA
CA CA
CA
CA CA CA CA CA
CA CA CA CA CA CA
CAAlelo 3
Alelo 5
Alelo 7
são multi-alélicos
µ = 10-4 a 10-3 / loco / geração
Microssatélites servem geralmente apenas para comparações fenéticas intra-
específicas.
SNPs ou mutações de ponto
Single Nucleotide Polymorphisms
são geralmente bialélicos
alelo 0 ...AAGCGTTATAGC...
alelo 1 ...AAGTGTTATAGC...
µ = 10-7 a 10-8 / locus / geração
SNPs podem ser utilizados para comparações 
cladísticas interespecíficas.
* * * ** * * * * * * 
A aat tcg ctt cta gga atc tgc cta atc ctg
B ... ..a ..g ... .a. ... ... t.. ... ..a
C ... ..a ..c ..g ... ..t ... ... ... t.a
D ... ..a ..a ..g ..g ..t ... t.g ..t t.. 
Cada diferença de nucleotídio é um SNP e considerado 
como um caráter na reconstrução filogenética
Obs:
Pontos (.) se referem a posições de caracteres inalterados em relação 
à primeira sequência (A)
* Posições com caracteres variáveis entre estas sequências
SNPs em sequências de DNA
Analogia
T C T C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
TNas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia); 
Origem independente – evolução paralela ou convergente
13
Homologia Ancestral (0)
T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
CNas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);
é ancestral porque está presente na raiz da árvore (ancestral 
comum) como uma plesiomorfia.
C
Homologia Derivada (1)
T T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
TNas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) 
(i.e., aconteceu uma transição do estado “basal” ou primitivo, 
no ancestral comum imediato destas duas spp ou OTUs).
Tipos de abordagens
filogenéticas utilizando
moléculas
Fenética
Similaridade geral
Cladística
Sistemática filogenética
Similaridade vs. relacionamento evolutivo
Similaridade e relacionamento evolutivo não são a mesma coisa, 
mesmo que relacionamento evolutivo seja inferido de certos 
tipos de similaridade.
Similar: ser semelhante (uma observação) 
Relacionado: geneticamente conectado (um fato histórico) 
Dois táxons podem ser mais similares sem ser mais relacionados:
Táxon A
Táxon B
Táxon C
Táxon D
1
1
1
6
3
5
O táxon C é mais similar ao A (d = 3) 
do que ao B (d = 7), mas C e B são 
mais estreitamente relacionados: C e 
B compartilham um ancestral comum 
mais recente do que os dois com A. 
Métodos baseados em caracteres podem teoricamente discriminar 
os tipos de similaridade e encontrar a “verdadeira” árvore 
evolutiva .
Tipos de Similaridade
Similaridade observada entre duas OTUs pode ser por:
relacionamento evolutivo :
caracteres ancestrais compartilhados (‘simplesiomorfias’)
caracteres derivados compartilhados (‘’sinapomorfias’)
Homoplasia (evolução independente do mesmo caráter):
Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em 
OTUs relacionadas), Reversões (em OTUs relacionadas ou não) 
C
C
G
G
C
C
G
G
C
C
G
G
C
G
G
T
Convergentes Paralelos Reversões
Seleciona a árvore que melhor 
representa as distâncias 
observadas entre os pares.
Seleciona a árvore que tem a 
maior probabilidade de reproduzir 
os dados observados.
Seleciona a árvore que explica os 
dados com o menor número de 
substituições (eventos mutacionais fixados).
Distância
Verossimilhança
Parcimônia
Métodos gerais de reconstrução filogenética
C
A
R
Á
T
E
R
14
Tipos de dados usados em inferência filogenética
Métodos baseados em caracteres : Usam diretamente os caracteres 
alinhados, tais como sequências de DNA ou proteína
táxons caracteres
espécie A ATGGCTATTCTTATAGTACG
espécie B ATCGCTAGTCTTATATTACA
espécie C TTCACTAGACCTGTGGTCCA
espécie D TTGACCAGACCTGTGGTCCG
espécie E TTGACCAGTTCTCTAGTTCG
Métodos baseados em distâncias: Transformam os dados em distâncias 
(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore.
A B C D E 
espécie A ---- 0,20 0,50 0,45 0,40
espécie B 0,23 ---- 0,40 0,55 0,50
espécie C 0,87 0,59 ---- 0,15 0,40
espécie D 0,73 1,12 0,17 ---- 0,25
espécie E 0,59 0,89 0,61 0,31 ----
Exemplo 1: 
Distância “p” 
(= percentagem 
observada de 
sequências 
diferentes)
Exemplo 2: distância Kimura 2-parâmetros
(estimativa do número real de substituições entre táxons)
M
A
T
R
I
Z
Estima-se primeiro qual árvore sem raiz seria 
a mais “correta”
A
B
C
D
Alguns métodos produzem a árvore já com a raiz (UPGMA), 
outros podem fornecer árvores com raiz se os dados 
possuem informação suficiente (Parcimônia, 
Verossimilhança) e todos podem se utilizar ou necessitam 
obrigatoriamente de um grupo externo para produzir uma 
árvore com raiz (Neighbor Joining - NJ)
Algoritmos baseados em distâncias
(agrupamento)
Usam distâncias para calcular árvores filogenéticas. Estas são 
baseadas somente no número relativo de similaridades e 
diferenças entre um grupo de seqüências. 
– Começa com uma matriz de distâncias par-a-par 
– Estes métodos constróem uma árvore ligando os pares de 
táxons menos distantes, sucessivamente ligando táxons 
mais distantes.
– Ex: UPGMA (típico método fenético) e 
Neighbor joining (NJ) que considera diferentes taxas 
evolutivas entre linhagens.
Distâncias entre DNA
• distâncias entre pares de seqüências de DNA são relativamente 
simples de computar como a soma de diferenças de bases entre as 
duas seqüências. 
– Este tipo de algoritmo somente funciona para pares de 
sequências similares o bastante para serem alinhadas
• Geralmente todas alterações de bases são consideradas iguais
• Inserções/deleções geralmente possuem um peso maior do que 
substituições nucleotídicas (gap penalties).
• É também possível corrigir múltiplas substituições em um único sítio, 
que é comum em relacionamentos filogenéticos distantes e para 
sítios de rápida evolução.
UPGMA
• O mais simples dos métodos de distância é o UPGMA (Unweighted 
Pair Group Method using Arithmetic averages) e apenas reconstrói 
fenogramas que representam meras relações de similaridade geral.
• Assume taxas evolutivas idênticas para todas as OTUs. 
• Agrupa as distâncias menores e recalcula novas distâncias através 
de médias aritméticas para novo agrupamento.• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam 
distâncias genéticas entre grupos de seqüências criando uma 
matriz de dissimilaridades (distâncias). 
• Então o programa NEIGHBOR (que também constrói árvores NJ) do 
PHYLIP constrói a árvore UPGMA a partir da matriz.
• Esta árvore é visualizada em um programa apropriado (Ex: 
TREEVIEW ou PTP).
Métodos de Distância
a ACGA
b ATGC
c GTGC
d GCAA
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d
ij
15
a b cda b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d
ij
Métodos de Distância
Matriz Árvore UPGMA
(mera similaridade)
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
d
ij
Métodos de Distância
Matriz Árvore Neighbor-Joining
(similaridade e 
taxas evolutivas diferenciais)
b
d
a
c
Máxima parcimônia
• Parcimônia é o método mais popular de 
reconstrução cladística dos relacionamentos por 
ancestralidade comum.
• Parcimônia permite o uso de toda informação 
evolutiva conhecida para a construção da árvore.
– em contraste, métodos de distância resumem todas 
diferenças entre pares de seqüências em um único 
número, a percentagem de diferença ou distância 
genética.
Exemplo de Parcimônia
• Considere 4 táxons com as seqüências: a (ACGA), 
b (ATGC), c (GTGC), d (GCAA).
• A parcimônia deve decidir qual das 3 possíveis árvores 
sem raiz (4 táxons), é a mais “correta” (parcimoniosa). 
• Posteriormente, se houver informações suficientes, deve-
se colocar a raiz, a qual polariza o padrão de ramificações 
sequenciais na árvore filogenética.
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
1 2 3 4 
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot 
árvore 1 1
árvore 2
árvore 3
A
A
G
G
*
* = 1 etapa de mutação
1 2 3 4 
16
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot 
árvore 1 1 2
árvore 2
árvore 3
1 2 3 4 C
T C
T*
* = 2 etapas de mutação
*
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot 
árvore 1 1 2 1
árvore 2
árvore 3
A
GG 1 2 3 4 
* = 1 etapa de mutação
*
G
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot 
árvore 1 1 2 1 2 6
árvore 2
árvore 3
A
A
1 2 3 4 
C
C*
* = 2 etapas de mutação
*
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
Tot 
árvore 1 1 2 1 2 6
árvore 2 2 2 1 2 7
árvore 3 2 1 1 1 5 
1 2 3 4 
Exemplo de Parcimônia
a
d
b
cárvore 3
Árvore sem raiz 
escolhida pela análise 
de parcimônia
Neste caso temos informações adicionais de que táxon com 
a sequência d possa funcionar como um grupo externo 
(outgroup), portanto a raiz estará entre d e os outros ( ).
a b cd
Árvore com raiz 
escolhida usando d como 
outgroup
Exemplo de Parcimônia
a b cd
a A C G A
b A T G C
c G T G C
d G C A A
1
1 (A)1 (A)
A evolução dos caracteres apomórficos pode ser inferida a partir do 
Cladograma. Assim, eventos paralelos (recorrentes) de mutação 
podem ser identificados, os quais geram homoplasias 
3 (G) 
3 
2 (T)
2
4 (C) 
4 
17
A análise de parcimônia 
pode discriminar alguns tipos 
de eventos paralelos.
Na figura ao lado, 4 seqüências 
alinhadas homólogas (a) de 
distintos organismos foram 
utilizadas para construir uma 
árvore de parcimônia (b).
Na árvore estão dispostas os 
eventos de mutações 
(apomorfias), numerados de 1 
a 8. No evento 2, o estado 
alélico derivado (nucleotídio A) 
demonstrou ser um evento 
paralelo, aparecendo 
independentemente na 
seqüência do homem e do 
milho
Verossimilhança (L) é a probabilidade dos dados, dado o 
modelo de substituições nucleotídicos e uma hipótese de 
topologia filogenética
Modelo evolutivo de substituições 
Diferentes padrões de substituição nucleotídica específicos 
de cada conjunto homólogo de sequências de DNA.
A
C T
G
Transição
Transversão
L = P (dados/árvore)
Máxima verossimilhança
Jukes-Cantor
(1 parâmetro)
A frequência dos nucleotídios não é considerada
Todas substituições têm a mesma taxa
Kimura 2P
(2 parâmetros)
A frequência dos nucleotídios não é considerada
Transições e transversões têm diferentes taxas
GTR (General Time Reversible)
(6 parâmetros)
a
b
cd e
f
A frequência dos nucleotídios é considerada
Transições e transversões têm diferentes taxas, 
assim como os tipos de mudanças nucleotídicas
O modelo inapropriado de
substituições nucleotídicas
pode levar a uma reconstrução 
filogenética incorreta.
18
Modeltest
Posada e Krandal
O software permite selecionar o modelo de substituição mais plausível para 
determinado conjunto de sequências, assim como outros parâmetros 
necessários para a reconstrução filogenética.
Dados reais: 
mudanças observadas e esperadas
• Comparação de sequências de chimpanzé e homem no 
DNAmt (307/1333 sítios são diferentes)
• Modelos com mais parâmetros se aproximam mais do 
padrão observado
LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i)
d
c
b
a
C
C
T
T
7654321
TGGAGA
TATAGA
TCCCGA
TCAGAA
Táxon
Táxon
Táxon
Táxon
aa
cc
bb
dd
aa
bb
cc
dd
aa
dd
cc
bb
Método baseado na avaliação probabilística de modelos evolutivos 
que melhor explicam um conjunto de dados de forma que este reflita 
a história evolutiva mais próxima da realidade
C A
L(5) = Prob +C G
A A
Prob +
C
C
A
G
A C
C
C
A
G
C T
Prob +
Prob ... +
Prob +
C
C
A
G
N N
Máxima verossimilhança Problemas na reconstrução
filogenética
As taxas evolutivas são diferentes para cada gene ou 
segmento anônimo de DNA. 
Árvores filogenéticas contam a história do caráter, mas 
não necessariamente da espécie.
Taxas de mutação/evolução Árvores de genes e de espécies
• A história evolutiva de genes reflete aquela 
das espécies que os carregam, exceto 
quando:
– Transferência horizontal = transferência gênica entre 
espécies (ex. entre bactérias, mitocôndrias em híbridos)
– Duplicação gênica : ortologia/ paralogia
Incongruência 
entre árvores de 
genes e espécies
19
Associações históricas
Page e Charleston, 1998
Eventos entre gene (associado) e a 
espécie (host)
Page e Charleston, 1998
Reconstrução da filogenia de espécies: 
artefatos devido à paralogia
Perda de genes pode acontecer durante a Evolução: mesmo sequências com Perda de genes pode acontecer durante a Evolução: mesmo sequências com 
genomas completos pode ser difícil detectar paralogiagenomas completos pode ser difícil detectar paralogia
Rat Mouse Rat Mouse
GNS1 GNS1
GNS1 GNS2
GNS2 GNS2GNS1 GNS2
Hamster Hamster
especiação
duplicação
Mouse Rat
GNS GNSGNS
Hamster
Árvore verdadeira
Árvore obtida com amostragem parcial
de genes homólogos, mas parálogos

Continue navegando