Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício R Santos Sistemática e Taxonomia • Sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons – é um antigo ramo da biologia clássica. A Taxonomia é parte da Sistemática e se refere à nomenclatura e identificação de espécies. Seus princípios foram inicialmente estabelecidos por Carolus Linnaeus (1707-1778). Taxonomia e Classificação Hierárquica O sistema taxonômico desenvolvido inicialmente por Linnaeus tem duas características principais: i) a designação de um nome duplo (binômio) a cada espécie, e ii) um sistema de agrupamento destas espécies. Um binômio (nome latino de 2 partes) é designado unicamente para cada espécie, no qual o primeiro é o nome genérico, e os dois nomes são ditos específicos. Trichechus inunguis Homo sapiens Arabidopsis thaliana Escherichia coli Chromobacterium violaceum O sistema de classificação das espécies segue uma hierarquia de categorias crescentes que formalizam o agrupamento de organismos, o qual deve ser feito a partir do reconhecimento da história de ancestralidade comum das espécies. A nomenclatura binomial da espécie é a primeira etapa no agrupamento: espécies derivadas do mesmo ancestral comum imediato são geralmente agrupadas no mesmo gênero. As demais categorias são mais amplas, isto é, agrupam táxons de acordo com ancestrais comuns mais e mais antigos: • Gêneros são agrupados em uma Família, pois compartilham um ancestral comum recente. • Famílias são agrupadas em Ordens, que se agrupam em Classes, que são agrupadas em Filos, que se agrupam em Reinos e um dos 3 Domínios. A Sistemática Filogenética conecta a diversidade biológica à história evolutiva Filogenia = A história evolutiva de uma espécie ou grupo de espécies relacionadas. Filogenia é geralmente representada como árvores filogenéticas que traçam relacionamentos evolutivos inferidos, revelando a história de ancestralidade comum entre espécies. Sistemática = O estudo e classificação da diversidade biológica em um contexto evolutivo. A diversidade biológica reflete episódios passados de especiação e macroevolução. Taxonomia = Identificação , nomeação e classificação de espécies; é um componente da sistemática. 2 Organismos podem ser representados em um diagrama (árvore) que ilustra seus relacionamentos evolutivos. Usando dados morfológicos e moleculares, podemos estimar os ancestrais comuns inferidos pelos pontos de divergência nas árvores filogenéticas. Que são árvores? Charles Darwin (1837) Anotações sobre padrões de especiação nos Tentilhões de Galápagos OTU 1 OTU 2 OTU 3 OTU 4 OTU 5 OTU 6 Árvore Filogenética 15 4 3 2678 No de diferenças n1 n2 n3 n4 n5 n OTU unidade taxonômica operacional - populações, espécies ou grupos nó interno - ~ ancestral comum do passado tempo antiga recente raiz Topologias equivalentes Por quê árvores? Por quê representamos evolução como árvore e não outro tipo de gráfico? CA DBA B C D Ciclo, reticulação A BC D • Evolução é divergência – espécies se modificam com o tempo - Transformacionismo Darwin: “Descendência com modificação” • Por várias razões, reticulação torna-se um fenômeno raro com o tempo – provavelmente no Pré-Cambriano as reticulações devido a transferências gênicas horizontais, fusões de células, etc, eram muito comuns. • Reticulações são difíceis de se representar. 3 Sang et al., 1997 Árvores reticuladas Ex: espécies híbridas de Paeonia sp. Grou japonensis americana grus nigrocollis monachus canadensis bugeranus virgo paradisea leucogeranus antigone rubicanda vipio Filogenia do grou japonensis americana grus nigrocollis monachus canadensis bugeranus virgo paradisea leucogeranus antigone rubicanda vipio Cladograma Árvore UPGMA Citocromo b (Mooers et al., 1999) Grus sp leucogeranus antigone rubicanda vipio japonensis americana grus nigricollis monachus canadensis Bugeranus virgo paradisea japonensis americana grus nigrocollis monachus canadensis bugeranus virgo paradisea leucogeranus antigone rubicanda vipio Filogenia do grou Árvore UPGMA Citocromo b (Mooers et al., 1999) Árvore sem raiz Árvore filogenética para os tentilhões de Galápagos. Estas 13 espécies habitam as Ilhas Galápagos. Esta árvore é baseada em estudos comparativos de estruturas do corpo, especialmente forma e tamanho dos bicos, e nos estudos de campo sobre isolamento reprodutivo e comportamento alimentar. Conexão entre classificação e filogenia A natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo. 4 Árvores filogenéticas baseadas em sistemática Dois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram usados para construir esta árvore de espécies de ursos e procionídeos. Antiga controvérsia sobre afinidades entre focas, leões marinhos e morsas A relação filogenética entre Phoecidae, Odobaenidae e Otaridae já foi extremamente discutida. Hoje é considerada um grupo monofilético, a família Pinnipedia, mas focas já foram consideradas grupo irmão de Lontras (Mustelidae) Qual relação entre procariotos e eucariotos? Qual a origem das mitocôndrias e dos cloroplastos? Árvores filogenéticas podem nos dar informações sobre o passado remoto Classificação: Reinos e Domínios Atualmente a sistemática filogenética reconhece 3 domínios Origem dos 3 domínios da vida no Pré-Cambriano 5 R iq u ét si as M it o cô n d ri as outras bactérias Archaea Eucariotos Nature, 1998 Grupos irmãos de ciclídeos do Lago Tanganika na África oriental Árvores nos informam sobre processos recentes de diversificação de populações e espécies Árvore MP C0I (E. Michel, 1999) Árvores filogenéticas e epidemiologia Dentista com HIV deu origem a um surto regional nos EUA Freeman e Herron, 1998 p a c ie n te B -x p a c ie n te B -y p a c ie n te A -x p a c ie n te E -y p a c ie n te E -x p a c ie n te C -x p a c ie n te C -y D e n ti s ta -y p a c ie n te A -y p a c ie n te G -x p a c ie n te G -y D e n ti s ta X L C 0 2 -x L C 0 3 -x L C 0 2 -y L C 0 9 L C 3 5 p a c ie n te D -x p a c ie n te D -y L C 0 3 -y p a c ie n te F -x p a c ie n te F -y H IV L I Filogenias de agentes infecciosos permitem traçar surtos e pandemias, assim como auxiliam nas estratégias de controle de epidemias como da gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum. Reconstruções filogenéticas e Conservação da Biodiversidade • Filogenética pode ser extremamente útil para estudos de biodiversidade (inventariamento e classificação) e estabelecimento de prioridades conservacionistas. • Medidas de diversidade que utilizam filogenias de sequências de DNA estão agora sendo usadas para implementar planos de conservação de espécies, priorizar unidades de conservação, definir unidades de manejo etc. • Ex: filogenias (e filogeografia) são usadas para identificar ESUs (unidades evolutivamente significantes), as quais representam populações importantes para manter a dinâmica evolutiva de uma espécie. 10-20 milhões de anos marinho africano amazônico Filogenias dos peixes-bois (Trichechus sp) Vianna et al 2006 Mol Ecol marinho africano amazônico Populações do clado III do peixe-boi marinho (Trichechus manatus) possuem uma distribuição restrita às Guianas e ao Brasil, portanto são unidades evolutivas independentes (ESU) das demais nesta espécie. Árvore sem raiz (rede MJ) da região controle do DNAmt Vianna et al 2006 Mol Ecol 6 B0665 B0663 B0655 B0653 B0654 B0656 B0369 B0367 B0368 B0609 B0647 B0317 B0329 B0326 B0658 B0644 B0657 B0677 B0678B0646 B0291 B0292 B0290 B0680 B0643 B0660 B0281 B0285 B1189 B1301 B1188 B1296 B1186 B1303 B0525 B0524 B0515 B0511 B0513 B0528 B0535 B0562 B1148 B1147 B1150 99 99 99 99 90 99 99 99 99 99 99 99 99 99 99 91 99 99 99 82 90 D. ochropyga D. ferruginea R. ardesiaca D. squamata B0335 P. leucoptera M. loricata T. major D. plumbeus F. serrana D. mentalis H. atricapillus S. cristatus T. doliatus T. caerulescens T. ambiguus T. pelzelni Árvore NJ COI em Thamnophilidae Vilaça et al. 2006 Termos filogenéticos • Homologia • Analogia • Convergência, Reversão • Plesiomorfia – estado ancestral – “0” (Simplesiomorfia) • Apomorfia – estado derivado – “1” (Autapomorfia - Sinapomorfia) Homologia: um caráter (ancestral ou derivado) compartilhado entre duas ou mais espécies, o qual estava presente no ancestral comum destas. Analogia: caráter “compartilhado”, geralmente não-presente no ancestral comum (i.e., o caráter evolui duas vezes, independentemente): evolução convergente (ou paralela) e reversão ao estado ancestral. A este caráter recorrente damos o nome de Homoplasia. Analogia 1 32 4Espécies: Estado do caráter: estado ancestral Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia; Origem independente – evolução paralela ou convergente . Homologia Ancestral (0) 1 32 4Espécies: Estado do caráter: estado ancestral Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); é ancestral porque está presente na base da árvore, no ancestral comum de todas 4 spp atuais. Homologia Derivada (1) 1 32 4Espécies: Estado do caráter: estado ancestral Nas spp. 1 e 2 aparece um caráter homólogo derivado (sinapomorfia). Aconteceu uma transição do estado “basal” ou primitivo no ancestral imediato destas duas spp ou OTUs. 7 Convergência: origem independente do caráter (i.e., duas linhagens fixam paralelamente um “fenótipo” similar). Reversão: origem e subseqüente perda, ou mutação “de volta” ao caráter ancestral (i.e., reversão ao estado plesiomórfico). Origem das Homoplasias Evolução Convergente = Aquisição de características similares em espécies de diferentes linhas evolutivas, devido ao compartilhamento de nichos ecológicos similares, sendo a seleção natural responsável por moldar adaptações análogas. Exemplos: asas de pássaros e morcegos bicos de aves e monotremados Evolução convergente também se dá no nível molecular: sequências de DNA e proteínas podem sofrer mudanças paralelas, reversões, etc Evolução Convergente e Seleção Natural Similaridades aparentes entre marsupiais australianos e mamíferos placentários em outros continentes. Estas espécies ocupam nichos parecidos nos diferentes continentes. Um grupo monofilético: é um grupo de táxons que inclui o ancestral comum e todos seus descendentes Exemplo de grupo não-monofilético: Répteis Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos O ancestral comum mais recente dos répteis também deu origem aos mamíferos e aves Filogenia dos grandes símios sem cauda Famílias monofiléticas HominidaePongidaeHyllobatidae 8 Filogenia dos grandes símios sem cauda Famílias parafiléticas HominidaePongidaeHyllobatidae Esta classificação equivocada não representa a história evolutiva das espécies Abordagens filogenéticas Fenética (Taxonomia numérica) Cladística (Sistemática Filogenética) Fenética • Abordagem Clássica (desde Linnaeus). • Agrupa espécies baseada na similaridade fenotípica (ou genotípica). • Usa todas características distinguíveis. • Ex: métodos baseados em distâncias (UPGMA) Análise de vários caracteres (fenótipos, sítios polimórficos de DNA, freq. alélicas, etc.) Matriz de dissimilaridade em base ao número de diferenças Construção de árvore filogenética FenogramaA B C A B C 3 7 6 0 0 0 A B CA B A B C Relações de similaridade MÉTODOS FENÉTICOS Cladística • A Teoria Evolutiva postula que grupos de organismos relacionados descendem de um ancestral comum. • Sistemática Filogenética (Cladística) é um método de classificação taxonômica baseado na história evolutiva. Foi desenvolvido em 1950 por Willi Hennig, um entomologista alemão. Cladística • Baseia-se no padrão de ancestralidade comum e modificação das espécies e não em mera similaridade. • Deve usar apenas caracteres derivados (apomórficos) compartilhados (sinapomórficos ou homólogos derivados). • Portanto, objetiva traçar a história evolutiva real, o padrão de descendência com modificação. • Ex: métodos baseados em caracteres (parcimônia). 9 Análise de vários caracteres com estados ancestrais (0) e derivados (1) Construção de árvore filogenética Cladograma A B C A B C Relações de ancestralidade comum MÉTODOS CLADÍSTICOS D E 1 2 3 4 5 6 7 8 E D 1 2 3 4 5 6 7 8 Caracteres utilizados SimNãoNãoCladística SimSimSimFenética Homologias Derivadas Homologias Ancestrais Analogias Besouro BorboletaCavalo “Eventos Reais” Besouro BorboletaCavalo Fenética Cladística Besouro BorboletaCavalo Jacaré AveLagarto “Eventos reais” JacaréAve Lagarto Fenética Cladística Jacaré AveLagarto 10 Análise Filogenética • Dado um conjunto de dados (caracteres morfológicos, alinhamento de múltiplas sequências de DNA e proteína, etc), pode-se determinar (ou inferir) o relacionamento ancestral dentre as espécies. Esp.1 Esp.2 Esp.3 Esp.4 Tem p o Não-resolvida ou filogenia tipo “estrela” Filogenia parcialmente resolvida Completamente resolvida, filogenia bifurcada A A A B B B C C C E E E D D D Politomia ou multifurcação uma bifurcação O objetivo da inferência filogenética é resolver a ordem de ramificação das linhagens nas árvores evolutivas: Há 3 possíveis árvores sem raiz para 4 táxons (A, B, C, D) A C B D árvore 1 A B C D árvore 2 A B D C árvore 3 Métodos de reconstrução (ou inferência) filogenética objetivam descobrir qual das árvores é a “mais provável". Espera-se que esta seja a “verdadeira” árvore biológica — aquela que seguramente represente a história evolutiva dos táxons analisados – mas esta é formalmente chamada de árvore inferida a partir dos dados, cuja confiança pode ser testada por diferentes métodos. O número de árvores sem raiz aumenta exponencialmente com o número de táxons # táxons 3 4 5 6 7 8 9 10 . . . . 30 # árvores sem raiz 1 3 15 105 945 10,935 135,135 2,027,025 . . . . -3,58 x 10 36 CA B D A B C A D B E C A D B E C F Inferir relacionamentos evolutivos entre os táxons requer enraizar a árvore: Note que nesta árvore enraizada, o táxon A não está mais estreitamente relacionado ao táxon B em relação a C ou D como sugerido acima. A B C Raiz D A B C D Raiz árvore enraizada árvore sem raiz O enraizamento em outra posição: A B C raiz D árvore sem raiz Note que nesta árvore enraizada, táxon A é mais estreitamente relacionado ao táxon B, enquanto o C é mais relacionado ao D. C D raiz árvore enraizada A B 11 Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares distintos para produzir cinco árvores enraizadas diferentes árvore sem raiz: A C B D árvore c/raiz 4 C D A B 4 árvore c/raiz 3 A B C D 3 árvore c/raiz 5 D C A B 5 árvore c/raiz 2 A B C D 2 árvore c/raiz 1 B A C D 1 Estas árvores representam cinco histórias evolutivas diferentes entre os táxons, dependendo de onde se coloca a raiz ! # táxons 3 4 5 6 7 8 9 . . . . 30 # árvores sem raiz 1 3 15 105 945 10.395 135.135 . . . . ~3,58x10 36 # raízes 3 5 7 9 11 13 15 . . . . 57 # árvores com raiz 3 15 105 945 10.395 135.135 2.027.025 . . . . ~2,04x10 38 x = CA B D A D B E C A D B E C F Cada árvore sem raiz pode teoricamente ser enraizada em qualquer lugar ao longo de qualquer de seus ramos H C G G C H C G H Árvores alternativas sobre relações evolutivas entre os três “grandes símios” A árvore do meio é considerada a árvorecientífica “verdadeira” para a história evolutiva destas três espécies Há dois modos principais de enraizar árvores: Pelo grupo externo (outgroup ): Usa táxons de referência (o “outgroup”) que sabidamente se situam fora do grupo de interesse (o “ingroup”). Requer conhecimento a priori sobre relacionamentos entre os táxons. O outgroup pode ser uma espécie (ex: aves para enraizar uma árvore de mamíferos) ou cópias de genes duplicados (ex: -globina para enraizar -globinas). outgroup A B C D 10 2 3 5 2 Pelo ponto-médio ou distância: enraiza a árvore no ponto médio entre os dois táxons mais distantes na árvore, tal como determinado pelo tamanho dos ramos. Pressupõe que os táxons evoluem coordenadamente (evolução constante entre linhagens). Esta suposição está embutida em alguns métodos fenéticos de construção de árvores tal como o UPGMA. d (A,D) = 10 + 3 + 5 = 18 Ponto-médio = 18 / 2 = 9 Todos estes rearranjos mostram o mesmo relacionamento evolutivo entre táxons B A C D A B D C B C A D B D A C B A C D árvore enraizada 1 B A C D A B C D Todas estas árvores são idênticas Reconstruções filogenéticas com dados moleculares 12 Variabilidade genética Fenotípica Morfológica Funcional Protéica DNA Macromutações SNP’s – mutações de ponto Inserções de retroposons Microssatélites POP1 A - 0,4 B - 0,2 C - 0,9 D - 0,1 E - 0,2 POP2 A - 0,6 B - 0,5 C - 0,8 D - 0,3 E - 0,1 POP3 A - 0,3 B - 0,2 C - 0,9 D - 0,2 E - 0,4 Freqüências alélicas Freqüência de um dos alelos em cinco locos bialélicos (A-E) em 3 populações (pop1, 2, 3) Frequências alélicas servem apenas para comparações fenéticas intra-específicas. Microssatélites AT AT AT AT AT CCG CCG CCG CCG CA CA CA CA CA CA CA CA CA CA CA CA CA CA CA CA CA CA CAAlelo 3 Alelo 5 Alelo 7 são multi-alélicos µ = 10-4 a 10-3 / loco / geração Microssatélites servem geralmente apenas para comparações fenéticas intra- específicas. SNPs ou mutações de ponto Single Nucleotide Polymorphisms são geralmente bialélicos alelo 0 ...AAGCGTTATAGC... alelo 1 ...AAGTGTTATAGC... µ = 10-7 a 10-8 / locus / geração SNPs podem ser utilizados para comparações cladísticas interespecíficas. * * * ** * * * * * * A aat tcg ctt cta gga atc tgc cta atc ctg B ... ..a ..g ... .a. ... ... t.. ... ..a C ... ..a ..c ..g ... ..t ... ... ... t.a D ... ..a ..a ..g ..g ..t ... t.g ..t t.. Cada diferença de nucleotídio é um SNP e considerado como um caráter na reconstrução filogenética Obs: Pontos (.) se referem a posições de caracteres inalterados em relação à primeira sequência (A) * Posições com caracteres variáveis entre estas sequências SNPs em sequências de DNA Analogia T C T C C 1 32 4Espécies: Estado do caráter: estado ancestral TNas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia); Origem independente – evolução paralela ou convergente 13 Homologia Ancestral (0) T C C C 1 32 4Espécies: Estado do caráter: estado ancestral CNas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia); é ancestral porque está presente na raiz da árvore (ancestral comum) como uma plesiomorfia. C Homologia Derivada (1) T T C C C 1 32 4Espécies: Estado do caráter: estado ancestral TNas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) (i.e., aconteceu uma transição do estado “basal” ou primitivo, no ancestral comum imediato destas duas spp ou OTUs). Tipos de abordagens filogenéticas utilizando moléculas Fenética Similaridade geral Cladística Sistemática filogenética Similaridade vs. relacionamento evolutivo Similaridade e relacionamento evolutivo não são a mesma coisa, mesmo que relacionamento evolutivo seja inferido de certos tipos de similaridade. Similar: ser semelhante (uma observação) Relacionado: geneticamente conectado (um fato histórico) Dois táxons podem ser mais similares sem ser mais relacionados: Táxon A Táxon B Táxon C Táxon D 1 1 1 6 3 5 O táxon C é mais similar ao A (d = 3) do que ao B (d = 7), mas C e B são mais estreitamente relacionados: C e B compartilham um ancestral comum mais recente do que os dois com A. Métodos baseados em caracteres podem teoricamente discriminar os tipos de similaridade e encontrar a “verdadeira” árvore evolutiva . Tipos de Similaridade Similaridade observada entre duas OTUs pode ser por: relacionamento evolutivo : caracteres ancestrais compartilhados (‘simplesiomorfias’) caracteres derivados compartilhados (‘’sinapomorfias’) Homoplasia (evolução independente do mesmo caráter): Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em OTUs relacionadas), Reversões (em OTUs relacionadas ou não) C C G G C C G G C C G G C G G T Convergentes Paralelos Reversões Seleciona a árvore que melhor representa as distâncias observadas entre os pares. Seleciona a árvore que tem a maior probabilidade de reproduzir os dados observados. Seleciona a árvore que explica os dados com o menor número de substituições (eventos mutacionais fixados). Distância Verossimilhança Parcimônia Métodos gerais de reconstrução filogenética C A R Á T E R 14 Tipos de dados usados em inferência filogenética Métodos baseados em caracteres : Usam diretamente os caracteres alinhados, tais como sequências de DNA ou proteína táxons caracteres espécie A ATGGCTATTCTTATAGTACG espécie B ATCGCTAGTCTTATATTACA espécie C TTCACTAGACCTGTGGTCCA espécie D TTGACCAGACCTGTGGTCCG espécie E TTGACCAGTTCTCTAGTTCG Métodos baseados em distâncias: Transformam os dados em distâncias (dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore. A B C D E espécie A ---- 0,20 0,50 0,45 0,40 espécie B 0,23 ---- 0,40 0,55 0,50 espécie C 0,87 0,59 ---- 0,15 0,40 espécie D 0,73 1,12 0,17 ---- 0,25 espécie E 0,59 0,89 0,61 0,31 ---- Exemplo 1: Distância “p” (= percentagem observada de sequências diferentes) Exemplo 2: distância Kimura 2-parâmetros (estimativa do número real de substituições entre táxons) M A T R I Z Estima-se primeiro qual árvore sem raiz seria a mais “correta” A B C D Alguns métodos produzem a árvore já com a raiz (UPGMA), outros podem fornecer árvores com raiz se os dados possuem informação suficiente (Parcimônia, Verossimilhança) e todos podem se utilizar ou necessitam obrigatoriamente de um grupo externo para produzir uma árvore com raiz (Neighbor Joining - NJ) Algoritmos baseados em distâncias (agrupamento) Usam distâncias para calcular árvores filogenéticas. Estas são baseadas somente no número relativo de similaridades e diferenças entre um grupo de seqüências. – Começa com uma matriz de distâncias par-a-par – Estes métodos constróem uma árvore ligando os pares de táxons menos distantes, sucessivamente ligando táxons mais distantes. – Ex: UPGMA (típico método fenético) e Neighbor joining (NJ) que considera diferentes taxas evolutivas entre linhagens. Distâncias entre DNA • distâncias entre pares de seqüências de DNA são relativamente simples de computar como a soma de diferenças de bases entre as duas seqüências. – Este tipo de algoritmo somente funciona para pares de sequências similares o bastante para serem alinhadas • Geralmente todas alterações de bases são consideradas iguais • Inserções/deleções geralmente possuem um peso maior do que substituições nucleotídicas (gap penalties). • É também possível corrigir múltiplas substituições em um único sítio, que é comum em relacionamentos filogenéticos distantes e para sítios de rápida evolução. UPGMA • O mais simples dos métodos de distância é o UPGMA (Unweighted Pair Group Method using Arithmetic averages) e apenas reconstrói fenogramas que representam meras relações de similaridade geral. • Assume taxas evolutivas idênticas para todas as OTUs. • Agrupa as distâncias menores e recalcula novas distâncias através de médias aritméticas para novo agrupamento.• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam distâncias genéticas entre grupos de seqüências criando uma matriz de dissimilaridades (distâncias). • Então o programa NEIGHBOR (que também constrói árvores NJ) do PHYLIP constrói a árvore UPGMA a partir da matriz. • Esta árvore é visualizada em um programa apropriado (Ex: TREEVIEW ou PTP). Métodos de Distância a ACGA b ATGC c GTGC d GCAA a b c d a 0 b 0,5 0 c 0,75 0,25 0 d 0,5 1,0 0,75 0 d ij 15 a b cda b c d a 0 b 0,5 0 c 0,75 0,25 0 d 0,5 1,0 0,75 0 d ij Métodos de Distância Matriz Árvore UPGMA (mera similaridade) a b c d a 0 b 0,5 0 c 0,75 0,25 0 d 0,5 1,0 0,75 0 d ij Métodos de Distância Matriz Árvore Neighbor-Joining (similaridade e taxas evolutivas diferenciais) b d a c Máxima parcimônia • Parcimônia é o método mais popular de reconstrução cladística dos relacionamentos por ancestralidade comum. • Parcimônia permite o uso de toda informação evolutiva conhecida para a construção da árvore. – em contraste, métodos de distância resumem todas diferenças entre pares de seqüências em um único número, a percentagem de diferença ou distância genética. Exemplo de Parcimônia • Considere 4 táxons com as seqüências: a (ACGA), b (ATGC), c (GTGC), d (GCAA). • A parcimônia deve decidir qual das 3 possíveis árvores sem raiz (4 táxons), é a mais “correta” (parcimoniosa). • Posteriormente, se houver informações suficientes, deve- se colocar a raiz, a qual polariza o padrão de ramificações sequenciais na árvore filogenética. Exemplo de Parcimônia a b c d a c b d a d b c a A C G A b A T G C c G T G C d G C A A árvore 1 árvore 2 árvore 3 1 2 3 4 Exemplo de Parcimônia a b c d a A C G A b A T G C c G T G C d G C A A árvore 1 Tot árvore 1 1 árvore 2 árvore 3 A A G G * * = 1 etapa de mutação 1 2 3 4 16 Exemplo de Parcimônia a b c d a A C G A b A T G C c G T G C d G C A A árvore 1 Tot árvore 1 1 2 árvore 2 árvore 3 1 2 3 4 C T C T* * = 2 etapas de mutação * Exemplo de Parcimônia a b c d a A C G A b A T G C c G T G C d G C A A árvore 1 Tot árvore 1 1 2 1 árvore 2 árvore 3 A GG 1 2 3 4 * = 1 etapa de mutação * G Exemplo de Parcimônia a b c d a A C G A b A T G C c G T G C d G C A A árvore 1 Tot árvore 1 1 2 1 2 6 árvore 2 árvore 3 A A 1 2 3 4 C C* * = 2 etapas de mutação * Exemplo de Parcimônia a b c d a c b d a d b c a A C G A b A T G C c G T G C d G C A A árvore 1 árvore 2 árvore 3 Tot árvore 1 1 2 1 2 6 árvore 2 2 2 1 2 7 árvore 3 2 1 1 1 5 1 2 3 4 Exemplo de Parcimônia a d b cárvore 3 Árvore sem raiz escolhida pela análise de parcimônia Neste caso temos informações adicionais de que táxon com a sequência d possa funcionar como um grupo externo (outgroup), portanto a raiz estará entre d e os outros ( ). a b cd Árvore com raiz escolhida usando d como outgroup Exemplo de Parcimônia a b cd a A C G A b A T G C c G T G C d G C A A 1 1 (A)1 (A) A evolução dos caracteres apomórficos pode ser inferida a partir do Cladograma. Assim, eventos paralelos (recorrentes) de mutação podem ser identificados, os quais geram homoplasias 3 (G) 3 2 (T) 2 4 (C) 4 17 A análise de parcimônia pode discriminar alguns tipos de eventos paralelos. Na figura ao lado, 4 seqüências alinhadas homólogas (a) de distintos organismos foram utilizadas para construir uma árvore de parcimônia (b). Na árvore estão dispostas os eventos de mutações (apomorfias), numerados de 1 a 8. No evento 2, o estado alélico derivado (nucleotídio A) demonstrou ser um evento paralelo, aparecendo independentemente na seqüência do homem e do milho Verossimilhança (L) é a probabilidade dos dados, dado o modelo de substituições nucleotídicos e uma hipótese de topologia filogenética Modelo evolutivo de substituições Diferentes padrões de substituição nucleotídica específicos de cada conjunto homólogo de sequências de DNA. A C T G Transição Transversão L = P (dados/árvore) Máxima verossimilhança Jukes-Cantor (1 parâmetro) A frequência dos nucleotídios não é considerada Todas substituições têm a mesma taxa Kimura 2P (2 parâmetros) A frequência dos nucleotídios não é considerada Transições e transversões têm diferentes taxas GTR (General Time Reversible) (6 parâmetros) a b cd e f A frequência dos nucleotídios é considerada Transições e transversões têm diferentes taxas, assim como os tipos de mudanças nucleotídicas O modelo inapropriado de substituições nucleotídicas pode levar a uma reconstrução filogenética incorreta. 18 Modeltest Posada e Krandal O software permite selecionar o modelo de substituição mais plausível para determinado conjunto de sequências, assim como outros parâmetros necessários para a reconstrução filogenética. Dados reais: mudanças observadas e esperadas • Comparação de sequências de chimpanzé e homem no DNAmt (307/1333 sítios são diferentes) • Modelos com mais parâmetros se aproximam mais do padrão observado LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i) d c b a C C T T 7654321 TGGAGA TATAGA TCCCGA TCAGAA Táxon Táxon Táxon Táxon aa cc bb dd aa bb cc dd aa dd cc bb Método baseado na avaliação probabilística de modelos evolutivos que melhor explicam um conjunto de dados de forma que este reflita a história evolutiva mais próxima da realidade C A L(5) = Prob +C G A A Prob + C C A G A C C C A G C T Prob + Prob ... + Prob + C C A G N N Máxima verossimilhança Problemas na reconstrução filogenética As taxas evolutivas são diferentes para cada gene ou segmento anônimo de DNA. Árvores filogenéticas contam a história do caráter, mas não necessariamente da espécie. Taxas de mutação/evolução Árvores de genes e de espécies • A história evolutiva de genes reflete aquela das espécies que os carregam, exceto quando: – Transferência horizontal = transferência gênica entre espécies (ex. entre bactérias, mitocôndrias em híbridos) – Duplicação gênica : ortologia/ paralogia Incongruência entre árvores de genes e espécies 19 Associações históricas Page e Charleston, 1998 Eventos entre gene (associado) e a espécie (host) Page e Charleston, 1998 Reconstrução da filogenia de espécies: artefatos devido à paralogia Perda de genes pode acontecer durante a Evolução: mesmo sequências com Perda de genes pode acontecer durante a Evolução: mesmo sequências com genomas completos pode ser difícil detectar paralogiagenomas completos pode ser difícil detectar paralogia Rat Mouse Rat Mouse GNS1 GNS1 GNS1 GNS2 GNS2 GNS2GNS1 GNS2 Hamster Hamster especiação duplicação Mouse Rat GNS GNSGNS Hamster Árvore verdadeira Árvore obtida com amostragem parcial de genes homólogos, mas parálogos
Compartilhar