Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Universidade Federal de Viçosa - UFV Departamento de Biologia Geral Genética de Populações Evolução Orgânica - Bio 340 Profa. Karla Yotoko 2 Capítulo 1 Introdução à Genética de Populações Equilíbrio de Hardy-Weinberg Introdução: Até aqui, durante o curso de genética básica, estudamos como as características são passadas de uma geração para a outra em termos de células e indivíduos. Estudamos como Mendel descobriu seus “fatores” e propôs as leis da hereditariedade. Vimos que os geneticistas primeiro localizaram estes fatores ou genes nos cromossomos e depois como descobriram que o DNA era o responsável por guardar a informação genética, já que possuía estrutura e função apropriadas para tanto. Vimos também como os genes funcionam: os mecanismos de transcrição, tradução e mesmo algumas formas de controle da expressão gênica. Além disso, vimos que há genes fora do núcleo, que são transmitidos pela linhagem materna. No entanto, a genética precisa ser estudada em níveis mais altos. É preciso saber, por exemplo, quais as características genéticas de uma determinada população para poder prever a probabilidade de algumas doenças. Por que será que a hemofilia é tão rara na humanidade inteira enquanto a anemia falciforme é tão comum em algumas regiões da África? Agrônomos e Zootecnistas precisam dominar genética de populações para poder selecionar melhor que linhagens cruzar para obter melhores resultados. Ecólogos precisam saber o quão variáveis são as populações das espécies que estudam para poder ter idéia de que estratégias de conservação devem adotar. Definição de População Informal e intuitivamente população é um grupo de organismos pertencentes a uma mesma espécie. Em genética de populações é preciso especificar melhor este conceito. A palavra população não se refere à espécie inteira, se refere a um grupo de organismos de uma mesma espécie que vive em uma área geográfica suficientemente restrita para que qualquer membro possa se casalar com qualquer outro do sexo oposto. Como sempre há estrutura geográfica dentro das espécies, devida a padrões não aleatórios de distribuição espacial dos organismos, uma definição precisa de população é muito difícil de se obter. Membros de uma mesma espécie raramente estão distribuídos homogeneamente no espaço: quase sempre há agregações, colônias etc. A subdivisão das populações está quase sempre associada à heterogeneidade do ambiente: quase sempre há áreas apropriadas para uma população separadas por áreas não apropriadas. Este tipo de padrão é óbvio em organismos terrestres que vivem em ilhas oceânicas, mas a subdivisão é comum na maior parte dos habitats: lagos de água doce têm áreas profundas e rasas, florestas têm áreas sombreadas e ensolaradas. A subdivisão populacional também pode ser afetada por comportamento social. Mesmo populações humanas são agregadas, em cidades isoladas por desertos ou montanhas, por exemplo. Diversos fatores afetam a composição genética das populações, dentre eles podemos destacar: 1. O tipo de padrão de reprodução adotado pela população. Este padrão pode ser aleatório, o que chamamos de acasalamentos ao acaso (a.a.a.); é possível que os indivíduos tenham preferência por acasalar-se com indivíduos aparentados, ao que chamamos de endogamia; ou que prefiram acasalar-se com indivíduos de fenótipo 3 parecido (ex. pessoas altas preferem casar-se com pessoas altas), ao que chamamos de acasalamento preferencial. 2. A imigração de indivíduos de outras populações. 3. As taxas de mutação e recombinação gênica. 4. Os efeitos do ambiente sobre a taxa de reprodução de cada genótipo – genótipos mais adaptados geram mais descendentes que os menos adaptados – Seleção Natural. 5. As Flutuações aleatórias. Variação Populacional Quando falamos em composição genética de uma população, e queremos saber como é esta composição e como ela é afetada por diferentes fatores, no fundo o que precisamos é quantificar a variação genética que existe na população. A variação genética só pode ser avaliada a partir da variação genotípica; no entanto, a variação que está disponível é a variação fenotípica, que é a que em geral interessa a agrônomos, zootecnistas, médicos, nutricionistas, ecólogos e outros profissionais das ciências biológicas. Como já vimos em outros capítulos, algumas características fenotípicas estão diretamente relacionadas ao genótipo em um determinado lócus. Nestes casos é possível saber o genótipo do indivíduo pela simples observação de seu fenótipo. Infelizmente isso não é tão simples em todos os casos. Algumas características são determinadas por mais de um gene, às vezes por um complexo conjunto deles, além de serem fortemente influenciadas pelo ambiente. Estas características serão melhor estudadas quando estudarmos genética quantitativa, outro tema importante na genética. Neste capítulo nos limitaremos às características que são definidas por um único gene. O princípio geral de quantificação da variação genotípica é simplesmente contar quantos indivíduos apresentam cada genótipo em uma determinada população. Só para relembrar, numa espécie diplóide, se temos um gene A com dois alelos, A e A’, os genótipos serão: A/A, A/A’ e A’/A’. As freqüências genotípicas são dadas pelo número de indivíduos de cada fenótipo dividido pelo número total de indivíduos. Obviamente, a soma das freqüências de cada genótipo deve ser 1. A variação pode ser simplesmente morfológica (cor de flores, por exemplo), e para quantificá- la basta contar quantos indivíduos em cada população possuem um determinado fenótipo. Imagine que uma determinada espécie de planta só apresenta flores vermelhas, cujo genótipo é BB; rosa, cujo genótipo é Bb; e brancas, cujo genótipo é bb. Para quantificar a variação genotípica em uma população, basta contar quantas são BB, quantas são Bb e quantas são bb. Outro tipo de variação que pode ser observada é pela determinação de grupos sanguíneos. A determinação do grupo sanguíneo MN, por exemplo, fornece o genótipo de cada indivíduo diretamente. A tabela 1 mostra as freqüências genotípicas para o grupo MN em diferentes populações humanas: Tabela 1: freqüências genotípicas para os alelos do lócus responsável pelo grupo sanguíneo MN. População M/M M/N N/N Esquimós 0,835 0,156 0,009 Aborígenes Australianos 0,024 0,304 0,672 Egípcios 0,278 0,489 0,233 Alemães 0,297 0,507 0,196 Chineses 0,332 0,486 0,182 Nigerianos 0,301 0,495 0,204 4 A determinação dos genótipos do grupo sanguíneo ABO ou do fator Rh pode ser um pouco mais complexa, já que existe relação de dominância entre alguns alelos, e portanto é necessário conhecer genealogias para tentar determinar os genótipos. Outra maneira de quantificar a variação genotípica se faz pela quantificação do polimorfismo de proteínas. Na década de 1960 foi inventada a eletroforese de proteínas. A partir deste método é possível estabelecer quantos alelos diferentes estão presentes em uma determinada população através da determinação dos genótipos dos diferentes indivíduos. O Box 1 especifica como é feita uma eletroforese de proteínas. Hoje é mais comum determinar o genótipo dos indivíduos, e, portanto, calcular a freqüência genotípica de uma população, diretamente através de seqüências de DNA. O Box 2 mostra, em linhas gerais, como é feito o seqüenciamento. Um aspecto importante da quantificação da variação populacional é que em geral consideramos a variabilidade como uma condição para que haja evolução. De fato, evolução é tradicionalmente definida como “alteração nas freqüências gênicas” não há como evoluir se não houver tal variação. A variação, ou variabilidade, permite que apopulação se adapte, por exemplo, a modificações ambientais. Com isso, sempre que houver mais de um alelo num mesmo lócus, este lócus pode ser considerado polimórfico. Alguns geneticistas preferem chamar de polimórficos os loci cujo alelo mais freqüente tenha freqüência menor que 99% ou 95%. Uma medida de variação genética é a quantidade de heterozigose em um lócus em uma população, dada pela freqüência total de heterozigotos neste lócus. Se um alelo estiver em freqüência muito alta e os demais em freqüência muito pequena, teremos poucos heterozigotos e a variação é considerada baixa. Espera-se que a heterozigozidade seja mais alta quando há muitos alelos em freqüências relativamente próximas – quanto mais alelos e quanto mais altas suas freqüências, maior a variabilidade neste lócus. Mais tarde, neste mesmo capítulo, você compreenderá esta afirmação. Cálculo das freqüências gênicas Quando falamos em calcular freqüências gênicas (ou freqüências alélicas), queremos saber qual a quantidade de cada um dos alelos de um determinado lócus está presente na população. Este procedimento é importante para prever as freqüências genotípicas deste lócus na próxima geração, o que pode ser de grande interesse na criação de animais, cultivo de plantas, preservação de espécies etc. Para calcular as freqüências gênicas, basta conhecer as freqüências genotípicas a ela associadas. Se quisermos saber qual a freqüência gênica dos alelos M e N da tabela 1, basta contar quantos alelos M e quantos alelos N há em cada população. Tome como exemplo a população de esquimós. Transformemos as freqüências em números só para facilitar os cálculos. Imagine que foram medidos 1000 indivíduos, isso significa que 835 deles são M/M, 156 são M/N e 9 são N/N. Nos 835 que são M/M, há 1670 alelos M (835 x 2). Já nos 156 M/N há 156 alelos M. Com isso, temos um total de 1826 alelos M. Como o total de indivíduos contados foi 1000, então o total de alelos contados foi 2000. Assim, a freqüência do alelo M é de 1826/2000 = 0,913. Portanto, o alelo M está numa freqüência de 91,3% enquanto o alelo N está numa freqüência de 8,7% (100%-91,3%) na população de Esquimós. �1� ����. � 2 �2 5 �2� � � 2� � 2�� 2 �3� � � 2 � 835 1562000 � 0,913 Exercício: Calcule agora as freqüências gênicas dos alelos M e N nas diferentes populações humanas. Modelagem Matemática Antes de começar a estudar os mecanismos evolutivos, é preciso compreender que eles são estudados através de modelos matemáticos. Modelos matemáticos são ferramentas bastante úteis para o estudo de qualquer processo. Através deles é possível estabelecer padrões e detectar processos, para um melhor entendimento dos fenômenos naturais, nos quais se encontra a evolução. Conforme já foi dito, evolução é a alteração nas freqüências gênicas em uma população. Para compreender um cenário onde as freqüências gênicas mudam, é preciso descrever um cenário um pouco mais simples, no qual as freqüências gênicas simplesmente não mudam. É preciso ter em mente que todo modelo matemático parte de uma super simplificação da realidade. Isso pode parecer estranho em princípio, como é que um modelo muito simples pode servir para compreender uma realidade complexa? Isso se explica pela própria diferenciação entre modelo e descrição. Se quiséssemos incluir todos os detalhes, faríamos uma descrição detalhada e não um modelo. Numa descrição detalhada é mais difícil visualizar os padrões e detectar processos. A primeira simplificação que temos que levar em conta é a não sobreposição de gerações, onde os indivíduos de uma população nascem, amadurecem sexualmente e morrem nesta geração antes que os indivíduos da próxima geração amadureçam sexualmente. Esta simplificação só se aplica literalmente a organismos com história de vida muito simples, como certos insetos de vida efêmera ou plantas anuais. Este tipo de população hipotética, com esta história de vida muito simples é utilizado em genética de populações como uma primeira aproximação a populações que tenham histórias de vida mais complexas. Apesar de parecer simples demais, os cálculos de freqüência esperada na próxima geração baseados neste modelo são adequados para diversos objetivos, inclusive para espécies muito complexas, como a humana, por exemplo. O pricípio de Hardy-Weinberg Se a população não apresentar sobreposição de gerações e se os acasalamentos ocorrerem ao acaso, é possível prever as freqüências genotípicas da próxima geração simplesmente a partir das freqüências gênicas desta geração. Para fazer esta previsão, é preciso primeiro checar certos pré-requisitos: 1- O organismo em estudo deve ser diplóide 2- A reprodução deve ser sexuada 3- Não pode haver sobreposição de gerações 4- O gene em estudo deve ter só dois alelos 5- As freqüências dos alelos devem ser idênticas em machos e fêmeas 6- Os acasalamentos devem ocorrer ao acaso 7- A população deve ser muito grande (infinita) 8- A migração deve ser ignorável 9- A mutação também 10- A seleção natural não deve afetar os alelos em estudo. 6 Coletivamente estes pressupostos sumarizam o modelo de Hardy-Weinberg, nomeado em homenagem aos seus formuladores: G. H. Hardy (um matemático) e W. Weinberg (um físico), que, independentemente, em 1908, formularam o modelo e deduziram suas predições teóricas para as freqüências genotípicas. Conforme o pressuposto número 6, uma população obedece ao princípio de H-W quando os acasalamentos se dão ao acaso, ou seja, a probabilidade de um indivíduo X se acasalar com o indivíduo Y na população é rigorosamente igual à probabilidade dele se acasalar com qualquer outro, desde que seja do sexo oposto. Para entender exatamente como isso funciona, imagine um balde contendo uma “sopa de gametas”, composta de milhares de óvulos e milhares de espermatozóides. Estes gametas se unirão sem qualquer critério de escolha, estritamente ao acaso. Como a população em estudo deve ser sexuada (pressuposto número 2), sempre temos que unir dois gametas para formar um zigoto. Imagine então que metade dos óvulos, bem como metade dos espermatozóides, carrega o alelo A e a outra metade carrega o alelo a. Então podemos dizer que a freqüência do alelo A, que de agora em diante chamamos de p, é 0,5. De forma análoga, podemos dizer que a freqüência do alelo a, por sua vez, é q=0,5. Assim, a probabilidade de formar um zigoto A/A depende unicamente da freqüência de A na população de óvulos e de espermatozóides. Como esta freqüência é de 0,5 em ambos os casos, a freqüência de A/A pode ser dada por p2 = 0,25 (0,5 x 0,5). Seguindo o mesmo raciocínio, a freqüência de a/a também será de 0,25, q2 = 0,25. É preciso também calcular a freqüência de A/a. Como não se trata da junção aleatória de qualquer gameta com qualquer outro e sim de qualquer óvulo com qualquer espermatozóide, é preciso considerar uma situação na qual o óvulo contém A e o espermatozóide a, e outra, na qual o óvulo contém a e o espermatozóide A. Com isso, a probabilidade de termos um heterozigoto A/a é igual a 2pq = 0,5. Este raciocínio obedece à distribuição binomial. Só para relembrar: �4� �� ��� � �� 2�� �� Tendo isso em vista, é possível saber se uma determinada geração de uma população foi formada por acasalamentos ao acaso. Em outras palavras, é possível verificar se uma determinada população encontra-se em Equilíbrio de Hardy-Weinberg. Volte agora à tabela 1. Ela mostra as freqüências dos genótipos para o lócus MN. Será que as populações humanas estão no EHW para este lócus? Será que populações humanas podem ser estudadas como se a reprodução fosse aleatória como a que ocorre em um “balde de gametas”? Para responder a esta questão é preciso testar. Paratestar, precisamos saber qual a freqüência dos alelos M e N em cada população. Entre os esquimós, calculamos que a freqüência do alelo M é de 0,913, que chamaremos de p; enquanto que a freqüência do alelo N é de 0,087, que chamaremos de q (repare que não importa qual dos alelos é chamado de p ou q). Sabendo disso, é possível calcular as freqüências esperadas de M/M, M/N e N/N caso a população estivesse em EHW. Tendo o esperado, basta fazer um teste de χ2 de aderência. O número de graus de liberdade é dado pelo número de classes observadas menos 1 (como normalmente se faz no χ2), menos o número de parâmetros estimados para calcular o esperado. Neste caso, foi estimada a freqüência de M (p), e a freqüência de N é dada simplesmente por (1 - p). Não esqueça que para fazer o teste de χ2 precisamos utilizar 7 números e não freqüências. Portanto utilizaremos uma população de 1000 pessoas para facilitar os cálculos. Genótipo Observado Esperado �� � ��� �� � � M/M 835 p2 X 1000 = (0,913)2 x 1000 = 833,6 0,002 M/N 156 2pq x 1000 = (2 x 0,913 x 0.087) x 1000= 158,9 0,05 N/N 9 q2 x 1000 = (0,087)2 x 1000 = 7,5 0,3 Total : 0,352 g.l. = 3 classes – 1 -1 = 1 grau de liberdade Como com um grau de liberdade o valor crítico do χ2=3,8, podemos aceitar a hipótese de que a população egípcia encontra-se no equilíbrio de Hardy-Weinberg no lócus MN. Você deve estar se perguntando como é possível que um lócus esteja no EHW numa população humana, já que nossa experiência mostra que as pessoas definitivamente não se casam aleatoriamente. O que acontece é que as pessoas de fato escolhem seus cônjuges por diversos caracteres fenotípicos, com altura, peso, cor da pele etc. No entanto, temos que lembrar que ninguém pergunta ao futuro parceiro se ele é M/M, M/N ou N/N (aliás, muito pouca gente sabe que seu próprio genótipo). Com isso, pelo menos para o lócus MN os acasalamentos são de fato aleatórios na população egípcia. Seguindo este mesmo raciocínio, isso deveria ser verdade para as outras populações representadas na tabela 1. Exercício: Faça o teste e determine se cada uma das populações representadas está de fato em EHW. Implicações do Princípio de Hardy-Weinberg: Por se tratar de uma super simplificação da realidade, o Princípio de Hardy Weinberg pode ser considerado como um modelo de referência no qual não há forças evolutivas em ação além das impostas pela própria reprodução. Neste sentido, o modelo é similar ao pressuposto da física de que não há atrito no deslocamento de um corpo. O modelo serve como base para a comparação com modelos mais realistas, nos quais as forças evolutivas modificam as freqüências gênicas. Talvez mais importante que isso, o modelo separa a história de vida em dois intervalos: i. gametas → zigoto e ii. zigotos → adultos. Um modelo um pouco mais complexo pode incluir, por exemplo, a entrada de imigrantes entre os adultos, alterando as freqüências gênicas, ou a viabilidade diferencial de zigotos, de modo que alguns não cheguem à fase adulta. Um aspecto interessantíssimo do EHW é que se os imigrantes entrarem na população dos adultos e se reproduzirem com os adultos desta população, então a próxima geração de zigotos estará em equilíbrio de H-W, porém com uma freqüência gênica diferente. A comparação das freqüências gênicas em diferentes gerações da mesma população permite a detecção de evolução (modificação nas freqüências gênicas). A implicação mais importante do EHW é a manutenção das freqüências gênicas e genotípicas em uma população. A constância das freqüências alélicas implica que, na ausência de forças evolutivas que alterem as freqüências gênicas, o mecanismo da herança mendeliana, por si só, mantém as freqüências constantes e preserva a variação genética. A segunda implicação mais importante é que em uma única geração de acasalamentos ao acaso, a população volta ao estado de equilíbrio (se as freqüências alélicas em fêmeas e machos forem iguais e se não 8 houver sobreposição de gerações – em populações de estrutura mais complexa, a população volta gradualmente ao estado de equilíbrio). Um dos aspectos interessantes do EHW é que se uma população estiver sob este equilíbrio em um determinado lócus, é possível prever qual serão as freqüências genotípicas nas próximas gerações. Isso, no entanto, só é verdade se as populações forem grandes, se não houver imigração para a população, se não houver mutações e se não houver seleção natural. Em outras palavras, sob todos estes pressupostos, não há alteração nas freqüências gênicas em uma população, ou seja, ela não evolui. Simulação: No PVANet, abra o documento EHW.xls. Neste documento há três planilhas, que você pode acessar na parte de baixo da página. Entre na planilha EHW. Se você não estiver acostumado a lidar com fórmulas no Excel, tente aprender agora. Se estiver acostumado, pode pular para o próximo parágrafo. Com a planilha aberta, repare que na célula A3 (coluna A, linha 3) foi colocado um valor de p (que pode ser, por exemplo, a freqüência do gene do alelo A). Você pode trocar este valor por qualquer outro entre 0 e 1. Repare que se você trocar o valor de A2, toda a planilha se modifica, a começar pelo valor de B3, que está programada para ter o valor 1- A3. Clique na célula A3 e confira. Repare que na célula B3 está escrito “=1-A3”. O sinal de igual (=) é necessário para informar ao Excel que você deseja inserir uma fórmula. A coluna C foi reservada para informações sobre as populações e relatar eventos. Em C3, por exemplo, está indicada a geração 1 da população, que foi produzida por acasalamentos ao acaso, e portanto está em Hardy-Weinberg. Clique na célula D3. Ela contém o número 36 (o p original é 0,6), portanto este valor corresponde a p 2 . Na célula D3 está inserida a fórmula “=A3^2*100”. Como você já deve ter percebido, o “^” é utilizado para elevar qualquer número a uma potência, no caso 2, porque queremos p 2 . Além disso, a fórmula contém um “*100”, que significa que estou querendo calcular as freqüências numa população com 100 indivíduos. Na célula E3, teremos “=2*A3*B3*100”, que em nosso caso é o 2pq, que prediz a proporção de heterozigotos. Da mesma forma, na célula F3 teremos q 2 (“=B3^2”). Nas células G3 e H3 temos a fórmula para inferir as freqüências de p e q a partir dos indivíduos (tente entender como estas fórmulas foram montadas). Como esta população foi artificialmente construída em H-W, obviamente a população está em H-W, o esperado é igual ao observado; e o χ 2 igual a zero. Na linha 4 está traçado o destino de alguns indivíduos da população. Neste caso específico, todos os indivíduos que nasceram com o genótipo a/a morreram. Você pode pensar, por enquanto, que a seleção natural agiu contra eles. Com isso, só sobraram os indivíduos A/a e a/a. Na linha 5 teremos então a nova composição da população nas células D5, E5 e F5. Em G5 e H5 temos novamente o cálculo das freqüências gênicas, só que agora da geração 2. Nas células I5, J5 e K5 temos o que seria esperado por H-W para esta população com o número de indivíduos na geração 2. EM L5, M5 e N5 temos o cálculo do qui quadrado nesta geração. Todos os χ 2 a serem calculados nesta planilha têm um grau de liberdade. Verifique uma tabela de χ 2. Tente entender todas as fórmulas presentes na linha 5. Na linha 6, simulamos que a geração 2 tenha se reproduzido e feito acasalamentos ao acaso e que foram gerados 100 zigotos. Tente compreender a linha 6 completa com base nas explicações das outras linhas. Agora você já deve ser capaz de compreender as outras linhas. É importante notar que as populações representadas nesta planilha sempre fazem acasalamentos ao acaso, i.e., aconteça o que acontecer aos adultos, aqueles que se reproduzem se acasalam aleatoriamentepara o lócus em questão. 9 Complicações da Dominância Em caracteres onde há dominância, o fenótipo do homozigoto dominante é exatamente igual ao fenótipo do heterozigoto, que se diferenciam do fenótipo homozigoto recessivo. Com isso, se quisermos fazer uma análise populacional, teremos duas classes observadas: o fenótipo dominante e o fenótipo recessivo. Pelo princípio de Hardy-Weinberg, as freqüências de A/A, A/a e a/a são, respectivamente, p2, 2pq e q2. Suponha que estejamos interessados nas freqüências dos alelos que determinam os grupos sanguíneos Rh+ e Rh- em uma população. Suponha ainda que 84% da população seja Rh+, sendo o resto da população Rh-. O fenótipo Rh+ pode ser dado pelos genótipos D/D e D/d, enquanto o Rh- é dado por d/d. Com isso, D/D e D/d estão juntos na mesma classe fenotípica. Para calcular as freqüências gênicas é portanto necessário assumir que este gene esteja em EHW. Assim: � � �� (5) � � !� � !0,16 � 0,4 Se p + q = 1, então p = 0,6. Assim, p2=0,36; 2pq=0,48 e q2=0,16. Para testar se estas freqüências estão em equilíbrio de Hardy-Weinberg, teríamos que comparar com as freqüências esperadas. Você já deve ter percebido que as freqüências esperadas são exatamente iguais às observadas. Além disso, o número de graus de liberdade é dado por número de classes observadas (2) -1 -1 = 0. Sem graus de liberdade não é possível fazer o teste. Com isso, se houver dominância (e isso é bastante freqüente nos caracteres em geral, inclusive em alguns marcadores moleculares), não é possível testar se a população está ou não em EHW, fazendo com que o equilíbrio tenha que ser inferido para que as outras análises sejam feitas. Conforme veremos mais adiante, se tivermos mais conhecimento sobre a população em estudo, este pode se tornar um problema menor e não prejudicar os resultados. Freqüência de Heterozigotos O princípio de Hardy-Weinberg também tem importantes implicações para a freqüência de heterozigotos que carregam alelos recessivos raros. Se a freqüência de heterozigotos pelo EHW é 2��, então o valor máximo de heterozigozidade ocorre quando as freqüências dos dois alelos é 0,5. (2�� = 0.5). Quanto maiores as diferenças entre as freqüências dos dois alelos, menor a heterozigozidade. Além disso, quanto menor a freqüência do alelo recessivo, maior a razão entre indivíduos heterozigotos e os homozigotos recessivos, em outras palavras, o excesso de heterozigotos sobre os homozigotos recessivos se torna progressivamente maior à medida que o alelo recessivo se torna mais raro. Como exemplo real, considere a fibrose cística, que atinge 1 em cada 1700 caucasianos nascidos. Com isso, a freqüência do alelo 10 recessivo é dada por � � " ##$%% � 0,024. Assumindo acasalamentos ao acaso, a frequencia de heterozigotos deve ser estimada em 2�� � 2 �0,024��0,976� � 0,047, cerca de 1 em 21. Em outras palavras, apesar de apenas 1 em 1700 pessoas serem afetadas, 1 em cada 21 caucasianos é portador do alelo recessivo para a fibrose cística. Veja o que acontece com a razão heterozigotos/homozigotos recessivos com diferentes valores de p e q: p Q 2pq q2 2pq/q2 0,5 0,5 0,5 0,25 2 0,6 0,4 0,48 0,16 3 0,7 0,3 0,42 0,09 4,67 0,8 0,2 0,32 0,04 8 0,9 0,1 0,18 0,01 18 0,95 0,05 0,095 0,0025 38 0,99 0,01 0,0198 0,0001 198 0,999 0,001 0,001998 0,000001 1998 O princípio de Hardy-Weinberg aplicado a 3 ou mais alelos: Conforme iremos perceber ao longo do curso, algumas violações aos pressupostos do princípio de HW são possíveis, um exemplo disso é o a violação do princípio 4, pelo qual os loci em análise devem ter apenas dois alelos. As freqüências genotípicas sob acasalamentos acaso para três alelos podem ser calculadas aplicando a distribuição binomial. Se pudermos considerar que os pares de acasalamento se formam aleatoriamente, podemos considerar que os gametas se combinam dois a dois de forma também aleatória. Só para recordar: �6� �' ( )�� � '� (� )� 2'( 2') 2() Se tivermos três alelos na população, por exemplo no sistema ABO, podemos dizer que o alelo IA tem freqüência p, IB tem freqüência q e i tem freqüência r. Suponha agora que numa cidade, o número de pessoas com sangue do tipo A seja de 2625, do tipo B seja de 570, do tipo O seja 2892 e do tipo AB seja 226. A melhor estimativa das freqüências alélicas (que não é um cálculo simples) é p=0,2593; q=0,0625 e r=0,6755. Calcule número esperado de indivíduos com cada tipo sanguíneo e diga se esta população está em EHW para este lócus. Fenótipo Genótipos frequencia genotípica Esperado Observado χ2 A IA/IA+ IA/i (0,2593)2 + 2 (0,2593 x 0,6755) 2636 2625 0,045887 B IB/IB+ IB/i (0,0625)2 + 2 (0,0625 x 0,6755) 557,7 570 0,270647 AB IA/IB 2 (0,2593 x 0,0625) 204,6 226 2,233894 O i/i (0,6755)2 2880,6 2892 0,04493 total 2,595357 g.l. = 4-1-1-1 = 1 χ2 (0,05) = 3,8 11 De forma geral, se tivermos n alelos: A1, A2, ..., An Com as freqüências p1, p2, ..., pn Então, as freqüências fenotípicas esperadas por acasalamentos aleatórios será: �*� �'�' +, -+.+/01+2+, 3*/3* 2�*�5 �'�' +, -�2��+/01+2+, 3*35 Se quisermos saber qual a proporção de homozigotos esperada por acasalamentos ao acaso, é só fazer o somatório da freqüência de todos os i alelos ao quadrado: �7� 6+.+/01+2+, �7�*� De forma análoga, e como a prole é formada apenas de homozigotos e heterozigotos, a proporção de heterozigotos esperada por acasalamentos ao acaso será dada por: �8� 6�2��+/01+2+, � 1 �7�*� Genes ligados ao cromossomo X Em mamíferos e em vários insetos, as fêmeas têm duas cópias do cromossomo X enquanto o macho só tem uma cópia (em geral acompanhada de um Y). Estes cromossomos se segregam, e metade dos espermatozóides de um macho contém um X e a outra metade um Y. Apesar do cromossomo Y carregar poucos genes, todos eles envolvidos com a masculinização; já o cromossomo X carrega tantos genes quanto qualquer outro cromossomo. Os alelos recessivos ligados ao X se expressam fenotipicamente nos machos, já que o alelo Y não contém o alelo compensador. Para genes ligados ao X com dois alelos, portanto, há três genótipos femininos (A/A, A/a e a/a) e somente dois genótipos masculinos (A e a). As conseqüências dos acasalamentos aleatórios em genes ligados ao X com dois alelos são mostradas na figura abaixo, onde os alelos são denominados XA e Xa. XA(pm) Xa(qm) Y XA (pf) pf x pm pf x qm pf Xa (qf) qf x pm qf x qm qf Note que nas fêmeas, que têm dois cromossomos X, a freqüência genotípica é dada pelo próprio EHW, enquanto que nos machos, que só têm 1, a freqüência genotípica é igual às freqüências dos alelos. Isso só é válido quando as freqüências entre machos e fêmeas são iguais. Quando as freqüências são diferentes, a freqüência do alelo A nos machos nesta geração (p’m) será idêntica à freqüência das fêmeas da geração anterior (pf), enquanto que a freqüência deste mesmo alelo nas fêmeas desta geração (p’f) será a média das freqüências alélicas nos machos e nas fêmeas da geração anterior (pf + pm/2). Com isso, se as freqüências alélicas entre 12 machos e fêmeas forem diferentes, serão necessárias 10 ou mais gerações até que a população entre em EHW (ou seja, até que as freqüências gênicas e genotípicas permaneçam inalteradas com o passar das gerações). �9� �8. � �� �10� �8� � �. ��2 Simulação: No PVANet, abra o documento X.xls. Este documento serve para você brincar com as freqüências dos alelos em machos e fêmeas de uma determinada população. Você pode modificar à vontade os valores que estão colocados nas células marcadas em amarelo, só tome o cuidado de inserir valoresentre 0 e 1. Repare que o gráfico se modifica cada vez que você muda os valores. Faça quantas simulações quiser com freqüências de machos e fêmeas diferentes e tente uma vez com freqüências iguais. Espera-se que a simulação o ajude a visualizar que em 10 gerações de acasalamentos ao acaso o equilíbrio de Hardy- Weinberg é atingido. Por outro lado, se as freqüências alélicas de machos e fêmeas forem iguais, o equilíbrio é atingido em apenas uma geração de acasalamentos ao acaso. Formação de casais e o princípio de Hardy-Weinberg Até agora, tratamos a formação dos zigotos em um “balde de gametas”, onde cada gameta feminino pode ser fecundado por qualquer gameta masculino, ou cada gameta masculino pode ser fecundado por qualquer gameta feminino e as probabilidades destes encontros acontecerem só dependem das freqüências alélicas nos gametas masculinos e femininos. No entanto, se pensarmos na maioria dos organismos de reprodução sexuada que conhecemos, as coisas podem não ser tão simples assim. Temos que admitir a existência de indivíduos que se acasalam, cada um com seu genótipo, o que é diferente de uma simples sopa de gametas. Para averiguar se o equilíbrio de Hardy-Weinberg se aplica a acasalamentos entre indivíduos, considere as freqüências dos alelos A e a como p e q. Considere as freqüências dos genótipos A/A = P; A/a = Q e a/a = R. Com isso, Parentais Prole Acasalamentos Freqüência A/A = P A/a =Q a/a =R A/A x A/A P2 1 0 0 A/A x A/a 2PQ ½ 1/2 0 A/A x a/a 2PR 0 1 0 A/a x A/a Q2 ¼ 1/2 1/4 A/a x a/a 2QR 0 1/2 1/2 aa x aa R2 0 0 1 Se a população estiver em EHW, então as freqüências alélicas não se alterarão na próxima geração, bem como as frequencias dos indivíduos com cada genótipo, assim: 13 P´ = P2 + ½ 2PQ + ¼ Q2 �11� 98 � 9� 1229: 1 4:� Substituindo: 98 � ����� 122�� 2�� 1 4 �2���� 98 � �; 2�<� 144���� 98 � �; 2�<�1 � �� ���1 � ��� 98 � �; 2�< � 2�; ���1 � 2� ��� 98 � �; 2�< � 2�; �� � 2�< �; 98 � �; 2�< � 2�; �� � 2�< �; �12� 98 � �� Ou seja, se a população estiver em EHW, na próxima geração a proporção de indivíduos A/A vai continuar sendo p2. 14 Capítulo 2 Endogamia Acasalamentos Preferenciais Introdução No capítulo anterior foi demonstrado que se os acasalamentos forem aleatórios, as populações têm proporções genotípicas equivalentes às calculadas pela distribuição binomial a partir de suas freqüências gênicas, ou seja, estão em Equilíbrio de Hardy-Weinberg. Com isso, se os indivíduos preferirem, por algum motivo, acasalar-se com indivíduos aparentados, a população sai do EHW. Este acasalamento preferencial por indivíduos aparentados pode ocorrer simplesmente porque indivíduos aparentados estão geograficamente próximos e isolados de outros indivíduos. Algumas cidades do interior de Minas Gerais são conhecidas pelo alto grau de endogamia na população. São cidades pequenas, onde as pessoas em geral guardam algum grau de parentesco umas com as outras e os casamentos entre primos são comuns. Alguns animais de hábito gregário também apresentam um alto grau de endogamia. Com isso, populações muito pequenas sempre apresentam algum grau de endogamia, já que os membros destas populações compartilham ancestrais recentes. Tecnicamente a endogamia é constituída pela ancestralidade comum entre pares de acasalamento. Para compreender a endogamia em termos populacionais, é preciso relembrar o que significa a endogamia em termos individuais. Se tivermos um acasalamento entre indivíduos aparentados, é possível que um fruto deste acasalamento tenha dois alelos idênticos por descendência (aid). O Box 2 mostra a probabilidade de termos 2 aid num casamento entre primos. Esta probabilidade é chamada de f. Se em uma determinada população o acasalamento entre indivíduos aparentados for comum, podemos pensar na probabilidade de encontrar um indivíduo que tenha dois alelos idênticos por descendência quando fazemos uma amostragem aleatória da população. Esta probabilidade é chamada de F, ou coeficiente de endogamia. Este F pode ser compreendido como uma medida populacional e não a simples probabilidade de um indivíduo ter dois alelos idênticos por descendência. Sendo assim, não basta saber quais as freqüências dos alelos na população para poder prever as freqüências genotípicas, como fazíamos com uma população em EHW, é preciso levar em conta o valor de F, ou a probabilidade de encontrar indivíduos com alelos idênticos por descendência, frutos de acasalamentos entre indivíduos aparentados. Para tentar compreender o que acontece quando há endogamia, pense numa planta que faz auto-fecundação (o grau máximo de endogamia que pode haver, cujo F=1). Se tomarmos um indivíduo heterozigoto, A/a (p = 0,5; q = 0,5). Na primeira geração, apenas metade de sua prole será heterozigota, a outra metade será dividida entre indivíduos A/A e a/a, que por sua vez só produzirão, deste ponto em diante, indivíduos homozigotos. Na segunda geração, somente metade dos heterozigotos gerará indivíduos heterozigotos e assim por diante. Isso significa que sob endogamia, o número de heterozigotos é reduzido a cada geração. Com isso podemos generalizar dizendo que quando há qualquer grau de endogamia, o número de heterozigotos é menor que o esperado pelo EHW. Em outras palavras, o número de homozigotos é maior que o esperado. Pensando em um lócus com apenas dois alelos, sabemos que se os acasalamentos fossem aleatórios, as freqüências genotípicas dependem apenas das freqüências gênicas e estão em 15 EHW. Agora, se pensarmos que numa população os acasalamentos entre primos é muito freqüente, então podemos utilizar o f calculado no Box2 (f = 1/16) como o F desta população. Em termos matemáticos, precisamos saber o quanto os homozigotos são aumentados e os heterozigotos diminuídos pela endogamia. Os cálculos em geral são bastante simples e intuitivos: Devemos primeiro calcular o quanto da heterozigozidade foi perdida devido à endogamia. Com isso devemos subtrair uma porção dos heterozigotos, que equivale a 1-F: �1� 3/' � 2���1� �� onde A/a é a proporção de heterozigotos, 2pq é a proporção esperada de heterozigotos pelo EHW. �2� 3/' � 2�� � 2��� Repare que 2pqF foi retirado dos heterozigotos, o que significa que este valor deve ser acrescentado aos homozigotos na mesma proporção, já que a soma das freqüências genotípicas em uma população sempre deve ser igual a 1. Assim: �3� 3/3 � �� ��� �4� '/' � �� ��� Onde A/A e a/a são as freqüências de homozigotos dominantes e recessivos e p2 e q2 são as freqüências esperadas destes genótipos pelo EHW. Estas fórmulas mostram a comparação das freqüências gênicas esperadas sob endogamia com as esperadas pelo EHW. Com a endogamia, há deficiência no número de heterozigotos igual a 2pqF e um excesso de cada homozigoto igual á metade da deficiência de heterozigotos (pqF). Mais adiante vamos lidar com a estatística F de Wright, uma importante ferramenta no estudo de genética de populações. Na estatística F a subdivisão das populações é encarada de modo hierárquico, para que uma descrição mais precisa da dinâmica populacional seja possível. Por enquanto, basta saber que o F que nós acabamos de descrever corresponde ao Fis, ou seja, o F medido entre os Indivíduos dentro de cada Subpopulação. Se �5� 3/' � 2�� � 2���=> E se os valores de p e q forem conhecidos, bem como a quantidade de heterozigotos presentes na população, então o F é dado por: �6� �=> � 2�� � 3/'2�� O ponto mais importante que deve ser observado é que a endogamia por si só não altera as freqüênciasgênicas de uma população. Conforme já foi dito, ela altera as freqüências 16 genotípicas, mas as freqüências gênicas permanecem inalteradas. Com isso, pode-se dizer que a endogamia isoladamente não é um mecanismo evolutivo, já que não provoca evolução. No entanto, se pensarmos em seleção natural + endogamia, o cenário se modifica. Imagine uma população que tenha a freqüência q de um alelo recessivo muito raro de 0,01. Pelo equilíbrio de Hardy-Weinberg, a probabilidade de se obter um indivíduo homozigoto para este alelo é q2 = 0,0001. No entanto, se houver endogamia, com F = 0,5, a probabilidade de se obter este indivíduo homozigoto sobe para q2 + 2pqF= 0,01 (100 vezes maior!). Assim, se este alelo recessivo for deletério, a chance de que seja detectado pela seleção natural é muito maior quando há endogamia do que quando os acasalamentos se dão ao acaso. Neste caso, a endogamia colabora para acelerar o processo de seleção natural e portanto colabora para que haja evolução. Falaremos mais sobre as conseqüências de endogamia combinada à seleção no capítulo dedicado à seleção natural. Cenário Adaptativo: Conforme veremos quando estudarmos seleção natural, as populações podem ser teoricamente colocadas em um cenário adaptativo. Imagine uma serra, como a Mantiqueira. Há picos e vales, comparáveis aos picos e vales adaptativos nos quais podem encontrar-se as populações. A coisa funciona mais ou menos assim: a seleção natural atua no sentido de manter as populações em picos adaptativos altos. Isso significa que sempre que aparecer um indivíduo menos adaptado, ele será eliminado pela seleção (deixará menos descendentes que os outros melhor adaptados e tenderá a ter seus alelos extintos pela seleção natural). No caso de doenças genéticas recessivas, a seleção natural só é capaz de eliminar indivíduos que sejam duplo recessivos. Com isso, e se houver acasalamentos ao acaso, muitos alelos recessivos deletérios são mantidos na população, escondido nos heterozigotos (ver item sobre heterozigozidade em EHW). No entanto, se por algum motivo uma população anteriormente panmítica começar a fazer acasalamentos endogâmicos, haverá uma alta freqüência de indivíduos duplo heterozigotos para os alelos recessivos (com freqüência q2 + pqF). Estes indivíduos serão obviamente banidos pela seleção natural. Com isso, o valor adaptativo médio da população cairá, de modo que a população entrará em um “vale adaptativo”. Se conseguir sobreviver a este vale, a população terá as freqüências dos alelos deletérios recessivos diminuída, de modo que vai começar a subir em outro pico adaptativo. Como estes alelos terão freqüência menor, o próximo pico adaptativo será ainda maior. A conclusão disso é que o início da endogamia em uma população anteriormente panmítica pode ter conseqüências terríveis para a população, e pode mesmo levá-la _à extinção. No entanto, com o passar das gerações, e se a população conseguir sobreviver, ela entrará em um novo pico adaptativo, mais alto. Ex: plantas cleistógamas População de samaritanos 17 Capítulo 3 Eventos Estocásticos Deriva Genética Introdução: Um dos pressupostos para que uma população permaneça em equilíbrio de Hardy-Weinberg e não tenha as freqüências alélicas modificadas ao longo das gerações é que ela tenha tamanho infinito. Dado que nenhuma população cumpre este requisito básico, pode-se concluir que nenhuma população permanece sem modificações nas freqüências gênicas. O mecanismo evolutivo envolvido no tamanho das populações é a deriva genética. Para entender o conceito de deriva genética, pense em um navio no meio do Oceano Atlântico, sem leme e sem vela. Diz-se que este navio está à deriva e é impossível saber onde vai atracar, já que certamente, mais cedo ou mais tarde, vai atracar em algum lugar (se ignorarmos a possibilidade de naufrágio, obviamente). Bom, com as freqüências gênicas em uma população ocorre um fenômeno similar: a cada geração a frequencia de um alelo aumenta ou diminui um pouco, fazendo com que mais cedo ou mais tarde acabe se fixando. Deriva Genética: As freqüências dos alelos podem variar ao acaso ao longo do tempo por um processo chamado de Deriva genética. Imagine uma população com 10 indivíduos, dos quais 3 têm o genótipo A/A, 4 apresentam o genótipo A/a e 3 o genótipo a/a. Existem, portanto, 10 alelos A nesta população e 10 a, de modo que a freqüência de cada gene é 0,5. Admita que a seleção natural não esteja atuando. Quais serão as freqüências gênicas na próxima geração? A resposta mais óbvia seria 0,5 de A e 0,5 de a. No entanto, esta é uma aproximação, não o que realmente ocorre. Isso acontece porque os genes que farão parte da próxima geração são uma amostra aleatória dos genes que fazem parte desta geração, portanto, se a população for infinita, a proporção dos genes será idêntica à da geração anterior. Se a população for finita, sempre haverá algum desvio. Fazendo uma analogia com um jogo de moedas, sabemos que a probabilidade de se obter cara ou coroa é 0,5. No entanto, se jogarmos a moeda apenas duas vezes, temos 50% de chance de obter duas caras ou duas coroas. Aumentando o número de jogadas, a probabilidade de se obter sempre caras ou sempre coroas diminui (0,5)n x 2. Assim, se jogarmos a moeda 3 vezes, teremos uma chance de 0,0625 x 2 = 0,125 de obtermos só caras ou só coroas, se jogarmos 10 vezes, esta chance cairá para 0,002 e assim por diante. Com isso, pode-se prever que quanto mais jogadas fizermos, maior será a probabilidade de termos proporções aproximadas a 50% caras e 50% coroas ao jogar uma moeda. Pensemos agora nos genes presentes em uma população. Se a população tiver 10 indivíduos, com 50% de cada alelo, A e a, a hipótese nula é a de que esta população tenha também 50% de cada alelo na próxima geração. No entanto, como são poucos os indivíduos, é possível que esta proporção seja levemente desviada. Ora, se nós definimos evolução como alteração das freqüências gênicas em uma população, isso significa que o simples fato de termos poucos indivíduos em uma população gera evolução, ou alteração nas freqüências gênicas da população. 18 Indo um pouco além, é possível perceber que mesmo numa população muito grande as freqüências gênicas não se mantêm absolutamente inalteradas de uma geração para a outra, e que sempre há um desvio. Como no caso do jogo de moedas, também pode-se inferir que quanto maior a população, menor o desvio das freqüências gênicas causado simplesmente pelo acaso. Deriva genética e amostra binomial. Considere uma população grande em EHW com alelos A e a em igual freqüência (1/2). Nesta população, as freqüências dos genótipos A/A, A/a e a/a são ¼, ½ e ¼, respectivamente. Suponha que quatro indivíduos tenham sido amostrados aleatoriamente desta população para formar uma colônia. É bem possível, só por acaso, que todos eles sejam A/A [(1/4)4 = 1/256]. De forma análoga é possível que os quatro sejam a/a. Qualquer outra combinação pode ser amostrada, e não é difícil trabalhar com as probabilidades de cada combinação a ser amostrada. Se a colônia continua tendo apenas 4 indivíduos, o mesmo tipo de amostragem ao acaso dos alelos ocorre a cada geração. Em cada geração, há uma oportunidade de uma grande modificação nas freqüências gênicas causadas pelo processo de amostragem. Uma conseqüência da deriva fica logo evidente: eventualmente a população será composta apenas de alelos A ou a. Uma vez que a população atinge este estado fixado, ela para de evoluir. Somente novas mutações ou imigrações podem reintroduzir a variação perdida. No exemplo acima, foram amostrados quatro indivíduos diplóides em cada geração, o que é equivalente a amostrar 8 gametas ao acaso do pool de gametas disponíveis. Isso é verdade se admitirmos que cada umdos quatro indivíduos produz um número infinito de gametas, que serão sorteados para formar a próxima geração. Neste sorteio, apenas 8 serão utilizados para formar a nova geração de indivíduos. Com 8 gametas, há nove possíveis combinações, sendo 0, 1, 2, 3, 4, 5, 6, 7 ou 8 alelos A e o restante a. A probabilidade de cada diferente combinação é dada pela distribuição binomial. Cada indivíduo será formado independentemente dos outros três, e cada alelo sorteado tem 50% de chance de ser um alelo A (esta chance, obviamente varia com a freqüência de A na população, neste exemplo estamos considerando que A e a têm a mesma freqüência, 0,5). Isso significa que a chance de sortearmos oito alelos A é (1/2)8, ou 1/256. Na amostragem de uma população finita, o processo de amostragem ocorre da maneira representada na figura acima. A cada geração, há N indivíduos diplóides na população. Independentemente da forma que a fertilização ocorre, pode-se imaginar o processo de amostragem como uma amostragem com reposição, de maneira que os indivíduos diplóides 19 contribuam com um pool gênico essencialmente infinito cuja freqüência alélica é a mesma presente nos adultos que os geraram. Deste pool infinito, 2N gametas são sorteados e unidos para formar a próxima geração. Sob este tipo de processo, espera-se que a distribuição das freqüências dos gametas seja binomial. Para dar um exemplo específico, uma população com nove indivíduos diplóides surge de uma amostra de apenas 18 gametas, mas estes gametas foram sorteados de um pool de gametas virtualmente infinito. Como pequenas amostras em geral não são representativas, as freqüências dos genes numa amostra assim tão pequena deve ser diferente do pool de gametas completo. Assim, quando o número de gametas na amostra é 18 (2N), a probabilidade de que uma amostra contenha exatamente i alelos A é a probabilidade binomial: �3.1� Pr�0� � A2�0 B�*��CD* Onde E�C* F significa ��C�!*!��CD*�!; � and � são, respectivamente, as freqüências alélicas de A e a no pool completo �� �� � 1; e 0 pode ter qualquer valor entre 0 e 2� . A nova freqüência na população do alelo A (�H� será então E *�CF porque, por definição, a freqüência do alelo A equivale ao número de alelos A (no caso i) dividido pelo total de alelos (no caso 2N). Na próxima geração, o processo de amostragem ocorre novamente, e a nova probabilidade do número de alelos A é dada novamente pela distribuição binomial, com o p agora substituído por p` e q por 1-p`. Com isso, as freqüências dos alelos muda ao acaso de uma geração para a outra. Uma simulação em computador mostra o comportamento de várias populações ao longo do tempo. Apesar de ser impossível prever o que acontecerá com cada população sob deriva, é possível prever o que acontecerá com um conjunto de populações. Acompanhe a simulação no Excel e conte quantas vezes cada um dos alelos se fixou, em quantas gerações. Modifique o p inicial e veja o que acontece! Um experimento clássico de Drosophila, envolvendo 107 subpopulações com 16 indivíduos em cada geração mostra o que acontece sob deriva depois de 19 gerações. Todas as populações começam com uma freqüência gênica de 0,5, e quase todas elas fixam A ou a (50% das vezes A e 50% das vezes a. Paralelismo entre deriva genética e endogamia: Considere quatro populações, cada uma começou com uma freqüência p=0,5 e cada uma evoluiu separadamente sob deriva e os acasalamentos ocorreram ao acaso. Depois de um determinado número de gerações, cada uma delas terá fixado um dos alelos, A ou a. Depois da fixação, os acasalamentos continuam ocorrendo ao acaso dentro de cada população. Com isso, a freqüência de heterozigotos dentro de cada população é exatamente a esperada pelo EHW. Se, no entanto, considerarmos as quatro subpopulações como uma única população, teremos a seguinte situação: suponha que duas das quatro populações fixaram o alelo A, enquanto as outras duas fixaram o alelo a. Com isso, a freqüência do alelo A considerando as quatro populações é 0,5. Se a freqüência de A é 0,5, esperamos uma freqüência de heterozigotos também de 0,5, mas na verdade não temos nenhum heterozigoto na população! Este efeito se 20 deve à subdivisão das populações e à deriva que ocorreu em cada uma delas, apesar dos acasalamentos continuarem sendo aleatórios. Este efeito é conhecido como efeito Wahlund. Estamos agora em condições de quantificar como populações divergem em freqüências alélicas sob deriva genética. Na aula passada, medimos a endogamia pelo coeficiente de endogamia, F, que é a probabilidade de sortearmos ao acaso numa população, dois alelos idênticos por descendência (ou autozigotos). Mesmo que os acasalamentos do exemplo anterior das quatro sub- populações tenham ocorrido ao acaso, quaisquer dois alelos podem ser idênticos por descendência, só por causa do tamanho pequeno das sub-populações. Portanto o valor de Ft não pode ser zero. Repare na figura acima, ela mostra os 2N alelos da geração t-1. Quando da amostragem dos alelos para formar a geração t, o primeiro alelo a ser amostrado pode ser qualquer um da geração t-1, com igual probabilidade. A probabilidade de que o segundo alelo seja igual ao primeiro é 1/2N, porque esta é a freqüência de cada um dos alelos da geração anterior. Por outro lado, a probabilidade de que o segundo alelo seja diferente do primeiro é 1 – 1/2N. No primeiro caso, a probabilidade de que os dois alelos sejam idênticos por descendência é igual a 1 (F=1); no segundo caso, a probabilidade de que os dois alelos sejam idênticos por descendência é Ft-1, ou seja, a probabilidade de que estes dois alelos já fossem idênticos por descendência na geração passada. Juntando os dois casos: Multiplicando ambos os lados por -1, e somando 1 temos: E, portanto: Quando F0 = 0: 21 Demonstrando a fórmula. Considere duas gerações seguidas �3.5� 1 � �IJ � A1 � 12�B�1 � �IK� �3.6� 1 � �IK � A1 � 12�B �1 � �IL� Substituindo 5 em 6: �3.7� 1 � �IJ � A1 � 12�BA1 � 1 2�B M1 � �ILN �3.8� 1 � �IJ � A1 � 12�B � M1 � �ILN Então: �3.9� 1 � �I � A1 � 12�B I �1 � �%� Quando F0 = 0: �3.10� �I � 1� A1 � 12�B I Ou seja, o F aumenta um pouco a cada geração, e este aumento é inversamente proporcional ao tamanho populacional. Tamanho efetivo Nos cálculos mostrados até então, consideramos sempre populações de tamanho estável geração após geração. Em situações reais, no entanto, isso não é tão simples assim, e as populações variam de tamanho de uma geração para a outra. Além disso, outro pressuposto que está implícito nas fórmulas é que o número de machos e fêmeas é igual. Para corrigir isso, em populações reais, é preciso calcular o tamanho efetivo da população (Ne), que seria o tamanho teórico da população que teria o mesmo nível de deriva que a população real. Isso é necessário para que possamos utilizar a equação 4 e calcular o aumento do F ao longo das gerações em populações isoladas. Pensemos um pouco. Se tivermos uma população com um tamanho populacional bem grande, e em uma determinada geração acontecer uma catástrofe e grande parte dos indivíduos morrerem. Obviamente sobreviver à catástrofe não é uma questão de seleção natural, já que, só por acaso, o indivíduo mais fértil e que atrai mais fêmeas pode ter levado uma pedrada na cabeça quando o vulcão começou a entrar em atividade. Se não foi seleção, foi o acaso... Então Suponha que esta população tenha o mesmo número de machos e fêmeas, e que isso continuou assim após a catástrofe. 22 Após a catástrofe e depois que a lava esfriou, a terra ficou mais fértil, os competidores também tiveram suas populaçõesreduzidas bem como os predadores. A população em questão aumentou violentamente em poucas gerações. Com isso, antes da catástrofe nossa população tinha 10000 indivíduos, a catástrofe matou 9900 e deixou apenas 100 indivíduos na população. O aumento subseqüente elevou o número de indivíduos para 50000. Agora precisamos pensar como calcular os efeitos da deriva nesta população, ou o aumento do valor do F. A primeira coisa que precisamos saber é o 2N que precisaremos utilizar. Se a população tivesse mantido constante seu tamanho, o 2N seria o tamanho populacional a cada geração. No entanto, não foi isso que aconteceu, e precisamos calcular o tamanho efetivo. Lembre-se de que quanto menor a população maior o efeito da deriva (ou da amostragem dos genes geração a geração). Se em algum momento a população foi muito reduzida, nesta geração o efeito da amostragem foi mais drástico, portanto espera-se uma redução na variabilidade genética nesta população – redução na variabilidade leva à diminuição do tamanho efetivo. Estudos empíricos em populações de laboratório demonstraram que a melhor forma de calcular o tamanho efetivo de populações que variaram muito em tamanho é calcular a média harmônica do tamanho populacional ao longo de gerações, assim: �11� 1�O � 1 2 A 1 �% 1 �# 1 �� P 1 �ID#B No nosso exemplo: # CQ � # < E ##%%%% ##%% #R%%%%F = 272,2 Outro fator que interfere no tamanho efetivo de uma população é a proporção de machos e fêmeas (sex ratio). Isso acontece porque metade dos alelos em cada geração tem necessariamente que provir de cada um dos sexos, e qualquer desvio à razão sexual aumenta as chances de ocorrer deriva. Em alguns países a caça de algumas espécies é liberada e pede- se em geral que sejam mais visados os machos que as fêmeas, já que um único macho pode fecundar um número bem grande de fêmeas. Se pensarmos em termos de deriva genética e variabilidade populacional, isso se constitui num desastre. Numa população de indivíduos que se reproduzem sexuadamente, o tamanho real é: �12� �S � �T �U Nr = Nm + Nf, No entanto, to amanho efetivo é: �13� �OV 4�T�U�T �U 23 Capítulo 4 Estrutura Populacional Introdução: A estruturação populacional é quase universal entre os organismos, e onde há estrutra, certamente há diferenciação genética entre populações ou sub-populações, o que significa que estas sub-populações apresentam freqüências alélicas diferentes para um determinado locus ou vários loci. A estruturação pode ser o resultado da seleção natural atuando de formas diferentes em populações diferentes ou pode ser simplesmente o resultado da deriva genética, atuando em populações isoladas. Estrutura Populacional Hierárquica: Uma população apresenta estrutura populacional hierárquica quando suas sub-populações podem ser agrupadas em níveis progressivamente inclusivos nos quais os grupos pequenos estejam incluídos em grupos maiores, que por sua vez possam ser incluídos em grupos ainda maiores e assim por diante. Com isso, pode-se dizer que uma espécie tem distribuição disjunta, ocupando grandes regiões geográficas, e que cada região contenha populações isoladas, que por sua vez contêm sub-populações, que por sua vez podem estar subdivididas em famílias, associações, colônias etc. Reduções na Heterozigozidade: Segundo o princípio de Hardy-Weinberg (capítulo 1), se em uma população os acasalamentos se derem ao acaso, e se um determinado lócus tiver dois alelos com freqüências p e q, a freqüência esperada de heterozigotos é dada por 2pq. Aprendemos também, nos capítulos 2 e 3 desta apostila, que tanto a endogamia quanto a deriva genética provocam diminuição da heterozigozidade, e que esta diminuição pode ser medida pelo coeficiente de endogamia, ou F (probabilidade de sortear um indivíduo com dois alelos idênticos por descendência). O F populacional é calculado com base nas freqüências observadas esperadas de heterozigotos, seguindo o raciocínio de que o F mede a diminuição da heterozigozidade numa população, de modo que: �1� 3/' � 2�� � 2��� Ou �2� � � 2�� � 3/'2�� Seria interessante então poder diferenciar a diminuição da heterozigozidade provocada pela endogamia da provocada pela deriva genética. No capítulo 2, foi mencionada a estatística F de Wright, mais especificamente, foi mencionado o FIS, que se refere ao aumento da probabilidade de sortearmos, dentro de cada sub-população um indivíduo contendo dois alelos idênticos por descendência. Este aumento se deve aos acasalamentos ocorrerem preferencialmente entre indivíduos aparentados dentro de uma sub-população, ou seja, este 24 aumento se deve aos efeitos da endogamia. Se estivermos trabalhando com várias sub- populações e quisermos medir o efeito da endogamia em todas elas ao mesmo tempo, temos que calcular, para as n sub-populações amostradas, a média observada de heterozigotos, e chamaremos esta média de HI. �3� 6=V6# 6� 6< P 6WX Teremos também que calcular as freqüências esperadas de heterozigotos em cada população (2piqi) e calcular a média para todas as sub-populações. Chamaremos esta média de HS: �4� 6> � 2�#�# 2���� 2�<�< P 2�W�WX A partir de HS e HI, seremos capazes de calcular o FIS, ou seja, a probabilidade de sortear um indivíduo com dois alelos idênticos por descendência em uma população que se deve exclusivamente à endogamia dentro das subpopulações. �5� �=> � 6> � 6=6> É possível também calcular o F devido à sub-estruturação da população (FST), ou seja, calcular o F devido à deriva genética. Sabemos que o efeito da deriva é diferenciar as sub-populações isoladas pela fixação de alelos (dentro de cada sub-população a variabilidade diminui, mas ela aumenta entre subpopulações). Para este cálculo, devemos considerar o HS calculado acima e estimar o HT, que é a heterozigozidade esperada para a população como um todo, ou seja, a heterozigozidade calculada a partir das freqüências médias de p e q (�̂ � �Z� para todas as populações: �6� �̂ � �# �� �< P �WX �7� �Z � 1 � �̂ �8� 6[ � 2�̂�Z �9� �>[ � 6[ �6>6[ É possível também calcular o F total, ou seja, a probabilidade de sortear um indivíduo com dois alelos idênticos por descendência em uma população sem associar esta probabilidade à deriva ou à endogamia (FIT). Para isso é necessário utilizar o HI e o HT. �10� �=[ � 6[�6=6[ Em suma, a estatística F de Wright, ou o índice de fixação, equivale à redução na heterozigozidade esperada sob acasalamentos ao acaso em qualquer nível da hierarquia populacional relativo a qualquer outro nível mais inclusivo. Para calcular estes índices, basta saber qual seria a heterozigozidade esperada para um determinado nível (calculada a partir das freqüências de p e q no nível desejado) e comparar com a heterozigozidade esperada em um outro nível hierárquico. Estes cálculos são úteis para, por exemplo, saber se há mais 25 diferenciação entre sub-populações de regiões climáticas diferentes ou se a variação está uniformemente dividida entre todas as sub-populações. Outro aspecto interessante da estatística F é poder separar fenômenos diferentes, tais como a endogamia e deriva, já que a primeira diz respeito a aspectos comportamentais dos indivíduos, enquanto a segunda diz respeito à estruturação populacional. 26 Capítulo 5 Fontes de Variação Mutação, Recombinação e Migração Existem vários processos que criam novos tipos de variação genética nas populações ou que permitem a reorganização da variação pré-existente, tanto dentro de genomas quanto dentro e entre sub-populações. A única fonte efetiva de variação genética é a mutação,ou seja, qualquer modificação herdável no material genético. Por mutações entendemos mutações de ponto (modificações de uma única base), inserções e deleções em um único gene ou rearranjos cromossômicos. A recombinação permite que mutações que ocorreram em diferentes genes e em diferentes indivíduos fiquem juntas em um único cromossomo. A migração permite que as mutações se espalhem entre as sub-populações. Mutação: Conforme já foi dito, a mutação é a única fonte efetiva de variação genética para que as modificações evolutivas ocorram. No entanto, a maior parte dos genes muta em uma taxa extremamente baixa (na ordem de 10-4 a 10-6 novas mutações por gene por geração). Mesmo uma taxa tão baixa de mutação pode criar muitos alelos mutantes já que, em uma população grande, cada um dos genes está sujeito a mutações. Numa população de N organismos diplóides, há 2N cópias de cada gene, e cada uma pode mudar em cada geração. Só para tomar como exemplo, se a taxa de mutação em humanos for de 10-9 por par de nucleotídeos por geração, então em cada gameta humano (cujo DNA tem aproximadamente 109 pares de nucleotídeos), haverá em média uma nova mutação em cada geração. Com isso, cada óvulo fertilizado conterá em média 2 novas mutações. A população humana atual tem 6 bilhões de indivíduos, os quais devem conter aproximadamente 12 bilhões de novas mutações que não estavam presentes na geração anterior. Modelo 1: Mutações Irreversíveis: Neste modelo, uma mutação cria um novo alelo, que não estava anteriormente presente na população. Isso significa que a freqüência inicial do novo alelo é muito pequena se a população for grande (sua freqüência inicial na população é 1/2N). Mutações recorrentes nas gerações subseqüentes podem aumentar o número de alelos mutantes, mas este fenômeno por si só aumenta a freqüência dos mutantes de forma muito lenta. Considere que o alelo A é o selvagem, enquanto a é o alelo mutante. Se houver exatamente uma mutação por geração, então a freqüência do alelo a aumentará de acordo com a seqüência 1/2N, 2/2N, 3/2N,... Portanto, a tendência de modificação das freqüências alélicas como resultado de mutações recorrentes (pressão de mutação) é muito pequena. Por outro lado, o efeito cumulativo das mutações por longos períodos de tempo pode ser apreciável. Uma modificação do modelo de Hardy-Weinberg pode ser bastante útil para estudar os efeitos das mutações. Consideraremos por hora apenas mutações com efeito tão pequeno na aptidão do organismo que a seleção natural não é capaz de alterar a freqüência destas mutações. Também assumiremos que as mutações são irreversíveis, o que significa que um alelo a não sofre mutação reversa para A. Para evitar complicações resultantes das modificações das freqüências alélicas devidas ao acaso, também consideraremos populações de tamanho infinito. 27 Considere um gene com dois alelos A e a e suponha que A muta para a numa taxa de μ mutações por alelo A por geração (i.e. cada alelo A tem uma probabilidade μ de mutar para a em cada geração). Seja pt a freqüência de A e qt a freqüência de a na geração t (onde t = 0, 1, 2...). Em cada geração, pt + qt =1, já que A e a são os únicos alelos considerados. Agora deduziremos a formula de pt (freqüência de A na geração t) em termos de pt-1 (freqüência de A na geração anterior). Na geração t, pt inclui todos os alelos A da geração t que não mutaram nesta geração, ou seja: No entanto, pelo mesmo raciocínio, pt-1 inclui todos os alelos A da geração t-1 que não mutaram naquela geração, ou seja: Substituindo 5.2 em 5.1, temos: Seguindo este raciocínio, teremos: Simulação: No PVANet, abra o documento mutação.xls. Abra a planilha “Recorrentes”. Modifique à vontade os valores de μ e de p. Veja como pequenos aumentos da taxa de mutação aumentam a velocidade de modificações nas freqüências gênicas. Repare na escala do eixo X. A figura a seguir mostra o efeito da pressão de mutação no caso de μ = 10-4. A freqüência do alelo A diminui muito devagar: 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0 10000 20000 30000 40000 50000 fr e q u e n ci a d e A Número de gerações Efeito das Mutações Recorrentes 28 Modelo 2: Mutações Reversíveis: Neste modelo, além da mutação de A para a, consideraremos também a mutação de a para A. Neste caso, a pressão de mutação sobre a freqüência de p ocorre em ambas as direções. A primeira tende a diminuir p (como a mostrada acima) e a reversa gente a aumentar p. Eventualmente uma situação de equilíbrio, na qual a frequencia de p fica constante de uma geração para a outra, é alcançada. Neste ponto de equilíbrio, a perda de alelos A pela mutação direta é compensada pelo ganho de alelos A pela mutação reversa. Considere que a taxa de mutação direta é μ e a taxa de mutação reversa é v. Sejam pt e qt as freqüências dos alelos A e a na geração t, de modo que pt + qt =1. Um alelo A na geração t pode ter se originado de uma de duas maneiras: ele pode ser um A da geração t-1 que não mutou para a (com probabilidade de 1- μ), ou pode ser um alelo a da geração t-1 que mutou para A (com probabilidade v). Assim: �5.5� �I � �ID#�1 � µ� �1 � �ID#�] (não se esqueça que 1- pt-1 = qt-1 ) �I � �ID# � �ID# � �ID#^ ] � �ID#] � �ID# �I � �ID# � ��ID#^ ] � �ID#] �I � �ID# � ��ID#�^ ]� ] �I � ��ID#�^ ]� ] �ID# �5.6� �I � �ID#�1 � ^ � ]� ] Para resolver este tipo de problema, é necessário fazer um truque matemático e expressar como a fórmula (5.5) pode ser expressa em termos de: (5.7) �I � 3 � ��ID# � 3�_, onde A e B são constantes dependentes apenas de μ e v. Note que em 5.6 colocamos a equação de forma que pt menos uma constante (A) é igual a pt- 1 menos esta mesma constante (A) multiplicado por outra constante (B). Esta forma é conveniente porque nos permite inferir pt a partir de pt-1 multiplicado por uma constante, que simboliza as modificações com o número de gerações. Simplificando 5.6 teremos: �I � �ID#_ � 3_ 3 Ou �5.8� �I � �ID#_ 3�1 � _� Igualando as equações 5.6 e 5.8, temos que 29 _ � 1� ^ � ] e 3 � `ab` Então, podemos utilizar a fórmula 5.7, substituindo os valores de A e B: (5.9) �I � `ab` � E�ID# � `ab`F �1 � ^ � ]� Fazendo novamente a indução matemática: �5.10� �ID# � ]c ] � E�ID� � ] c ]F �1 � ^ � ]� Substituindo 5.10 em 5.9: �I � ]c ] � E�ID� � ] c ]F �1 � ^ � ]��1 � ^ � ]� �I � ]c ] � E�ID� � ] c ]F �1 � ^ � ]�� �5.11� �I � ]c ] � E�% � ] c ]F �1 � ^ � ]�W Repare que no início, o último termo à direita é praticamente igual a 1, mas que à medida que o tempo passa, e o número de gerações se torna muito grande,este termo tende a zero. Repare ainda que para obter pt, temos que utilizar a fórmula da seguinte maneira: �5.12� �I � E�% � ]c ]F �1 � ^ � ]�W ] c ] Com isso, à medida que aumenta o número de gerações, pt tende a se igualar a ser simplesmente v/(u+v), não se modificando mais com o aumento do número de gerações, ou seja, entra em equilíbrio. A figura abaixo mostra o comportamento de duas populações, a primeira com p0 =1 e a segunda com p0 =0. As taxas de mutação utilizadas para construir o gráfico foram μ = 10 -4 e v = 10-5. 30 Probabilidade de fixação de um novo alelo mutante neutro Nos modelos anteriores assumimos que as populações têm tamanhos efetivos infinitos, o que não é nada realístico. Num modelo mais acurado no qual a população é finita, as modificações na freqüência de um alelo mutante depende não apenas da pressão de mutação, mas tambémdos sorteios aleatórios geração após geração (deriva genética). Já aprendemos no capítulo 2 sobre deriva genética que amostras aleatórias do pool gamético podem fazer com que alguns alelos sejam super-amostrados na geração t + 1 em relação à sua freqüência na geração t. Por outro lado, outros alelos podem ser sub-amostrados. De fato, qualquer alelo tem uma boa chance de ser pouco representado na próxima geração, fazendo com que ele se extinga da população. Para ser preciso, cada alelo da geração t tem uma chance de aproximadamente 1/e =0,368 de não ser representado na geração t + 1. Para entender por quê, considere um alelo α1 . A frequencia de α1 no pool gamético é 1/2N e a frequencia de todos os outros alelos é 1-1/2N. Como os genótipos da geração t+1 são formados a partir do pool em sorteios aleatórios de 2N alelos, a distribuição do número de alelos α1 e não- α1 na geração t+1 é dada por: Onde α representa todos os alelos não α1. Portanto a probabilidade de que α1 não seja representado em t+1 é: É interessante notar que este número é quase uma constante de fato. Mesmo quando o tamanho populacional é muito pequeno, os valores são bem parecidos. A tabela abaixo mostra o resultado da equação 5.14 para diferentes tamanhos populacionais. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 10000 20000 30000 40000 50000 F re q . p Número de Gerações mutações reversíveis p0=1 p0=0 31 N Ad � d�eB �e 2 0.316406 10 0.358486 20 0.363232 50 0.366032 100 0.366958 500 0.367695 1.000 0.367787 10.000 0.367870 1.000.000 0.367879 1.000.000.000 0.367879 6.000.000.000 0.367879 O importante da equação 5.14, é que, devido à deriva genética, cada alelo tem um risco substancial de se extinguir em cada geração. À medida que o tempo passa, as linhagens progressivamente desaparecem, uma a uma ou em pequenos grupos. Eventualmente se atinge uma situação no qual todas as linhagens alélicas, exceto uma, se extinguiram. Neste ponto, todos os alelos da população serão idênticos por descendência de um determinado alelo presente na população ancestral. Com isso, neste ponto de equilíbrio, todos os alelos presentes em uma população podem ser descendentes de um novo mutante que surgiu na população há várias gerações. Assim, existe uma probabilidade de que uma mutação neutra nova eventualmente se fixe na população, e esta probabilidade é igual à freqüência inicial do novo alelo na população (1/2N). Repare que, quanto menor for a população, maior será a probabilidade de que um novo alelo mutante se fixe nesta população. Este processo de fixação, porém, leva um tempo, em média 4N gerações (ou seja, quanto menor for a população, mais rápido o novo alelo irá se fixar). Modelo de alelos infinitos Lembre-se que considerar apenas dois alelos por genes é apenas uma simplificação para melhor compreendermos como funciona a genética de populações. Na verdade, a maioria dos genes tem muito mais que dois alelos. Isso é muito importante para definir o nível de variação genética sob pressão de mutação. Uma medida conveniente da variação genética é a heterozigozidade (proporção de genótipos heterozigotos). Se um gene apresenta maior heterozigozidade que a esperada sob a pressão de mutação, então outras forças que operam na natureza tendem a preservar a variação genética. Por outro lado, se um gene apresenta menor heterozigozidade que a esperada pela pressão de mutação, então estas forças tendem a eliminar a variação genética. A heterozigozidade de um gene é função do número de alelos e de sua freqüência relativa (veja a tabela da página 10). Em princípio, o número de alelos de qualquer gene pode ser muito grande. Por exemplo, uma proteína com 300 aminoácidos é codificada por uma seqüência de 900 nucleotídeos. Como cada nucleotídeo pode potencialmente ser um A, um C, um G ou um T, o número de alelos possíveis é 4900, que equivale a aproximadamente 10542. Assim, podemos supor que cada nova mutação cria um alelo que não existia na população. Isso é o chamado “modelo de alelos infinitos”. Apesar de ser uma visão um tanto simplificada das mutações, este modelo fornece pode ser bastante útil na comparação com modelos mais complexos de freqüências observadas de freqüências alélicas. 32 No modelo de alelos infinitos, dois alelos idênticos são necessariamente idênticos por descendência, por causa do pressuposto que cada mutação cria um único alelo. Com isso, neste modelo, todos os genótipos homozigotos são também autozigotos. Para medir a homozigozidade, teremos que medir a autozigozidade. Considere que Ft é a probabilidade de que, na geração t, dois alelos sorteados ao acaso sejam idênticos por descendência, ou seja, um indivíduo tomado ao acaso tenha dois alelos idênticos por descendência (seja um autozigoto). Com isso Ft mede a autozigozidade na geração t. Pela fórmula 3.2, que mede o efeito do aumento de F devido à deriva genética, �3.2� �I � 12� A1 � 1 2�B�ID# O F aumenta a cada geração devido ao sorteio aleatório dos alelos, que podem ser idênticos por descendência por dois motivos: (i) o mesmo alelo presente na geração t -1 foi sorteado duas vezes, com probabilidade 1/2N; (ii) dois alelos diferentes de t-1 foram sorteados, mas estes dois alelos já eram idênticos por descendência em t-1, com probabilidade (1-1/2N) Ft-1. Se incluirmos mutações nesta fórmula, teremos que considerar que o termo 1/2N só aumentará o F se nenhum dos dois alelos idênticos por descendência sofrer mutação. Ou seja, o termo deve ser multiplicado por (1-μ)2. A potência de dois indica que nenhum dos alelos pode ter sofrido mutação. Da mesma forma, o termo (1-1/2N) Ft-1 só pode aumentar o valor de F se nenhum dos alelos que eram idênticos em t-1 e foram sorteados em t sofrer mutação. Com isso, este termo também deve ser multiplicado por (1-μ)2. A fórmula geral do modelo de alelos infinitos fica então assim: �5.15� �I � A 12�B�1 � ^�� A1 � 1 2�B�1 � ^���ID# Reparando bem na fórmula, o efeito dos sorteios da deriva faz o F aumentar, no entanto, o efeito das mutações faz o F diminuir, de modo que eventualmente o F para de se modificar, atingindo um ponto de equilíbrio. O valor do F no ponto de equilíbrio é dado por �f, no qual �f � �I � �ID#. Substituindo �I e �ID# por �f na equação 5.15 e ignorando os termos contendo μ2 , bem como μ/2N (porque são termos muito pequenos), a solução é: �5.16� �f � 11 4�^ Demonstrando: �f � A 12�B �1 � ^�� A1 � 1 2�B�1 � ^���f �f � A 12�B�1 � 2^ ^�� A1 � 1 2�B�1 � 2^ ^���f �f � 12� �1 � 2^ � 1 2���f 33 Dividindo os dois termos por �f: 1 � 12��f 1 � 2^ � 1 2� 1 2��f � 1 � 1 2^ 1 2� 1 2��f � 4�^ 1 2� �f � 14�^ 1 O �f assim calculado é uma excelente aproximação dos efeitos da deriva e da mutação considerados juntos. Segundo este modelo, o número de alelos seletivamente neutros sob pressão de umatação aumenta até que F atinja o ponto de equilíbrio (�f), que também é o valor de equilíbrio da autozigozidade. Como um dos pressupostos do modelo de alelos infinitos é o de que cada alelo só surge uma vez por mutação, todos os genótipos homozigotos são de fato autozigotos. Portanto, o �f também pode ser interpretado como o valor de equilíbrio da proporção de homozigotos. A equação 5.16, portanto, oferece o equilíbrio da homozigozidade na população sem qualquer referência às freqüências alélicas. O meio normal de calcular a homozigozidade esperada com acasalamentos ao acaso para n alelos é: �5.17� 7�#� ��� �<� P �W� W *V* Temos por tanto duas expressões para o equilíbrio da homozigozidade nas formas das equações 5.16
Compartilhar