Baixe o app para aproveitar ainda mais
Prévia do material em texto
DEPARTAMENTO DE BIOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA E MELHORAMENTO DE PLANTAS NOTAS DE AULAS GENÉTICA DE POPULAÇÕES Prof. César A. Brasil P. Pinto LAVRAS 2013 i ii SUMÁRIO 1. Introdução....................................................................................................................................... 1 2. Sistemas de Acasalamentos............................................................................................................ 4 2.1. Predominantemente alógamas.................................................................................................. 4 2.1.1 Desequilíbrio de ligação ou desequilíbrio gamético............................................................... 9 2.2. Predominantemente autógamas.................................................................................................. 18 2.3. Acasalamentos mistos................................................................................................................. 19 2.4 Exercícios..................................................................................................................................... 24 3. Medidas de variação e distância genética...................................................................................... 27 3.1. Medidas de Variação genética.................................................................................................... 27 3.2. Medidas de distâncias (similaridade) genéticas......................................................................... 29 3.2.1. Distância genética de Nei................................................................................................. 30 3.2.2. Distância Euclidiana......................................................................................................... 30 3.2.3. Distância generalizada de Mahalanobis........................................................................... 31 3.2.4. Distância de Rogers.......................................................................................................... 32 3.2.5. Coeficientes de similaridade............................................................................................. 32 3.3. Exercícios.................................................................................................................................... 34 4. Relações genéticas entre parentes.................................................................................................. 36 4.1. Estimativa dos coeficientes de parentesco e de endogamia.................................................. 36 4.2. Sistemas regulares de endogamia........................................................................................... 42 4.2.1. Autofecundação................................................................................................................ 42 4.2.2. Retrocruzamento............................................................................................................... 43 4.2.3. Irmãos germanos............................................................................................................... 44 4.2.4. Meios irmãos..................................................................................................................... 44 4.2.5. Endogamia parcial............................................................................................................. 44 4.3. Exercícios................................................................................................................................ 47 5. Deriva genética............................................................................................................................... 48 5.1. Amostragem............................................................................................................................ 50 5.2. Endogamia.............................................................................................................................. 56 5.3. Tamanho efetivo das populações........................................................................................... 61 5.4. Exercícios................................................................................................................................ 66 6. Alteração nas frequências alélicas – Processos Sistemáticos........................................................ 68 6.1. Seleção.................................................................................................................................... 68 6.2. Migração................................................................................................................................. 78 6.3. Mutação................................................................................................................................... 80 6.4. Exercícios................................................................................................................................ 83 iii 7. Componentes dos valores fenotípicos e suas variâncias............................................................... 84 7.1. Efeitos gênicos........................................................................................................................ 84 7.1.1. Efeito médio de um alelo.................................................................................................. 88 7.1.2. Efeito de uma substituição alélica.................................................................................... 89 7.2. Valor genético ou reprodutivo................................................................................................ 90 7.3. Desvio de dominância............................................................................................................ 91 7.4. Desvio de interação................................................................................................................ 92 7.5. Variâncias............................................................................................................................... 94 7.5.1. Componentes genéticos da variância............................................................................... 95 7.5.2. Variâncias em populações endogâmicas.......................................................................... 97 7.5.3. Variância devido ao desequilíbrio de ligação.................................................................. 100 7.5.4. Variância da interação genótipo x ambiente.................................................................... 102 7.5.5. Variância ambiental.......................................................................................................... 102 7.6. Exercícios................................................................................................................................ 103 8. Covariância entre parentes............................................................................................................. 105 8.1. Covariância genética............................................................................................................ 106 8.2. Interação epistática............................................................................................................... 111 8.3. Covariância ambiental.......................................................................................................... 111 8.4. Componentes da variância genética em função das covariâncias entre parentes............... 112 8.4.1. Covariância pai-filho......................................................................................................... 112 8.4.2. Dialelos..............................................................................................................................113 8.4.3. Delineamento I de Comstock e Robinson........................................................................ 114 8.4.4. Delineamento II de Comstock e Robinson...................................................................... 114 8.5. Exercícios............................................................................................................................. 116 Referências 1. BROWN, A.H.D.; CLEGG, M.T.; KAHLER, A.L. & WEIR, B.S. (Eds.) Plant Population Genetics, Breeding, and Genetic Resources, Sinauer Associates Inc., Sunderland, 448p. 1990. 2. CROW, J.F. & KIMURA, M. An Introduction to Population Genetics Theory, The Blackburn Press, 608p. 2009. 3. CRUZ, C.D.; FERREIRA, F.M. & PESSONI, L.A. Biometria Aplicada ao Estudo da Diversidade Genética. Universidade Federal de Viçosa, 620p. 2011. 4. FALCONER, D.S.; MACKAY, T.F.C. Introduction to Quantitative Genetics, 4th ed., Longman, Essex, England, 464p. 1996. 5. HAMILTON, M.B. Population Genetics, Wiley-Blackwell, Oxford, 407p, 2009. 6. HARTL, D.L. & CLARK, A.G. Princípios de Genética de Populações, 4ª ed., Artmed Editora SA., Porto Alegre, 659p. 2010. iv 7. HEDRICK, P.W. Genetics of Populations, 4th edition, Jones and Bartlett Publishers, Sudbury, 700p., 2009. 8. LI, C.C. First Course in Population Genetics, Boxwood Press, Pacific Groove, 631p. 1978. 9. LYNCH, M.; WALSH, B. Genetics and Analysis Of Quantitative Traits. Sinauer Associates, Inc. Publishers, Sunderland, 980, 1998. 10. METTLER, L.E. & T.G. GREGG. Genética de Populações e Evolução, VENCOVSKY, R.; AZEVEDO, J.L. & BANDEL, G. (Trad.) Poligono, São Paulo, 262p. 1969. 11. PIRCHNER, F. Population Genetics in Animal Breeding, 2nd ed., Plenum Press, New York, 414p. 1983. 12. SOUZA JR., C.L. Componentes Da Variância Genética E Suas Implicações no Melhoramento Vegetal, FEALQ, Piracicaba, 134p. 1989. 13. TEMPLETON, A.R. Population Genetics and Microevolutionary Theory. John Wiley & Sons, Inc., 705p., 2006. 14. WEIR, B.S. Genetic Data Analysis II, Sinauer Associates, Inc. Publishers, Sunderland, Massachusetts, 445p., 1996. 15. WRICKE, G. & WEBER, W.E. Quantitative Genetics and Selection in Plant Breeding, de Gruyter, Berlin, 406p. 1986. v 1 1. INTRODUÇÃO A genética de populações objetiva estudar as consequências estatísticas do Mendelismo em grupos de indivíduos ou famílias, isto é, ela estuda os fenômenos hereditários no nível populacional. Pode ser entendida também, como o estudo de processos que afetam a distribuição dos genótipos entre os indivíduos de uma população através do tempo e do espaço. Essa disciplina é parte central de muitas metodologias modernas que têm sido utilizadas na biologia populacional, evolução, melhoramento de plantas e animais e conservação de recursos genéticos. Ela conecta a biologia molecular à biologia populacional e evolutiva e fornece os princípios para o entendimento das adaptações ambientais e a base teórica do melhoramento de plantas e de animais. A genética de populações tem uma tarefa de determinar quanto da variação genética existe em populações naturais e explicar a sua origem, manutenção e importância evolutiva. Hoje, os métodos tradicionais, teóricos e empíricos da genética de populações, utilizam as novas e poderosas ferramentas da biologia molecular permitindo se ter uma visão, sem paralelo, da diversidade genética e dos mecanismos evolutivos que moldam essa diversidade. A população, via de regra, é mais importante que indivíduos isolados, pois a vida de cada um desses indivíduos é limitada pelo tempo (uma única geração) e sua constituição genética é fixa (ausência de variabilidade genética) durante toda a sua existência. Ao contrário, uma população é praticamente imortal (muitas gerações), pode ser grande ou pequena, pode estar distribuída em uma área ampla ou limitada, e pode mudar a sua estrutura genética através das gerações, isto é, evoluir. Em outras palavras, a população é altamente dinâmica. A teoria da genética de populações é toda fundamentada em princípios matemáticos, usando como modelo os caracteres monogênicos, de fácil identificação fenotípica. A partir dos conhecimentos adquiridos com esses modelos, generalizações e extensões podem ser feitas. Grande parte dos fundamentos matemáticos da genética de populações foi desenvolvida entre 1920 e 1950 por três pesquisadores: R.A. Fisher, J.B.S. Haldane e S. Wright. Conceitos Antes de iniciar o estudo das leis que regem o comportamento genético das populações é necessário conceituar alguns termos: População: é um conjunto de indivíduos da mesma espécie, que ocupa o mesmo local, apresenta uma continuidade no tempo e seus membros possuem a capacidade de se interacasalar, isto é, os membros dessa população trocam alelos entre si. Toda população possui um conjunto gênico (“gene pool” ou “pool gênico”) que lhe é peculiar. O pool gênico representa todos os genes presentes na população em uma dada geração ou período. Para cada gene da população podem-se determinar as frequências de seus alelos. A frequência alélica representa a proporção de um dado alelo em relação ao total de alelos situados em um mesmo loco cromossômico. A frequência genotípica representa a proporção de um determinado genótipo em relação ao número total de genótipos para o loco em questão, e está relacionada à frequência alélica da geração anterior (veja abaixo), já que na reprodução o que são passados são os alelos, e não os genótipos. Suponha, por exemplo, um gene A com dois alelos A 1 e A 2 , sem dominância. Considerando que os indivíduos sejam diplóides existem três genótipos possíveis: Genótipos Número Frequência A 1 A 1 N11 D = N11/N A 1 A 2 N12 H = N12/N A 2 A 2 N22 R = N22/N Total N 1 2 As frequências alélicas p (A 1 ) e q (A 2 ) são dadas por, H 2 1 R N2 N N2 N2 N2 NN2 Aq H 2 1 D N2 N N2 N2 N2 NN2 Ap 122212222 121112111 )(ˆ )(ˆ Isto é, a frequência de um dado alelo em organismos diplóides pode ser estimada tomando-se o somatório das frequências observadas dos indivíduos homozigóticos para o alelo em questão mais a metade da frequência observada dos indivíduos heterozigóticos para o referido alelo. Se forem retiradas várias amostras de uma população vai haver uma variação nas estimativas das frequências alélicas cuja variância, considerando alelos sem dominância, pode ser estimada por: N2 q1q qV )ˆ(ˆ )ˆ( , em que N é o número de indivíduos da amostra populacional. Variação genética. A variação é um termo comumente usado para indicar diferenças em valores qualitativos ou quantitativos de um caráter entre indivíduos de uma população ou mesmo entre populações. Quando as causas desta variação são de natureza genética, ela é denominada de variação genética. A disponibilidade de variação genética é uma necessidade para mudanças evolutivas, de modo que determinar o quanto da variação existe dentro ou entre as populações se torna uma questão central para a biologia evolutiva, bem como para os melhoristas que se interessam por caracteres desejáveis nas espécies comercialmente importantes. Os estudos iniciais da variação genética em populações naturais concentraram-se nos caracteres de fácil identificação, principalmente em mutantes morfológicos, tais como a coloração de flores e grãos, presença ou não de pêlos nos caules e folhas, etc. Um problema que surge na utilização de caracteres morfológicos ou fisiológicos é que normalmente eles ocorrem em número reduzido, não permitindo assim uma estimativa da variação genética total do genoma da espécie estudada. Outro problema associado a esses caracteres é que nem sempre a variação fenotípica se deve à variação genética e, muitas vezes, a herança não é bem conhecida. Situação semelhante ocorre paraos caracteres quantitativos. Um dos exemplos mais bem conhecido é a seleção para a porcentagem de óleo e proteína em grãos de milho, realizado por mais de 100 gerações na Universidade de Illinois, Estados Unidos. A porcentagem de óleo aumentou quase quatro vezes nas linhas selecionadas para alto teor e foi reduzida a menos de 1% nas linhas selecionadas para baixo teor. Esta seleção ainda está sendo realizada, demonstrando haver variabilidade genética suficiente para continuar dando resposta. Em 1966 os pesquisadores passaram a utilizar a eletroforese de proteínas para estudar a variação genética em populações naturais. A eletroforese é executada passando-se uma corrente elétrica contínua através de um gel (amido, agarose ou acrilamida) onde a proteína é colocada. As proteínas migram por um determinado tempo e posteriormente são coradas com corantes específicos, de modo que a mobilidade relativa possa ser determinada. A mobilidade relativa geralmente é função do tamanho, carga e formato da molécula protéica. A mobilidade das diferentes formas da enzima é apresentada em um gráfico, denominado de zimograma. A figura 1.1 demonstra os padrões de bandas para a enzima fosfogluco mutase (PGM) para uma amostra de dez indivíduos de uma população. 3 50 40 30 20 10 Indivíduos 1 2 3 4 5 6 7 8 9 10 Figura 1.1 Zimograma para a enzima Fosfogluco Mutase (PGM) para uma amostra de dez indivíduos A utilização da eletroforese de proteínas na genética de populações revigorou esta área na década de 1970, pois este método tornou possível o estudo da variação genética para quase todas as espécies, com pequeno emprego de equipamentos. Os locos enzimáticos, a princípio, revelaram ser uma fonte surpreendente de diversidade genética em populações naturais, além de serem de fácil avaliação para a maioria das espécies. Pode-se, ainda, empregar marcadores de DNA, tais como RFLP, RAPD, AFLP, SSR, e outros, para estabelecer os padrões da variação genética presentes em qualquer tipo de população. O estudo molecular da variação genética (principalmente com o uso de marcadores de DNA) tem revelado uma amplitude de variação genética nunca antes imaginada. Esses marcadores permitem a obtenção de estimativas não tendenciosas da variação genética, pois são independentes da sua função. Os marcadores de DNA apresentam vantagens em relação aos marcadores isoenzimáticos, pois a sua variação não está limitada às regiões codantes do genoma, de modo que todas as categorias de variação podem, em princípio, ser detectadas. Outro tipo de marcador que tem sido muito empregado é o polimorfismo mononucleotídeo (single nucleotide polymorphism - SNP) ou de amino ácidos. As técnicas usadas para sequenciar grandes quantidades de DNA foram automatizadas de modo que muitas sequências podem ser obtidas e comparadas, além de permitir inferências sobre a variação dos aminoácidos entre indivíduos, populações e espécies. M o b il id ad e R el at iv a 4 2. SISTEMAS DE ACASALAMENTOS Os sistemas de acasalamentos determinam o modo de transmissão dos genes de uma geração à outra. As espécies vegetais apresentam vários sistemas de acasalamentos, que se agrupam em cinco classes (Brown, 1990): predominantemente alógamas, predominantemente autógamas, cruzamentos mistos (alogamia e autofecundação), parcialmente apomíticas e parcialmente de autofecundação de gametófitos, que ocorre em samambaias. Os sistemas de acasalamentos têm efeitos importantes na quantidade e na distribuição da variabilidade genética entre e dentro das populações. Além do mais, os sistemas de acasalamentos estão sob controle genético e, portanto, sujeitos aos processos evolutivos. Diversos fatores podem afetar o sistema de acasalamento, tais como, o tamanho e a densidade populacional, o modo de polinização, a disponibilidade de polinizadores e de seus hábitos, a sincronia de florescimento e padrões de desenvolvimento vegetal, o nível de estruturação genética da população e a ocorrência de auto-incompatibilidade. A fragmentação do habitat também pode afetar o sistema de acasalamento da população remanescente, por meio do isolamento reprodutivo devido à redução do tamanho populacional e alteração da dispersão de pólen. O isolamento reprodutivo devido à fragmentação pode resultar em menor fluxo gênico entre as populações, associada à perda de variabilidade genética devido à deriva genética e ao acasalamento entre indivíduos aparentados, resultando em depressão endogâmica. 2.1. Predominantemente alógamas (taxa de autofecundação, s < 0,05) As plantas desse grupo constituem a maioria das espécies vegetais e raramente sofrem autofecundação. Elas se reproduzem por acasalamentos ao acaso, que significa que cada indivíduo apresenta chance de se acasalar com qualquer outro indivíduo da população. Em termos probabilísticos o acasalamento ao acaso ocorre quando a probabilidade de acasalamento entre o genótipo Gi (macho) e do genótipo Gj (fêmea) é igual ao produto das probabilidades de suas frequências de ocorrência, isto é, P G G P G Gim jf im jf. . para i, j = 1, ...N Populações desse tipo são denominadas de panmíticas, se ocorrerem as condições abaixo: 1) A população é composta por centenas ou milhares de indivíduos; 2) Não há diferença de fertilidade e viabilidade entre os indivíduos; 3) A meiose é normal nos dois sexos; 4) Não ocorre seleção; 5) Não ocorre fluxo gênico; 6) A mutação gênica é desconsiderada. É importante salientar que em algumas situações podem ocorrer acasalamentos ao acaso para um loco e não para outro loco ou caráter. Por exemplo, plantas que florescem em uma mesma época cruzam-se entre si, mas não com outras mais precoces ou tardias. Deste modo, está havendo acasalamentos preferenciais (“assortative and disassortative matings”) entre plantas com florescimento coincidente, mas ao mesmo tempo os acasalamentos podem ser ao acaso para a cor da semente ou qualquer outro caráter, supondo não haver ligação entre os genes que controlam a época do florescimento e os demais caracteres. 5 Equilíbrio de Hardy-Weinberg As populações panmíticas normalmente se encontram em equilíbrio de Hardy-Weinberg. Vejamos como isto acontece. Considere, por exemplo, um loco A em um organismo diplóide, contendo os alelos A 1 e A 2 . No quadro abaixo são mostrados todos os acasalamentos possíveis entre os indivíduos da população, e as respectivas frequências genotípicas dos descendentes: Acasalamentos Frequências Frequência genotípica na descendência A 1 A 1 A 1 A 2 A 2 A 2 A 1 A 1 x A 1 A 1 D 2 D 2 - - A 1 A 1 x A 1 A 2 2DH DH DH - A 1 A 1 x A 2 A 2 2DR - 2DR - A 1 A 2 x A 1 A 2 H 2 H 2 /4 H 2 /2 H 2 /4 A 1 A 2 x A 2 A 2 2HR - HR HR A 2 A 2 x A 2 A 2 R 2 - - R 2 Frequência de A A D DH H D H1 1 2 2 2 4 1 2 Frequência de A A DH DR H HR D H R H1 2 2 2 2 2 1 2 1 2 . Frequência de A A H HR R R H2 2 2 2 2 4 1 2 Como : )( 1ApH 2 1 D e )( 2AqH 2 1 R tem-se: A 1 A 1 = p 2 A 1 A 2 = 2pq A 2 A 2 = q 2 Assim, o acasalamento ao acaso gera uma descendência em que as proporções genotípicas dependem apenas das frequências alélicas da geração parental, e não das frequências genotípicas iniciais D, H e R. Estas frequências genotípicas (p 2 , 2pq, q 2 ) poderiam ser obtidas também unindo aleatoriamente os gametas contendo os alelos A 1 (com frequência p) e A 2 (com frequência q), como mostrado no seguinte quadro: Gametas p(A 1 ) q(A 2 ) p(A 1 ) p 2 A 1 A 1 pq A 1 A2 q(A 2 ) pq A 1 A 2 q 2 A 2 A 2 Assim, "o acasalamento aleatório dos indivíduos da população fornece frequências genotípicas na próxima geração, idênticas àquelas fornecidas pela união aleatória de gametas". Este postulado é conhecido como teorema dos acasalamentos ao acaso. 6 As novas frequências alélicas (p1 e q1) podem ser determinadas facilmente empregando-se a generalização feita anteriormente, isto é, ela é igual à frequência dos homozigotos mais a metade da frequência dos heterozigotos, ou seja: pqpppqppqpp 221 221 qqpqpqqpqqq 221 221 Desse modo, fica demonstrado que as novas frequências alélicas (p1 e q1) são iguais às frequências alélicas da população parental (p e q). Usando-se o teorema dos acasalamentos ao acaso pode-se verificar que as novas frequências genotípicas serão: 2111 2 1 qqp2p ; ; , idênticas portanto às frequências genotípicas da geração anterior. Verifica-se que, respeitadas as condições de panmixia, as frequências alélicas e genotípicas permanecem inalteradas geração após geração, e a população é dita estar em equilíbrio. Essa condição de equilíbrio é conhecida como Equilíbrio (ou Lei) de Hardy-Weinberg (descoberta independentemente por G.H. Hardy, um matemático britânico e W. Weinberg, um médico alemão, em 1908). Observe que o equilíbrio é atingido após uma única geração de acasalamentos ao acaso, indiferentemente das frequências D, H e R. A figura 2.1 ilustra as frequências genotípicas de populações em equilíbrio de Hardy-Weinberg para a amplitude total das frequências alélicas. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 q 0 10 20 30 40 50 60 70 80 90 100 F re q ü ê n c ia g e n o tí p ic a d e u m a p o p u la ç ã o e m e q u il íb ri o ( % ) A1A1 A1A2 A2A2 Figura 2.1. Frequências genotípicas em populações em equilíbrio de Hardy-Weinberg em função das frequências alélicas em um loco com dois alelos. O equilíbrio de Hardy-Weinberg independe do tipo de interação alélica e será atingido de modo semelhante tanto para genes codominantes como dominantes. 7 Estimativa de frequências alélicas com dominância completa Observe que as estimativas das frequências alélicas para genes codominantes requeriam as três frequências genotípicas (D, H, R). Entretanto, quando ocorre dominância (A 1 > A 2 ) os genótipos A 1 A 1 e A 1 A 2 se confundem fenotipicamente e as frequências D e H se somam, impossibilitando o cálculo das frequências alélicas. Contudo, sabendo-se que a população está em equilíbrio, a frequência q do alelo A 2 pode ser estimada por: q1Ap N N Aq 1222 )(ˆ e )(ˆ A variância das frequências alélicas pode ser estimada por: N4 q1 qV 2ˆ )ˆ( , em que N é o número de indivíduos da amostra. Alelismo múltiplo O princípio de Hardy-Weinberg pode ser estendido para qualquer número de alelos. Essa extensão é particularmente importante para os marcadores moleculares do tipo SSR (micro- satélites) que geralmente ocorrem em formas múltiplas. No caso de alelismo múltiplo envolvendo alelos dominantes, as frequências alélicas também podem ser estimadas, assumindo que a população esteja em equilíbrio de Hardy-Weinberg. Por exemplo, considere três alelos com a seguinte ordem de dominância: A 1 > A 2 > A 3 . Os genótipos possíveis e suas frequências são apresentados no quadro abaixo: Genótipos Números Frequências Fenótipos A 1 A 1 N11 p1 2 A 1 A 1 A 2 N12 2p1p2 A 1 A 1 A 3 N13 2p1p3 A 1 A 2 A 2 N22 p2 2 A 2 A 2 A 3 N23 2p2p3 A 2 A 3 A 3 N33 p3 2 A 3 Total N 1 Assim, as frequências alélicas seriam dadas por: 232 332322 2 332 2 2 332322 33 33 2 )( pp N NNN pppp N NNN N N Ap 8 N N N NNN Ap pp N NNN 33332322 22 32 332322 )( E, finalmente: p1 = 1 - p2 - p3 Para um número m de alelos as frequências genotípicas em uma população em equilíbrio será dada por (p1 + p2 + ... + pm) 2 = mmm ppppppppp 2121 22 2 2 1 2...22 . As variâncias das frequências alélicas são estimadas por: N2 p1p pV iii )ˆ(ˆ )ˆ( , para genes codominantes com m alelos, e N4 pp1 pV 2 32 1 )ˆˆ( )ˆ( , )ˆ( )]ˆ(ˆ[ˆ )ˆ( 1 122 2 p1N4 p1p2p pV e N p pV 4 ˆ1 )ˆ( 2 3 3 , para uma série dominante com três alelos. Essas variâncias são bem maiores que a variância para alelos codominantes. A razão entre variâncias é dada por q q ˆ2 ˆ1 e será tanto maior quanto menor for o valor de q̂ . Teste de equilíbrio de Hardy-Weinberg Para testar se uma população está em equilíbrio de Hardy-Weinberg utiliza-se o teste do 2 (Qui quadrado), k 1i E 2 EO2 F FF )( Em que FO e FE são as frequências observadas e esperadas e k é o número de classes genotípicas. O número de graus de liberdade é dado por: GL = n o de classes fenotípicas - 1 - n o de frequências alélicas estimadas. No caso de caracteres controlados por genes com dominância completa ou de séries dominantes (caso de alelos múltiplos) não há graus de liberdade disponíveis, de forma que não é possível realizar o teste. Dois pontos interessantes devem ser destacados para as populações em equilíbrio de Hardy-Weinberg: 1) Admitindo dois alelos em um loco, a frequência máxima de heterozigotos é 50% e ocorre quando p = q = ½. No caso de alelos múltiplos a frequência de cada heterozigoto será sempre menor que ½ porém o somatório das frequências de heterozigotos será maior quanto maior for o número de alelos e se a frequência alélica for igual para todos os alelos (veja abaixo). 9 Homozigotos = pi i m 2 1 Heterozigotos = 1- pi i m 2 1 Se pi = 1/m então: Heterozigotos = 1 1 1 2 2 mp m mi Heterozigotos = m m 1 , em que m é o número de alelos. Por exemplo, se ocorrem 5 alelos em igual frequência, a proporção de genótipos heterozigóticos seria 4/5 ou 80%. 2) Quando a frequência do alelo recessivo é muito baixa, este alelo se encontra principalmente nos heterozigotos. Isto ocorre porque se q é pequeno a frequência do genótipo recessivo tende para zero. Assim, a proporção de indivíduos heterozigotos na população seria aproximadamente: 2 2 2 2 2 1 2 2 12 pq p pq pq p p q q q q q q ( ) Por exemplo, se em uma população q = 0,01 então q 2 = 1/10.000 e a proporção de indivíduos heterozigotos é 198/10.000. Outra maneira de visualizar este fato é determinar a frequência relativa do alelo recessivo presente no heterozigoto e no homozigoto recessivo. Como o heterozigoto possui apenas a metade dos alelos recessivos, então a frequência deste alelo é 2pq/2 = pq. No homozigoto os dois alelos são recessivos, portanto a frequência é q 2 . A frequência relativa será dada por: pq q p q2 Se q = 0,01 então p/q = 99 isto é, para cada alelo recessivo presente no homozigoto existem 99 alelos ocultos no heterozigoto. Esse resultado tem uma importância muito grande no processo de seleção, que será visto posteriormente. 2.1.1 Desequilíbrio de ligação ou desequilíbrio gamético O ponto de equilíbrio das frequências genotípicas após uma única geração de acasalamentos ao acaso é alcançado para cada loco considerado individualmente. Entretanto, quando se consideram dois ou mais locos, o equilíbrio somente é atingido gradualmente. Até que seja atingido o equilíbrio, a população se encontra em desequilíbrio, que significa a associação não aleatória de alelos de locos diferentes. Para ilustrar esse fato, suponha uma população composta das linhagens A 1 B 1 /A 1 B 1 e A 2 B 2 /A 2 B 2 em igual número e com acasalamentos ao acaso. Inicialmente, admita que os locos A e B não estejam ligados. 10 Geração0 Gametas ½ A 1 B 1 /A 1 B 1 ½ A 1 B 1 ½ A 2 B 2 /A 2 B 2 ½ A 2 B 2 De acordo com o teorema dos acasalamentos ao acaso, na primeira geração tem-se: Geração 1 Gametas ¼ A 1 B 1 /A 1 B 1 3/8 A 1 B 1 ½ A 1 B 1 / A 2 B 2 1/8 A 1 B 2 ¼ A 2 B 2 /A 2 B 2 1/8 A 2 B 1 3/8 A 2 B 2 Observe que para cada loco separadamente a população já se encontra em equilíbrio de Hardy-Weinberg na geração 1, mas para os dois locos considerados juntos ocorrem apenas três dos dez genótipos possíveis. Portanto, a população ainda não se encontra em equilíbrio. Na geração 2 tem-se: Genótipos Frequências genotípicas observadas Frequências esperadas no equilíbrio Genótipos Frequências genotípicas observadas Frequências esperadas no equilíbrio A 1 B 1 /A 1 B 1 9/64 4/64 A 1 B 2 /A 2 B 1 2/64 8/64 A 1 B 1 /A 1 B 2 6/64 8/64 A 1 B 2 /A 2 B 2 6/64 8/64 A 1 B 1 /A 2 B 1 6/64 8/64 A 2 B 1 /A 2 B 1 1/64 4/64 A 1 B 1 /A 2 B 2 18/64 8/64 A 2 B 1 /A 2 B 2 6/64 8/64 A 1 B 2 /A 1 B 2 1/64 4/64 A 2 B 2 /A 2 B 2 9/64 4/64 Assim, mesmo após duas gerações de acasalamentos ao acaso, a população ainda não atingiu o equilíbrio, embora nesta geração ocorram todos os genótipos possíveis. O equilíbrio só existirá quando houver independência entre os alelos do loco A e dos alelos do loco B, isto é: Equilíbrio: P(A 1 B 1 ) = P(A 1 ) . P(B 1 ) Portanto, a diferença entre a frequência observada do gameta A 1 B 1 e a frequência dada pelo produto das suas frequências alélicas [(A 1 ) x (B1)], é chamada de Desequilíbrio de ligação ou Desequilíbrio gamético (DL), e é fornecida por: D = P(A 1 B 1 ) - P(A 1 ) . P(B 1 ) No presente caso, verifica-se na geração 0 que: P(A 1 B 1 ) = 1/2 P(A 1 B 2 ) = 0 P(A 2 B 1 ) = 0 P(A 2 B 2 ) = 1/2 P(A 1 ) . P(B 1 ) = 1/2 . 1/2 = 1/4 D0 = 1/2 - 1/4 = 1/4 11 Na geração 1 tem-se: P(A 1 B 1 ) = 3/8 P(A 1 B 2 ) = 1/8 P(A 2 B 1 ) = 1/8 P(A 2 B 2 ) = 3/8 D1 = 3/8 – 1/4 = 1/8 Na geração 2 tem-se: P(A 1 B 1 ) = 5/16 P(A 1 B 2 ) = 3/16 P(A 2 B 1 ) = 3/16 P(A 2 B 2 ) = 5/16 D1 = 5/16 – 1/4 = 1/16 Observa-se que o desequilíbrio ocorre mesmo para genes independentes, como demonstrado no presente exemplo. O termo “desequilíbrio de ligação” é empregado para enfatizar que a ligação gênica faz com que a população demore mais tempo para atingir o ponto de equilíbrio (veja abaixo). Para verificar como ocorre a aproximação ao equilíbrio considere as seguintes frequências gaméticas e alélicas: Gametas Frequência Alelos Frequência A 1 B 1 x1 A 1 p1 = x1 + x2 A 1 B 2 x2 A 2 q1 = x3 + x4 A 2 B 1 x3 B 1 p2 = x1 + x3 A 2 B 2 x4 B 2 q2 = x2 + x4 As frequências dos quatro gametas x1, x2, x3 e x4 podem ser escritas do seguinte modo: A 1 A 2 Somatório p/ B B 1 x1 = p1p2 + D x3 = q1p2 – D p2 B 2 x2 = p1q2 – D x4 = q1q2 + D q2 Somatório p/ A p1 q1 Portanto, para o gameta A 1 B 1 o desequilíbrio será: D = x1 – p1 p2 Escrevendo p1 e p2 em função dos valores das frequências gaméticas, mostradas anteriormente tem-se: D = x1 - (x1 + x2) (x1 + x3) D = x1 - x1 2 - x1x3 - x1x2 - x2x3 D = x1(1-x1 - x2 - x3) - x2x3 como x1 + x2 + x3 + x4 = 1 então: 12 x4 = 1 - x1 - x2 - x3 e o desequilíbrio pode ser escrito: D = x1x4 - x2x3 Com a expressão escrita dessa maneira nota-se que D é função do produto dos gametas em associação (A 1 B 1 e A 2 B 2 ) menos o produto dos gametas em repulsão (A 1 B 2 e A 2 B 1 ), isto é: D = (A 1 B 1 )(A 2 B 2 ) - (A 1 B 2 )(A 2 B 1 ) Após uma geração de acasalamentos ao acaso, e considerando que a frequência de recombinação entre os genes A e B seja c, as frequências gaméticas serão: Frequências gaméticas da descendência Genótipos Freq. A 1 B 1 A 1 B 2 A 2 B 1 A 2 B 2 A 1 B 1 /A 1 B 1 x1 2 x1 2 - - - A 1 B 1 /A 1 B 2 2x1x2 x1x2 x1x2 - - A 1 B 2 /A 1 B 2 x2 2 - x2 2 - - A 1 B 1 /A 2 B 1 2x1x3 x1x3 - x1x3 - A 1 B 1 /A 2 B 2 2x1x4 (1-c)x1x4 cx1x4 cx1x4 (1-c)x1x4 A 1 B 2 /A 2 B 1 2x2x3 cx2x3 (1-c)x2x3 (1-c)x2x3 cx2x3 A 1 B 2 /A 2 B 2 2x2x4 - x2x4 - x2x4 A 2 B 1 /A 2 B 1 x3 2 - - x3 2 - A 2 B 1 /A 2 B 2 2x3x4 - - x3x4 x3x4 A 2 B 2 /A 2 B 2 x4 2 - - - x4 2 Denominando-se de x' as novas frequências gaméticas, tem-se: x'1 = x 2 1 + x1x2 + x1x3 + (1 - c)x1x4 + cx2x3 x'1 = x1(x1 + x2 + x3 + x4) - cx1x4 + cx2x3 x'1 = x1 - c(x1x4 - x2x3) x'1 = x1 - cD0 Por analogia: x'2 = x2 + cD0 x'3 = x3 + cD0 x'4 = x4 - cD0 Sendo D0 o desequilíbrio inicial e c a frequência de recombinação entre os locos A e B, o valor de D após uma geração de acasalamentos ao acaso será: D1 = x'1x'4 - x'2x'3 D1 = (x1 - cD0)(x4 - cD0) - (x2 + cD0)(x3 + cD0) D1 = x1x4 - x1cD0 - x4cD0 + c 2 D0 2 - x2x3 - x2cD0 - x3cD0 - c 2 D0 2 D1 = x1x4 - x2x3 - cD0(x1 + x2 + x3 + x4) D1 = x1x4 - x2x3 - cD0 13 D1 = D0 - cD0 D1 = (1-c)D0 Analogamente: D2 = (1-c)D1 e substituindo D1 por (1-c)D0 tem-se: D2 = (1-c)(1-c)D0 D2 = (1-c) 2 D0 E após t gerações: Dt = (1-c) t D0 Resolvendo a equação em função de t tem-se: ln ln ln .ln ln ln ln ln ln / ln D c D D t c D t D D c t D D c t t t t t 1 1 1 1 0 0 0 0 Chamando Dt/D0 de x tem-se: t x c ln ln 1 Por exemplo, se x = ½ , então o tempo dado pela expressão acima seria aquele necessário para reduzir o desequilíbrio inicial à metade. Observe que quanto mais ligados estiverem os genes (isto é, menor valor de c) mais tempo será necessário para se aproximar do equilíbrio. A figura 2 ilustra as alterações do desequilíbrio em função do número de gerações, para diferentes frequências de recombinação. A aproximação à condição de equilíbrio dada pelas fórmulas apresentadas, se aplica também para qualquer número de locos considerados simultaneamente. Lembrando-se que (1-c) é a proporção dos parentais (não recombinantes) e que esta se torna cada vez menor à medida que o número de genes aumenta, verifica-se que a aproximação ao equilíbrio será bem mais rápida para muitos locos do que para locos considerados aos pares. Por exemplo, para dois locos independentes (1-c) é igual a 1/2; para três locos independentes (1-c) é igual a 1/4 e para n locos (1-c) é igual a (½) n-1 . Desta forma, à medida que se considera um número cada vez maior de locos, observa-se uma aproximação muito rápida ao equilíbrio, para todos estes locos considerados conjuntamente, porém, permanecerão desequilíbrios entre estes genes considerados dois a dois ou três a três, etc. 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Geração 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 D es eq u il íb ri o Do = 1 c = 0,5 c = 0,3 c = 0,2 c = 0,1 c = 0,05 c = 0,01 Figura 2.2. Aproximação ao equilíbrio para dois genes considerados simultaneamente e com várias frequências de recombinação, ao longo de 15 gerações. Estimação do desequilíbrio de ligação É possível estimar o valor do DL entre dois genes, a partir das frequências fenotípicas. Para isto, considere as seguintes situações: a) Dois locos codominantes A 1 A 1 A 1 A 2 A 2 A 2 Total B 1 B 1 N11 N12 N13 N1. B 1 B 2 N21 N22 N23 N2. B 2 B 2 N31 N32 N33 N3. Total N.1 N.2 N.3 N Quando há codominância, os gametas de cada um dos genótipos (fenótipos) podem ser identificados, exceto para o duplo heterozigoto. Para este fenótipo, os dois tipos de heterozigotos, atração e repulsão, são indistinguíveis. Deste modo, apenas nove classes fenotípicas são fornecidas natabela (a). A partir desta informação a frequência do gameta A 1 B 1 é: 3241 4122 2112111 ˆˆˆˆ ˆˆ 2 2 1 ˆ xxxx xxN NNN N x em que , , x x x2 3 4 são expressões análogas para os outros gametas. O valor de D deve ser obtido por iteração. Um método sugerido é usar a expressão: 211 ˆˆˆˆ ppxD onde p1 é a frequência de alelo A 1 e p2 é a frequência do alelo B 1 , devendo-se avaliar x1 por iteração. 15 . . . . p N N N p N N N 1 1 2 2 1 2 1 2 1 2 As outras substituições são: x p x x p x x p p x 2 1 1 3 2 1 4 1 2 11 Assim, a expressão de x1 fica: x N N N N N x p p x x p p x p x p x 1 11 21 12 22 1 1 2 1 1 1 2 1 1 1 2 1 1 2 2 1 1 A única variável desconhecida nesta expressão é x1 , que pode ser calculada assumindo um valor de x1 para o lado direito da equação e calculando o valor resultante de x1 . Este valor é então substituído do lado direito e o processo é repetido até que se obtenha estabilidade dos valores. Um possível ponto inicial de iteração é: x N N N N N 1 11 12 21 22 2 2 Para testar se 0D usa-se a estatística: Q ND p p q q 2 1 2 1 2 com distribuição aproximada de 2 com 1 grau de liberdade; onde: , p q1 1 são as frequências alélicas do gene A e , p q2 2 as frequências alélicas do gene B. b) Dois locos dominantes A 1 __ A 2 A 2 Total B 1 __ N11 N12 N1. B 2 B 2 N21 N22 N2. Total N.1 N.2 N Quando há dominância completa em dois genes, ocorrem apenas quatro fenótipos distintos (tabela b). Assumindo acasalamentos ao acaso tem-se: 16 2211 2 2 2..222 214 .22 2 2.2 1 22 4 ˆ2ˆˆ2ˆ ˆ4 ˆ ˆˆˆˆ )(ˆ )(ˆ ˆ pppp DN Q N NN N N D qqxD N N Bq N N Aq N N x A distribuição de Q é aproximadamente a de 2 com 1 grau de liberdade. Outras medidas de desequilíbrio Além de D, outras medidas também são úteis para se entender o desequilíbrio nas populações. Entre estas, cita-se o parâmetro D’ de Lewontin (1964), definido como, max ˆ D D D em que Dmax é o desequilíbrio máximo possível para um dado conjunto de frequências alélicas nos dois locos. Dmax é o menor valor dos produtos p1q2 ou p2q1, se D é positivo (fase de atração), ou o menor dos valores p1p2 ou q1q2 se D é negativo (fase de repulsão). Lembre-se que p1 e q1 são as frequências dos alelos A 1 e A 2 e p2 e q2 as frequências dos alelos B 1 e B 2 . A vantagem dessa medida é que ela varia de –1,0 a 1,0, independentemente das frequências alélicas nos dois locos. À semelhança do valor de D, o parâmetro D’ também se reduz em função do tempo e da frequência de recombinação (c), e pode ser estimado pela expressão: 0 t t Dc1D D’ é fortemente influenciado por tamanhos amostrais pequenos, resultando em comportamento errático quando se comparam locos com frequências alélicas baixas. Outra medida importante é r 2 , também descrita como 2 na literatura, e que pode ser estimada por: 2211 2 2 )ˆ( qpqp D r Devlin e Risch (1995) apresentam e comparam, também, várias outras medidas do DL empregadas para o mapeamento genético. Essas medidas são apresentadas no quadro abaixo. 17 Símbolo Fórmulas 2211 qpqp D̂ D’ 12qp D̂ 42 xp D̂ d 22qp D̂ Q 3241 xxxx D ˆ Como se podem observar, estas medidas diferem apenas no denominador, que servem para padronizar o D. Segundo os autores, D’ e são mais fáceis de interpretar e exibem comportamento quase idêntico, e são indicados para o mapeamento de genes por meio do DL. Causas e fatores que afetam o desequilíbrio de ligação Para Hartl & Clark (2010) o equilíbrio de ligação é resultado da história. Para entender as suas causas considere uma região cromossômica monomórfica e sem recombinação, representada pelos genes A e B. Em um dado momento o alelo A muta para a e, devido ao acaso ou à seleção natural, este alelo (a) aumente a sua frequência. Agora na população teremos as combinações AB, e aB. Agora suponha outra mutação, de B para b em um cromossomo de constituição aB. Então a população resultante terá as combinações AB, aB e ab. Observe que a combinação Ab está faltando, isto é, sua frequência é zero. Na ausência de recombinação ou mutação a sua frequência deverá permanecer 0. Neste caso, o valor de D’ = 1 e o valor de r 2 depende de onde a mutação de B para b ocorreu. Se ela ocorreu cedo na linhagem que carregava a mutação a, a correlação entre a e b será alta, mas se ela ocorreu mais tarde na genealogia, então a correlação entre a e b será baixa. Por exemplo, considere as frequências das combinações PAB = 0,5, PAb = 0, PaB = 0,01 e Pab = 0,49; isso representa uma situação na qual a mutação b surgiu cedo na linhagem, e assim a maioria dos cromossomos que carregam a também carregam b: nesse caso r 2 = 0,96. Suponha outro exemplo em que PAB = 0,5, PAb = 0, PaB = 0,49 e Pab = 0,01; isto representa uma situação na qual a mutação b apareceu tarde na linhagem a, e assim poucos cromossomos que carregam a também carregam b: nesse caso r 2 = 0,01. Dessa forma, D’ é uma medida de desequilíbrio de ligação que é influenciada principalmente pela frequência de recombinação enquanto r 2 também captura informação sobre quando e onde na genealogia das combinações as mutações ocorreram. Segundo Hartl & Clark (2010) essa diferença explica por que D’ e r 2 são medias complementares de desequilíbrio de ligação e também por que r 2 pode assumir uma faixa de valores para qualquer valor de D’ (Figura 2.3). Segundo Flint-Garcia et al. (2003), a mutação fornece a matéria prima para produzir o polimorfismo que estará em DL. A recombinação é o principal fenômeno que reduz o DL intracromossômico, enquanto que DL intercromossômico é dissipado pela distribuição independente. O tamanho populacional também possui papel importante. 18 Figura 2.3. Relação entre D’ e r 2 para valores aleatórios de frequências gaméticas distribuídos uniformemente (Hartl & Clark, 2010). Em populações pequenas, o efeito da deriva genética resulta em perda consistente de combinações alélicas raras, que aumentam os níveis de DL. Além disso, o DL pode ser criado em populações que passaram por redução drástica em seu tamanho devido ao afunilamento genético (bottleneck). Os sistemas de acasalamentos também podem afetar fortemente o DL. Geralmente o DL cai muito mais rapidamente em espécies alógamas comparada às espécies autógamas ou de acasalamentos mistos, pois nessas espécies a recombinação é menos efetiva. A seleção, que causa afunilamento genético para locos específicos, também pode criar DL entre o alelo selecionado e o loco ligado. Além disso, a seleção a favor ou contra um fenótipo controlado por dois genes não ligados (epistasia) pode criar DL embora os locos não estejam fisicamente ligados. Finalmente, o fluxo gênico (migração) entre indivíduos de diferentes populações pode introduzir novas combinações cromossômicas e diferentes frequências alélicas, resultando em DL. 2.2. Predominantemente autógamas (taxa de cruzamento, t < 0,10) Nas populações que se reproduzem por autofecundação, a população é dividida em várias linhas que se tornam altamente homozigóticas. Considerando apenas um loco com dois alelos, há apenas três tipos possíveis de acasalamentos e que ocorrem nas proporções relativas dos genótipos na população. Acasalamentos Frequências Progênies A 1 A 1 A 1 A 2 A 2 A 2 A 1 A 1 x A 1 A 1 D0 1 - - A 1 A 2 x A 1 A 2 H0 1/4 1/2 1/4 A 2 A 2 x A 2 A 2 R0 - - 1 Dessemodo, as novas frequências genotípicas serão: 19 D D H H H R R H 1 0 0 1 0 1 0 0 4 2 4 A nova frequência (p1) do alelo A 1 será: p D H H D H p1 0 0 0 0 0 4 1 2 2 2 isto é, não há alteração nas frequências alélicas com a autofecundação. Entretanto, as proporções genotípicas são alteradas drasticamente. A proporção de heterozigotos é dada por: H1 = ½H0 H2 = ½H1 e substituindo H1 tem-se, H2 = (½) 2 H0 e generalizando para um número (t) qualquer de gerações: H Ht t 1 2 0 Como o valor (½) t é sempre menor que 1,0 e decresce rapidamente em direção a zero com o aumento de t, o heterozigoto se aproxima assintoticamente de zero. A redução é rápida e mesmo quando H0 = ½, a heterozigose é reduzida a menos de 1% após seis gerações. As frequências dos homozigotos são dadas por: D D H R R H t t t t 0 0 0 0 1 2 1 1 2 1 2 1 1 2 À medida que t aumenta, o valor (½) t tende para zero e as frequências dos homozigotos se aproximam de: qHRRHDD tt 0000 2 1 e p 2 1 pois os termos entre colchetes se aproximam de 1,0. Assim, as frequências dos homozigotos se tornam as frequências de seus alelos na geração inicial. 2.3. Acasalamentos mistos Para muitas plantas de autofecundação ocorre também uma certa taxa de cruzamentos. Neste sistema, o procedimento mais simples para se determinar as proporções genotípicas é designar uma proporção, S, da progênie produzida por autofecundação e a proporção remanescente, T, sendo produzida por cruzamentos, e onde (S + T = 1,0). 20 Para se determinar as frequências genotípicas após uma geração de acasalamentos pode-se utilizar o seguinte quadro: Acasalamentos Freq. Progênie A 1 A 1 A 1 A 2 A 2 A 2 Autofecundação (S) A 1 A 1 x A 1 A 1 SD SD - - A 1 A 2 x A 1 A 2 SH ¼SH ½SH ¼SH A 2 A 2 x A 2 A 2 SR - - SR Cruzamento (T) A 1 A 1 x A 1 A 1 TD 2 TD 2 - - A 1 A 1 x A 1 A 2 T2DH TDH TDH - A 1 A 1 x A 2 A 2 T2DR - T2DR - A 1 A 2 x A 1 A 2 TH 2 ¼TH 2 ½TH 2 ¼TH 2 A 1 A 2 x A 2 A 2 T2HR - THR THR A 2 A 2 x A 2 A 2 TR 2 - - TR 2 A 1 A 1 = SD + ¼SH + TD 2 + TDH + ¼TH 2 A 1 A 1 = T(D 2 + DH + ¼H 2 ) + S(D + ¼H) A 1 A 1 = T(D + ½H) 2 + S(D + ¼H) A 1 A 1 = Tp 2 + S(D + ¼H) A 1 A 2 = ½SH + TDH + T2DR + ½TH 2 + THR A 1 A 2 = ½SH + 2T(D + ½H)(R + ½H) A 1 A 2 = 2Tpq + ½SH A 2 A 2 = ¼SH + SR + ¼TH 2 + TRH + TR 2 A 2 A 2 = T(¼H 2 + HR + R 2 ) + S(R + ¼H) A 2 A 2 = T(R + ½H) 2 + S(R + ¼H) A 2 A 2 = Tq 2 + S(R + ¼H) Assim: D1 = Tp0 2 + S(D0 + ¼H0) H1 = 2Tp0q0 + ½SH0 R1 = Tq0 2 + S(R0 + ¼H0) Nestas equações o primeiro termo indica a proporção da progênie produzida por cruzamento e o segundo, a produzida por autofecundação. Do mesmo modo que ocorre para a autofecundação, a frequência alélica não se altera na próxima geração. p1 = D1 + ½H1 p1 = Tp0 2 + S(D0 + ¼H0) + ½(2Tp0q0 + ½SH0) p1 = Tp0(p0 + q0) + S(D0 + ½H0) p1 = Tp0 + Sp0 p1 = p0 As frequências genotípicas mudam com o passar das gerações, mas os heterozigotos não se aproximam de zero, pois são restituídos com os acasalamentos ao acaso. As frequências 21 genotípicas atingem um equilíbrio para uma dada proporção de autofecundação e uma dada frequência alélica. Estas proporções no equilíbrio podem ser obtidas das equações já fornecidas, isto é: Ht + 1 = 2Tpq + ½SHt Em que os subscritos foram retirados porque as frequências alélicas são as mesmas em todas as gerações. No equilíbrio não há mais alteração nas frequências genotípicas e Ht + 1 = Ht = He, em que He é a proporção de heterozigotos no equilíbrio. He = 2Tpq + ½SHe He - ½SHe = 2Tpq He(1 - ½S) = 2Tpq H Tpq S e 2 1 1 2 Multiplicando o numerador e o denominador por 2 e substituindo T por 1 - S, tem-se: H pq S Se 4 1 2 ( ) Para os homozigotos o procedimento é o mesmo: D Tp S D H D Tp SD S pq S S D Tp SD Spq S S D SD Tp Spq S S D S S p Spq S S D S p S Spq S S S D p Spq S e e e e e e e e e e e e 2 2 2 2 2 2 2 1 4 1 4 4 1 2 1 2 1 2 1 1 1 2 1 1 1 2 1 2 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) 22 Assim as frequências de todos os genótipos serão dadas por: D p Spq S H pq S S R q Spq S e e e 2 2 2 4 1 2 2 ( ) Após várias gerações, independentemente das proporções genotípicas iniciais, as proporções genotípicas da população atingem os valores de equilíbrio, os quais são determinados pelas frequências alélicas e pela taxa de autofecundação. O desequilíbrio de ligação em espécies de autofecundação ou acasalamentos mistos é bem mais intenso e mais demorado de ser dissipado que em espécies de acasalamentos ao acaso. Isto ocorre porque nessas espécies a recombinação é menos efetiva, devido à maior proporção de indivíduos homozigotos. A taxa de recombinação efetiva é dada por Flint-Garcia et. al. (2003) como sendo: s2 s 1c Assim, para espécies com s = 0,66 a taxa de recombinação efetiva é reduzida pela metade, comparada à espécie completamente alógama (com auto-incompatibilidade). Haverá redução de dez vezes na taxa de recombinação efetiva para espécies com 95% de autofecundação (s = 0,95) e de 50 vezes para espécies com 99% de autofecundação. Essas diferenças no DL entre espécies endogâmicas (s > 0) e não endogâmicas (s = 0) têm implicações cruciais com respeito à análise de associação para o mapeamento genético por desequilíbrio de ligação. O número de marcadores necessários para cobrir todo o genoma é determinado pela extensão do DL. Assim, enquanto que para o milho estima-se a necessidade de um marcador a cada 100 – 200 bp para cobrir todo o genoma, para a Arabidopsis esses marcadores poderiam ocorrer somente a cada 50 kbp (Flint-Garcia et. al., 2003). Uma alternativa para minimizar as dificuldades de mapeamento usando DL em plantas seria a obtenção de gerações F2, onde seria necessário menor número de marcadores e maior acurácia estatística. Estimação da taxa de cruzamento Existem basicamente dois processos para se estimar a taxa de cruzamento: um processo direto em que as progênies individuais resultantes de polinizações livres são identificadas, e um processo indireto que assume que as proporções genotípicas estão em equilíbrio de endogamia. Para estimar a taxa de cruzamento pelo método direto é necessário conhecer o genótipo da planta mãe (o genótipo paterno normalmente não é conhecido), e os genótipos da progênie. A proporção genotípica da progênie, esperada a partir de um genótipo materno homozigótico AiAi é dado por: Frequência de acasalamentos Genótipos na progênie AiAi AiAj S S - T Tpi Tpj 1,0 S + Tpi Tpj 23 Em que pi e pj são as frequências dos alelos Ai e Aj (ou todos os demais alelos além de Ai) nos grãos de pólen. Neste caso, há dois tipos de descendentes: os homozigotos (AiAi) obtidos por autofecundação ou por cruzamentos e os heterozigotos (AiAj) obtidos exclusivamente por cruzamentos. Assim, a frequência de heterozigotos na progênie é dada por: H Tp j que pode ser arranjada para fornecer a taxa de cruzamento: T H p j Se for identificado um número Nij de indivíduos heterozigotos em uma progênie de N indivíduos, a estimativa da taxa de cruzamento será dada por: Np N T j ij ˆ A variância aproximada é dada por: ' 2 ˆ ˆ1ˆˆˆ1ˆ ˆ Np pT N pTT TV j jj emque p j é a estimativa da frequência do alelo Aj na população fonte de pólen e N’ é o tamanho da amostra usada para estimar a frequência de Aj. A estimativa da taxa de cruzamento pelo método indireto assume que a população esteja em equilíbrio de endogamia e, nesse caso, emprega-se o índice de fixação (FST): qp H FST ˆˆ2 ˆ 1ˆ Com o índice de fixação pode-se estimar a taxa de cruzamento a partir da seguinte expressão: ST ST ST F F T T T F 1 1ˆ 1 1ˆ 24 2.4 EXERCÍCIOS 1. Suponha que o alelo A1 seja representado pela peça vermelha e o alelo A2 pela peça branca. Cada duas peças unidas constituem um indivíduo que pode ser homozigótico (A 1 A 1 ou A 2 A 2 ) ou heterozigótico (A 1 A 2 ). Construa uma população de 80 indivíduos, misturando um número qualquer de indivíduos vermelhos, brancos e vermelho-branco. a) Determine as frequências alélicas nessa população. b) Determine as frequências genotípicas esperadas na população em equilíbrio de Hardy- Weinberg e verifique se a população se encontra em equilíbrio. c) Efetue acasalamentos ao acaso entre os indivíduos da população original, da seguinte maneira: Retira-se um indivíduo ao acaso e anota-se sua constituição genética; este será o progenitor feminino. Volta-se esse indivíduo para a população para que não haja alteração nas frequências. Retira-se agora outro indivíduo ao acaso; este será o progenitor masculino. Desta maneira fazem-se 200 retiradas obtendo-se 100 acasalamentos. Anotar os tipos de acasalamento e as respectivas descendências obedecendo aos seguintes passos: 1º. Quaisquer dois indivíduos poderão ser acasalados; 2º. Todos os acasalamentos serão igualmente produtivos; 3º. Cada acasalamento dará uma descendência de 4 indivíduos de acordo com a segregação Mendeliana. 4º. Compare os números na nova geração com os números esperados em uma população em equilíbrio de Hardy-Weinberg, usando o teste de 2 . 2. Suponha um gene A com três alelos, sem dominância, e os genótipos dados abaixo. a) Determine as frequências desses alelos. b) Teste se a população se encontra em equilíbrio de Hardy- Weinberg. Genótipos Número Observado A 1 A 1 20 A 1 A 2 30 A 1 A 3 100 A 2 A 2 52 A 2 A 3 240 A 3 A 3 408 Total 850 3. Considere uma população em equilíbrio e suponha a seguinte ordem de dominância A 1 >A 2 >A 3 . Calcule as frequências alélicas admitindo os seguintes números de indivíduos: fenótipos A 1 :278, fenótipos A 2 : 362, fenótipos A 3 : 360. 4. Em uma população em equilíbrio o número de heterozigotos é oito vezes o número de homozigotos recessivos. Quantos indivíduos de cada genótipo são esperados na população contendo 1000 indivíduos? 5. Considere apenas um loco com dois alelos e diferencie, em termos de frequências alélicas e genotípicas, um híbrido F1, híbrido intervarietal e cultivar de polinização livre. 25 6. O alelo br2 em milho confere o fenótipo braquítico (plantas baixas). Se um melhorista tomar ao acaso plantas normais de uma população em equilíbrio onde q (br2) = 0,4 e as cruzar, qual a probabilidade de surgirem descendentes braquíticos? 7. A partir de uma população com frequências genotípicas AA = 0,40; Aa = 0,30 e aa = 0,30, determine as frequências dos mesmos após três ciclos de autofecundação. 8. A partir de uma população com frequências genotípicas AA=0,16; Aa=0,48 e aa=0,36 e taxa de autofecundação (S) igual a 0,8 determine as frequências genotípicas para as primeiras gerações. Coloque os resultados em um gráfico. 9. Determine as frequências dos heterozigotos no ponto de equilíbrio para três populações com frequências alélicas p = 0,5; p = 0,3 e p = 0,1, respectivamente e taxas de autofecundação (S) igual a 0; 0,2; 0,4; 0,6; 0,8 e 1,0. Coloque os resultados em um gráfico. 10. Considere a seguinte população e assuma que os genes A e B possuem distribuição independente. Genótipos Nº Indivíduos AB/AB 55 AB/aB 5 AB/ab 120 aB/ab 5 ab/ab 65 Total 250 a) A população se encontra em equilíbrio para o gene A e para o gene B, separadamente? E para os genes A e B simultaneamente? b) Calcule o desequilíbrio gamético na população original e na primeira geração obtida por acasalamentos ao acaso. Faça o mesmo considerando 90% de ligação entre os genes A e B. c) Quantas gerações seriam necessárias para se reduzir o desequilíbrio em 95%, considerando: 1º. A e B são independentes; 2º. A frequência de recombinação entre A e B é 10%. d) Discuta os resultados. 11. Em milho, plantas normais domina plantas braquíticas e grãos amarelos domina grãos brancos. Estime o desequilíbrio de ligação (D) e sua significância, considerando uma população composta dos seguintes indivíduos: Plantas normais com grãos amarelos: 43, Plantas braquíticas com grãos amarelos: 70, Plantas normais com grãos brancos: 81, Plantas braquíticas com grãos brancos: 37. 12. Em um experimento para estimar a taxa de cruzamento para certa espécie, um grupo de indivíduos A1A1 foram cultivados aleatoriamente no meio de uma população contendo 1000 indivíduos e cuja frequência alélica era p1(A1) = 0,3. De uma progênie de 300 indivíduos obtidos das plantas A1 A1 , 97 eram heterozigotos. Qual é a estimativa da taxa de cruzamento e seu desvio padrão? Que proporção de homozigotos na progênie seria produzida por autofecundação? 26 13. A partir da geração 2 em equilíbrio de ligação (quadro da página 8), selecione todos os indivíduos com fenótipo A 1 B 1 e verifique se a população continua em equilíbrio. REFERÊNCIAS Devlin, B.; Risch, N. A comparison of linkage disequilibrium measures for fine-scale mapping. Genomics, v. 29, p. 311-322, 1995. Flint-Gracia, S.A.; Thornsberry, J.M.; Buckler IV, E.S. Structure of linkage disequilibrium in plants. Annu. Rev. Plant Biol., v. 54, p.357-374. 2003. 27 3. MEDIDAS DE VARIAÇÃO, DE DISTÂNCIA E SIMILARIDADE GENÉTICA Com o propósito de estimar a quantidade de variação genética em populações, de uma forma padronizada, inúmeras medidas são propostas. Algumas são mais apropriadas para caracteres morfo-fisio-agronômicos enquanto outras são mais adequadas para uso com marcadores moleculares (enzimáticos ou de DNA). 3.1 Medidas de variação genética 3.1.1. Diversidade Genética (H) A medida de variação genética mais amplamente utilizada é a diversidade genética também chamada de heterozigosidade (H), índice de diversidade ou, ainda, de índice de polimorfismo, e que pode ser estimada por: H p H P e i i m o ii i m 1 1 2 1 1 em que: He : diversidade esperada Ho : diversidade observada m: número de alelos Pii: frequência observada de homozigotos para o alelo i pi: frequência do alelo i Estas expressões são equivalentes a: H p pi i i m 1 1 e que tem sido chamado de índice de polimorfismo. Deve-se salientar que a heterozigosidade é uma medida de diversidade e não apresenta, necessariamente, relação com a frequência de heterozigotos da população. Esta medida é definida inteiramente em função das frequências alélicas e não das frequências genotípicas. Portanto se aplica a populações com reprodução assexuada ou sexuada com alogamia ou endogamia. Para espécies com acasalamentos ao acaso as duas expressões (He e Ho) são semelhantes, mas para espécies autógamas, grandes discrepâncias podem ser observadas. Quando o tamanho N de uma amostra é pequeno, é necessário fazer uma correção, e a expressão se transforma em: 12 2 ˆ1ˆ 1 2 N N pH m i i Se vários locos gênicos estiverem envolvidos, então a diversidade genética da população é estimada como sendo a média aritmética das diversidades obtidas para cada loco. Nei (1973) propõe a partição da diversidade genética em seus componentesentre e dentro das unidades experimentais. A unidade experimental pode ser a espécie ou uma população 28 grande, constituída por várias subpopulações ou demes. Assim, a diversidade total (HT) é constituída por: STST DHH em que: HT: diversidade total, estimada a partir das frequências alélicas médias de cada loco, envolvendo todas as populações consideradas. HS: componente da diversidade dentro da população. n nn S NNN HNHNHN H ... ...... 21 2211 Sendo: N1, N2, Nn etc. o número de indivíduos da população 1, 2, n e H1, H2, Hn as diversidades estimadas para as n populações. DST: componente da diversidade entre populações, dentro da espécie considerada. A proporção da diversidade genética que é atribuída ao componente entre populações é estimada por: G D H ST ST T Utilizando-se marcadores de DNA ou isoenzimáticos, pode-se obter informações da diversidade genética em muitos locos e indivíduos na população. A partir destes dados pode-se calcular a diversidade média da população como sendo a média aritmética dos H’s considerando todos os locos analisados. 3.1.2. Proporção de locos polimórficos (P) Outra medida de variação genética é a proporção de locos polimórficos. O polimorfismo genético é definido como sendo a ocorrência de dois ou mais alelos em um loco, cada um com uma frequência inferior a 0,95 (ou 0,99). Esses valores são arbitrários, mas o valor 0,99 é mais usado quando o tamanho da amostra é adequado (aproximadamente 100 indivíduos ou mais). Esta medida é dada por: n x P ˆ em que, x é o número de locos polimórficos em uma amostra de n locos. 3.1.3. Número de alelos por loco polimórfico (A) Uma terceira medida de diversidade é o número de alelos por loco polimórfico, dada por: Ap Nº total de alelos dos locos polimórficos Nº de locos polimórficos 29 3.1.4. Número de alelos efetivos (Ae) O número de alelos efetivos significa o número de alelos igualmente frequentes que seria necessário para produzir a mesma homozigosidade observada na população real. Ele é estimado pela expressão: 2 1 i e p A Estudos de aloenzimas de populações de Drosophila willistoni no Caribe mostrando as frequências alélicas dos locos Adk-1 (adenilato kinase-1), Lap-5 (leucina amino peptidase-5) e Xdh (xantina desidrogenase). Adk-1 Lap-5 Xdh Alelo 1 0,574 0,801 0,446 Alelo 2 0,309 0,177 0,406 Alelo 3 0,114 0,014 0,092 Alelo 4 0,003 0,004 0,034 Alelo 5 - 0,004 0,014 Alelo 6 - - 0,004 Alelo 7 - - 0,002 Alelo 8 - - 0,002 3.2 Medidas de distâncias (similaridade) genéticas O estudo da variação genética, envolvendo várias populações e muitos genes, permite avaliar a quantidade de variação comum entre populações. Estas medidas de variação comum entre grupos são chamadas de distâncias genéticas e permitem a visualização da relação entre grupos de indivíduos. Elas são análogas às distâncias geométricas, isto é, se a distância é zero não há diferença entre os grupos. As medidas de similaridade ou identidade genética geralmente são complemento das medidas de distância. Assim, não há diferença entre os grupos se a similaridade é igual a 1,0. No melhoramento de plantas as medidas de distâncias genéticas têm sido utilizadas para a identificação de populações que possibilitam maior efeito heterótico quando cruzadas ou que possibilitam maior probabilidade de seleção de genótipos superiores nas gerações segregantes. Além disso, têm sido úteis na avaliação de acessos em bancos de germoplasma, no estabelecimento da relação entre a diversidade genética e geográfica e também, para evitar a vulnerabilidade genética das culturas. Várias têm sido as medidas de distâncias genéticas empregadas, tais como: distância genética de Nei, distância Genotípica de Hedrick, distância de Rogers, distância Euclidiana, distância generalizada de Mahalanobis, e muitas outras. Para se estimar essas distâncias usam-se comumente padrões isoenzimáticos ou marcadores de DNA, bem como caracteres morfológicos, fisiológicos ou agronômicos; ainda podem ser empregadas análises dos pedigrees ou medidas de depressão endogâmica. Os números de alelos efetivos para cada loco foram: Ae = 2,28 para Adk-1, Ae = 1,49 para Lap-5 e Ae = 2,68 para Xdh. O número de alelos efetivos é determinado mais pela uniformidade das freqüências alélicas do que pelo número real de alelos. 30 3.2.1 Distância Genética de Nei Esta é uma das medidas genéticas mais utilizadas e é definida como: NN ID ln , em que 21 12 * JJ J IN Nesta expressão, IN é a identidade genética de Nei e J12, J1 e J2 são definidos a seguir: J p p J p J p i i i n i i n i i n 12 1 2 1 1 1 2 1 2 2 2 1 . . . . pi.1 e pi.2 são as frequências do alelo i nas populações 1 e 2, respectivamente. Quando se consideram vários locos, os valores de J12, J1 e J2 são calculados como as médias aritméticas de todos os locos. Os valores de IN variam de zero, quando não há alelos em comum nas duas populações, até 1,0 quando as duas populações possuem frequências alélicas idênticas. DN varia de zero, para populações com frequências alélicas idênticas, até o infinito, para as populações que não possuem alelos em comum. 3.2.2 Distância Euclidiana A distância euclidiana é baseada em um espaço bidimensional e que pode ser representado como na figura 3.1. O espaço ocupado pela população A é definido pelas frequências alélicas p1 e q1 enquanto que a população B é definida pelas frequências p2 e q2. Figura 3.1. Representação esquemática da distância entre dois pontos (A e B) em um plano cartesiano O teorema de Pitágoras estabelece que o quadrado da hipotenusa é igual à soma do quadrado dos catetos, então: 221 2 21 2 AB qqppd 2 21 2 21AB qqppd Xi p2 p1 q2 q1 B A DAB Xj 31 A distância euclidiana pode ser calculada a partir de dados de frequências alélicas. Nesse caso, cada população é representada como um ponto no espaço n dimensional baseado nas frequências alélicas dos n alelos. Para que duas populações sejam consideradas similares elas devem ocorrer na mesma região do espaço multidimensional, exibindo pequena distância entre si. Quando se têm n alelos, a distância entre duas populações A e B é dada por: n i iBiAAB ppd 1 2 em que: dAB : distância euclidiana entre as populações A e B; n : número de alelos piA e piB: frequências do alelo i nas populações A e B, respectivamente. A distância euclidiana varia de zero, quando as duas populações apresentam as mesmas frequências alélicas, a um valor máximo de 2 , se as populações fixarem alelos contrastantes. A distância euclidiana foi originalmente proposta para caracteres quantitativos e, nesse caso há necessidade de padronização das variáveis, em função das diferentes escalas usadas para cada caráter. A padronização mais usual é Zij = Xij/sj , em que Zij é variável j padronizada, Xij é a variável original e sj o desvio padrão para a respectiva variável. Nesse caso, utiliza-se a distância euclidiana média, dada por: 21 jiAB XX n d A distância euclidiana pode ser aplicada também a dados de frequências alélicas, fazendo n igual ao número de locos. 3.2.3 Distância generalizada de Mahalanobis A distância generalizada de Mahalanobis apresenta vantagens em relação à distância euclidiana, pois considera as possíveis correlações entre as variáveis. Quando as variáveis não são correlacionadas, a distância generalizada de Mahalanobis é igual à distância euclidiana. Para se estimar a distância de Mahalanobis (D 2 ) estimam-se, primeiramente, os desvios: niinn 2i2i2 1i1i1 XXdXXd XXd ' ' ' ... em que: Xi1 é a média do caráter i na população 1 Xi2 é a média do caráter i na população 2 32 A estatística D 2 é definida por: 12D ' em que: : é vetor das diferenças entre as médias de duas populações (genitores) para as n características avaliadas (veja acima). n21 ddd ...' 1 : é a inversa da matriz de variâncias e covariâncias residuais. 3.2.4 Distância de Rogers Rogers (1972) propôs uma distância euclidiana modificada e que também utiliza frequências alélicas. Entretanto, essa medida tem a vantagem de se situar no intervalo de 0 a 1. Ela também obedece ao princípio da desigualdade triangular e é dada por: m j jm i ijijXY qp n d 1 1 2 2 11 em que: dXY é a distância de Rogers entre as populações X e Y ijij qp e são as frequências do alelo i no loco j nas populações X e Y n é o número de locos contendo os alelos i estudados. m é o número de alelos 3.2.5 Distância baseada no parentesco Esta distância é dada pela expressão: m i ii m i ii XY pp pp 1 21 1 2 21 1 2/1 ̂ em que: XŶ é a distância baseada no parentesco entre as populações X e Y; piX e piY são as frequências do alelo i nas populações X e Y, respectivamente; m é o número de alelos no loco i. 3.2.5 Coeficientes de similaridade Os coeficientes de similaridade (sij) representam o complemento das distâncias genéticas, isto é, sij = 1- dij. Na maioria das vezes, esses coeficientes são baseados em dados binários do tipo 0 e 1 utilizando-se de frequências de bandas em zimogramas ou por análises de marcadores de DNA. A partir das análises das bandas monta-se uma tabela de contingência 2 x 2 como mostrado abaixo: 33 População X Total Presença (1) Ausência (0) População Y Presença (1) a b a + b Ausência (0) c d c + d a + c b + d n em que: a é o número de indivíduos com presença de bandas nas duas populações; b é o número de indivíduos com presença de banda na população Y e ausência na população X; c é o número de indivíduos com presença de banda na população X e ausência na população Y; d representa a ausência de bandas nos indivíduos das duas populações. 3.2.6.1 Coeficiente de Jaccard cba a SJ 3.2.6.2 Coeficiente de Dice ou de Nei e Li cba a SNL 2 2 3.2.6.3 Coeficiente de concordância simples ou simple matching dcba da SCS Os coeficientes de similaridade diferem quanto à inclusão ou não das concordâncias do tipo 00 (d), isto é, ausência de bandas nos indivíduos das duas populações. A justificativa para esse fato é porque a ausência da banda, muitas vezes, tem causas diferentes nos indivíduos considerados. A escolha de qual coeficiente usar depende dos objetivos da pesquisa, mas geralmente as correlações entre eles são altas. Santos Dias (1998) recomenda o coeficiente de Jaccard para comparar populações da mesma espécie, enquanto que o coeficiente de Dice é mais apropriado para comparações de itens muito diversos, como espécies, por exemplo. Após a estimação das distâncias ou similaridades genéticas por uma metodologia qualquer, normalmente essas distâncias são empregadas em análises de agrupamentos, os quais procuram identificar padrões na distribuição da diversidade. Os métodos de agrupamentos mais empregados são os hierárquicos e os de otimização. Nos métodos hierárquicos, os materiais genéticos são agrupados por um processo que se repete em vários níveis até que seja estabelecido o dendrograma. Nos métodos de otimização, o conjunto de materiais genéticos é subdividido em subgrupos exclusivos por meio da maximização ou minimização de alguma medida preestabelecida. O estudo da divergência genética pode ser realizado, ainda, pela análise de componentes principais ou por variáveis canônicas. Esses e outros métodos de ordenação de dados podem ser utilizados facilmente graças à existência de pacotes estatísticos para microcomputadores. 34 3. 3 EXERCÍCIOS 1. Considere uma amostra de 5 indivíduos, retirados de duas populações diferentes e avaliados para três isoenzimas: ACP (fosfatase ácida), PGM (fosfogluco mutase) e GOT (glutamato desidrogenase): Indivíduos ACP PGM GOT 1 2 1 2 População 1 1 aa ab cc aa aa 2 aa bc ab aa ab 3 aa ab cc aa bb 4 aa aa ac aa ab 5 aa bb cc aa ab População 2 1 ab cc bb cc bc 2 cc ab cc ab aa 3 bb bc cc ac cc 4 bc aa ac aa ac 5 ac ac bc bb bb Determine, para cada população: a) as frequências alélicas p(a), p(b) e p(c) para todos os locos. b) a diversidade genética (H) para cada loco. c) a diversidade média considerando todos os locos. d) os componentes da diversidade entre e dentro das populações e) a proporção de locos polimórficos f) o número de alelos por loco polimórfico Veja referência: Carrera, A.D.; Pizarro, G.; Poverene, S.; Feingold, S.; Leon, A.J.; Berry, S.T. Variability among inbred lines and RFLP mapping of sunflower isozymes. Genetics and Molecular Biology, v. 25, n. 1, p.65-72, 2002. 2. Estime a distância genética de Nei e a distância euclidiana entre as populações 1 e 2, considerando os locos ACP-1, ACP-2 e PGM. 3. Estime os componentes da diversidade (entre e/ou dentro das populações) nas seguintes situações: (a) (b) População 1 População 2 População 1 População 2 AA 1 0 AA 0,25 0,25 Aa 0 0 Aa 0,50 0,50 aa 0 1 aa 0,25 0,25 (c) População 1 População 2 AA 0,49 0,04 Aa 0,42 0,32 Aa 0,09 0,64 35 4. Estime o coeficiente de similaridade de Jaccard para os dados binários (0 ou 1) obtidos com marcadores moleculares (12 bandas) para cinco linhagens (L-1 a L-5). Bandas L-1 L-2 L-3 L-4 L-5 B-1 1 0 1 0 0 B-2 1 1 0 0 1 B-3 0 1 0 1 1 B-4 1 1 0 0 1 B-5 0 1 0 1 1 B-6 0 0 1 1 1 B-7 1 0 1 1 0 B-8 0 1 0 1 1 B-9 0 1 1 1 1 B-10 0 1 0 1 1 B-11 1 1 1 1 1 B-12 1 1 1 0 0 Monte a matriz de similaridade e construa os dendrogramas pelos métodos do vizinho mais próximo e UPGMA. 5. Considere os dados apresentados na tabela 6.2 de Cruz e Regazzi, 1994, p. 290. Utilize apenas os genitores 1 a 5 e as variáveis X1, X2 e X3 e estime a distância euclidiana. Construa o dendrograma empregando o método do vizinho mais próximo. 6. Suponha que um gene tenha oito alelos nas frequências de 0,55; 0,20; 0,09; 0,06; 0,04; 0,03; 0,02 e 0,01. Estime o número de alelos efetivos. Qual seria este número se cada alelo estivesse na frequência de 0,125? REFERÊNCIAS 1. Hamrick, J.L.; Godt, M.J.W. Allozyme diversity in plant species. In: Brown, H.D.; Clegg,M.T.; Kalher, A.L.; Weir, B.S. Plant population genetics, breeding, and genetic resources. Sinauer Associates Inc. Publishers, Sunderland, p. 43-63, 1990. 2. Hamrick, J.L.; Godt, M.J.W. Allozyme diversity in cultivated crops. Crop Science, v. 37, p. 26-30, 1997. 3. Wadt, L.H.O.; Kageyama, P.Y. Estrutura genética e sistema de acasalamento de Piper hispidinervum. Pesq. agropec. bras., Brasília, v.39, p.151-157, 2004. 4. Ribeiro, R.A.; Lovato, M.B. Mating system in a neotropical tree species, Senna multijuga (Fabaceae). Genetics and molecular biology, v.27, n.3, p.418-424, 2004. 36 4. PARENTESCO E ENDOGAMIA Dois indivíduos são geneticamente relacionados (parentes) se eles possuem um ou mais ancestrais comuns ou se um é descendente do outro. A consequência fundamental desse fato é que esses indivíduos podem possuir cópias dos mesmos alelos dos ancestrais e, assim, passá-los aos descendentes, se eles forem acasalados. O termo genérico endogamia é utilizado para se referir a sistemas de acasalamentos entre indivíduos aparentados. O ponto culminante da endogamia é que, via de regra, os descendentes endogâmicos perdem vigor ou têm a média de um caráter qualquer reduzida. Além disso, a
Compartilhar