Buscar

Genética de populacões

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 122 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

DEPARTAMENTO DE BIOLOGIA 
PROGRAMA DE PÓS-GRADUAÇÃO 
EM GENÉTICA E MELHORAMENTO DE PLANTAS 
 
 
 
 
 
 
 
 
 
 
 
 
NOTAS DE AULAS 
GENÉTICA DE POPULAÇÕES 
 
 
 
 
 
 
 
 
 
 
 
 
Prof. César A. Brasil P. Pinto 
 
 
 
 
 
 
 
 
 
 
 
LAVRAS 
2013
 i 
 ii 
SUMÁRIO 
 
 
1. Introdução....................................................................................................................................... 1 
 
2. Sistemas de Acasalamentos............................................................................................................ 4 
2.1. Predominantemente alógamas.................................................................................................. 4 
2.1.1 Desequilíbrio de ligação ou desequilíbrio gamético............................................................... 9 
2.2. Predominantemente autógamas.................................................................................................. 18 
2.3. Acasalamentos mistos................................................................................................................. 19 
2.4 Exercícios..................................................................................................................................... 24 
 
3. Medidas de variação e distância genética...................................................................................... 27 
3.1. Medidas de Variação genética.................................................................................................... 27 
3.2. Medidas de distâncias (similaridade) genéticas......................................................................... 29 
3.2.1. Distância genética de Nei................................................................................................. 30 
3.2.2. Distância Euclidiana......................................................................................................... 30 
3.2.3. Distância generalizada de Mahalanobis........................................................................... 31 
3.2.4. Distância de Rogers.......................................................................................................... 32 
3.2.5. Coeficientes de similaridade............................................................................................. 32 
3.3. Exercícios.................................................................................................................................... 34 
 
4. Relações genéticas entre parentes.................................................................................................. 36 
4.1. Estimativa dos coeficientes de parentesco e de endogamia.................................................. 36 
4.2. Sistemas regulares de endogamia........................................................................................... 42 
4.2.1. Autofecundação................................................................................................................ 42 
4.2.2. Retrocruzamento............................................................................................................... 43 
4.2.3. Irmãos germanos............................................................................................................... 44 
4.2.4. Meios irmãos..................................................................................................................... 44 
4.2.5. Endogamia parcial............................................................................................................. 44 
4.3. Exercícios................................................................................................................................ 47 
 
5. Deriva genética............................................................................................................................... 48 
5.1. Amostragem............................................................................................................................ 50 
5.2. Endogamia.............................................................................................................................. 56 
5.3. Tamanho efetivo das populações........................................................................................... 61 
5.4. Exercícios................................................................................................................................ 66 
 
6. Alteração nas frequências alélicas – Processos Sistemáticos........................................................ 68 
6.1. Seleção.................................................................................................................................... 68 
6.2. Migração................................................................................................................................. 78 
6.3. Mutação................................................................................................................................... 80 
6.4. Exercícios................................................................................................................................ 83 
 
 
 
 
 
 
 iii 
 
7. Componentes dos valores fenotípicos e suas variâncias............................................................... 84 
7.1. Efeitos gênicos........................................................................................................................ 84 
7.1.1. Efeito médio de um alelo.................................................................................................. 88 
7.1.2. Efeito de uma substituição alélica.................................................................................... 89 
7.2. Valor genético ou reprodutivo................................................................................................ 90 
7.3. Desvio de dominância............................................................................................................ 91 
7.4. Desvio de interação................................................................................................................ 92 
7.5. Variâncias............................................................................................................................... 94 
7.5.1. Componentes genéticos da variância............................................................................... 95 
7.5.2. Variâncias em populações endogâmicas.......................................................................... 97 
7.5.3. Variância devido ao desequilíbrio de ligação.................................................................. 100 
7.5.4. Variância da interação genótipo x ambiente.................................................................... 102 
7.5.5. Variância ambiental.......................................................................................................... 102 
7.6. Exercícios................................................................................................................................ 103 
 
 
8. Covariância entre parentes............................................................................................................. 105 
8.1. Covariância genética............................................................................................................ 106 
8.2. Interação epistática............................................................................................................... 111 
8.3. Covariância ambiental.......................................................................................................... 111 
8.4. Componentes da variância genética em função das covariâncias entre parentes............... 112 
8.4.1. Covariância pai-filho......................................................................................................... 112 
8.4.2. Dialelos..............................................................................................................................113 
8.4.3. Delineamento I de Comstock e Robinson........................................................................ 114 
8.4.4. Delineamento II de Comstock e Robinson...................................................................... 114 
8.5. Exercícios............................................................................................................................. 116 
 
 
Referências 
 
 
1. BROWN, A.H.D.; CLEGG, M.T.; KAHLER, A.L. & WEIR, B.S. (Eds.) Plant Population 
Genetics, Breeding, and Genetic Resources, Sinauer Associates Inc., Sunderland, 448p. 
1990. 
 
2. CROW, J.F. & KIMURA, M. An Introduction to Population Genetics Theory, The 
Blackburn Press, 608p. 2009. 
 
3. CRUZ, C.D.; FERREIRA, F.M. & PESSONI, L.A. Biometria Aplicada ao Estudo da 
Diversidade Genética. Universidade Federal de Viçosa, 620p. 2011. 
 
4. FALCONER, D.S.; MACKAY, T.F.C. Introduction to Quantitative Genetics, 4th ed., 
Longman, Essex, England, 464p. 1996. 
 
5. HAMILTON, M.B. Population Genetics, Wiley-Blackwell, Oxford, 407p, 2009. 
 
6. HARTL, D.L. & CLARK, A.G. Princípios de Genética de Populações, 4ª ed., Artmed 
Editora SA., Porto Alegre, 659p. 2010. 
 
 iv 
7. HEDRICK, P.W. Genetics of Populations, 4th edition, Jones and Bartlett Publishers, 
Sudbury, 700p., 2009. 
 
8. LI, C.C. First Course in Population Genetics, Boxwood Press, Pacific Groove, 631p. 
1978. 
 
9. LYNCH, M.; WALSH, B. Genetics and Analysis Of Quantitative Traits. Sinauer 
Associates, Inc. Publishers, Sunderland, 980, 1998. 
 
10. METTLER, L.E. & T.G. GREGG. Genética de Populações e Evolução, VENCOVSKY, 
R.; AZEVEDO, J.L. & BANDEL, G. (Trad.) Poligono, São Paulo, 262p. 1969. 
 
11. PIRCHNER, F. Population Genetics in Animal Breeding, 2nd ed., Plenum Press, New 
York, 414p. 1983. 
 
12. SOUZA JR., C.L. Componentes Da Variância Genética E Suas Implicações no 
Melhoramento Vegetal, FEALQ, Piracicaba, 134p. 1989. 
 
13. TEMPLETON, A.R. Population Genetics and Microevolutionary Theory. John Wiley & 
Sons, Inc., 705p., 2006. 
 
14. WEIR, B.S. Genetic Data Analysis II, Sinauer Associates, Inc. Publishers, Sunderland, 
Massachusetts, 445p., 1996. 
 
15. WRICKE, G. & WEBER, W.E. Quantitative Genetics and Selection in Plant Breeding, 
de Gruyter, Berlin, 406p. 1986. 
 
 v 
 1 
1. INTRODUÇÃO 
 
 A genética de populações objetiva estudar as consequências estatísticas do Mendelismo 
em grupos de indivíduos ou famílias, isto é, ela estuda os fenômenos hereditários no nível 
populacional. Pode ser entendida também, como o estudo de processos que afetam a distribuição 
dos genótipos entre os indivíduos de uma população através do tempo e do espaço. 
Essa disciplina é parte central de muitas metodologias modernas que têm sido utilizadas 
na biologia populacional, evolução, melhoramento de plantas e animais e conservação de recursos 
genéticos. Ela conecta a biologia molecular à biologia populacional e evolutiva e fornece os 
princípios para o entendimento das adaptações ambientais e a base teórica do melhoramento de 
plantas e de animais. A genética de populações tem uma tarefa de determinar quanto da variação 
genética existe em populações naturais e explicar a sua origem, manutenção e importância 
evolutiva. Hoje, os métodos tradicionais, teóricos e empíricos da genética de populações, utilizam 
as novas e poderosas ferramentas da biologia molecular permitindo se ter uma visão, sem 
paralelo, da diversidade genética e dos mecanismos evolutivos que moldam essa diversidade. 
 A população, via de regra, é mais importante que indivíduos isolados, pois a vida de cada 
um desses indivíduos é limitada pelo tempo (uma única geração) e sua constituição genética é fixa 
(ausência de variabilidade genética) durante toda a sua existência. Ao contrário, uma população é 
praticamente imortal (muitas gerações), pode ser grande ou pequena, pode estar distribuída em 
uma área ampla ou limitada, e pode mudar a sua estrutura genética através das gerações, isto é, 
evoluir. Em outras palavras, a população é altamente dinâmica. 
 A teoria da genética de populações é toda fundamentada em princípios matemáticos, 
usando como modelo os caracteres monogênicos, de fácil identificação fenotípica. A partir dos 
conhecimentos adquiridos com esses modelos, generalizações e extensões podem ser feitas. 
Grande parte dos fundamentos matemáticos da genética de populações foi desenvolvida entre 
1920 e 1950 por três pesquisadores: R.A. Fisher, J.B.S. Haldane e S. Wright. 
 
Conceitos 
 
 Antes de iniciar o estudo das leis que regem o comportamento genético das populações é 
necessário conceituar alguns termos: 
 População: é um conjunto de indivíduos da mesma espécie, que ocupa o mesmo local, 
apresenta uma continuidade no tempo e seus membros possuem a capacidade de se interacasalar, 
isto é, os membros dessa população trocam alelos entre si. 
 Toda população possui um conjunto gênico (“gene pool” ou “pool gênico”) que lhe é 
peculiar. O pool gênico representa todos os genes presentes na população em uma dada geração 
ou período. Para cada gene da população podem-se determinar as frequências de seus alelos. A 
frequência alélica representa a proporção de um dado alelo em relação ao total de alelos situados 
em um mesmo loco cromossômico. A frequência genotípica representa a proporção de um 
determinado genótipo em relação ao número total de genótipos para o loco em questão, e está 
relacionada à frequência alélica da geração anterior (veja abaixo), já que na reprodução o que são 
passados são os alelos, e não os genótipos. Suponha, por exemplo, um gene A com dois alelos A
1
 
e A
2
, sem dominância. Considerando que os indivíduos sejam diplóides existem três genótipos 
possíveis: 
Genótipos Número Frequência 
A
1
A
1
 N11 D = N11/N 
A
1
A
2
 N12 H = N12/N 
A
2
A
2
 N22 R = N22/N 
Total N 1 
 2 
 As frequências alélicas p (A
1
) e q (A
2
) são dadas por, 
 
H
2
1
R
N2
N
N2
N2
N2
NN2
Aq
H
2
1
D
N2
N
N2
N2
N2
NN2
Ap
122212222
121112111






)(ˆ
)(ˆ
 
 
Isto é, a frequência de um dado alelo em organismos diplóides pode ser estimada tomando-se o 
somatório das frequências observadas dos indivíduos homozigóticos para o alelo em questão mais 
a metade da frequência observada dos indivíduos heterozigóticos para o referido alelo. 
 Se forem retiradas várias amostras de uma população vai haver uma variação nas 
estimativas das frequências alélicas cuja variância, considerando alelos sem dominância, pode ser 
estimada por: 
N2
q1q
qV
)ˆ(ˆ
)ˆ(

 , em que N é o número de indivíduos da amostra populacional. 
 
 Variação genética. A variação é um termo comumente usado para indicar diferenças em 
valores qualitativos ou quantitativos de um caráter entre indivíduos de uma população ou mesmo 
entre populações. Quando as causas desta variação são de natureza genética, ela é denominada de 
variação genética. A disponibilidade de variação genética é uma necessidade para mudanças 
evolutivas, de modo que determinar o quanto da variação existe dentro ou entre as populações se 
torna uma questão central para a biologia evolutiva, bem como para os melhoristas que se 
interessam por caracteres desejáveis nas espécies comercialmente importantes. 
 Os estudos iniciais da variação genética em populações naturais concentraram-se nos 
caracteres de fácil identificação, principalmente em mutantes morfológicos, tais como a coloração 
de flores e grãos, presença ou não de pêlos nos caules e folhas, etc. Um problema que surge na 
utilização de caracteres morfológicos ou fisiológicos é que normalmente eles ocorrem em número 
reduzido, não permitindo assim uma estimativa da variação genética total do genoma da espécie 
estudada. Outro problema associado a esses caracteres é que nem sempre a variação fenotípica se 
deve à variação genética e, muitas vezes, a herança não é bem conhecida. Situação semelhante 
ocorre paraos caracteres quantitativos. Um dos exemplos mais bem conhecido é a seleção para a 
porcentagem de óleo e proteína em grãos de milho, realizado por mais de 100 gerações na 
Universidade de Illinois, Estados Unidos. A porcentagem de óleo aumentou quase quatro vezes 
nas linhas selecionadas para alto teor e foi reduzida a menos de 1% nas linhas selecionadas para 
baixo teor. Esta seleção ainda está sendo realizada, demonstrando haver variabilidade genética 
suficiente para continuar dando resposta. 
 Em 1966 os pesquisadores passaram a utilizar a eletroforese de proteínas para estudar a 
variação genética em populações naturais. A eletroforese é executada passando-se uma corrente 
elétrica contínua através de um gel (amido, agarose ou acrilamida) onde a proteína é colocada. As 
proteínas migram por um determinado tempo e posteriormente são coradas com corantes 
específicos, de modo que a mobilidade relativa possa ser determinada. A mobilidade relativa 
geralmente é função do tamanho, carga e formato da molécula protéica. A mobilidade das 
diferentes formas da enzima é apresentada em um gráfico, denominado de zimograma. A figura 
1.1 demonstra os padrões de bandas para a enzima fosfogluco mutase (PGM) para uma amostra 
de dez indivíduos de uma população. 
 
 
 
 
 3 
 
 
 
50 
40 
30 
20 
10 
 
Indivíduos 1 2 3 4 5 6 7 8 9 10 
 
Figura 1.1 Zimograma para a enzima Fosfogluco Mutase (PGM) para uma amostra de dez 
indivíduos 
 
 A utilização da eletroforese de proteínas na genética de populações revigorou esta área na 
década de 1970, pois este método tornou possível o estudo da variação genética para quase todas 
as espécies, com pequeno emprego de equipamentos. Os locos enzimáticos, a princípio, revelaram 
ser uma fonte surpreendente de diversidade genética em populações naturais, além de serem de 
fácil avaliação para a maioria das espécies. 
 Pode-se, ainda, empregar marcadores de DNA, tais como RFLP, RAPD, AFLP, SSR, e 
outros, para estabelecer os padrões da variação genética presentes em qualquer tipo de população. 
O estudo molecular da variação genética (principalmente com o uso de marcadores de DNA) tem 
revelado uma amplitude de variação genética nunca antes imaginada. Esses marcadores permitem 
a obtenção de estimativas não tendenciosas da variação genética, pois são independentes da sua 
função. Os marcadores de DNA apresentam vantagens em relação aos marcadores 
isoenzimáticos, pois a sua variação não está limitada às regiões codantes do genoma, de modo que 
todas as categorias de variação podem, em princípio, ser detectadas. Outro tipo de marcador que 
tem sido muito empregado é o polimorfismo mononucleotídeo (single nucleotide polymorphism - 
SNP) ou de amino ácidos. As técnicas usadas para sequenciar grandes quantidades de DNA foram 
automatizadas de modo que muitas sequências podem ser obtidas e comparadas, além de permitir 
inferências sobre a variação dos aminoácidos entre indivíduos, populações e espécies. 
 
M
o
b
il
id
ad
e 
R
el
at
iv
a 
 4 
2. SISTEMAS DE ACASALAMENTOS 
 
 Os sistemas de acasalamentos determinam o modo de transmissão dos genes de uma 
geração à outra. As espécies vegetais apresentam vários sistemas de acasalamentos, que se 
agrupam em cinco classes (Brown, 1990): predominantemente alógamas, predominantemente 
autógamas, cruzamentos mistos (alogamia e autofecundação), parcialmente apomíticas e 
parcialmente de autofecundação de gametófitos, que ocorre em samambaias. Os sistemas de 
acasalamentos têm efeitos importantes na quantidade e na distribuição da variabilidade genética 
entre e dentro das populações. Além do mais, os sistemas de acasalamentos estão sob controle 
genético e, portanto, sujeitos aos processos evolutivos. 
 Diversos fatores podem afetar o sistema de acasalamento, tais como, o tamanho e a 
densidade populacional, o modo de polinização, a disponibilidade de polinizadores e de seus 
hábitos, a sincronia de florescimento e padrões de desenvolvimento vegetal, o nível de 
estruturação genética da população e a ocorrência de auto-incompatibilidade. A fragmentação do 
habitat também pode afetar o sistema de acasalamento da população remanescente, por meio do 
isolamento reprodutivo devido à redução do tamanho populacional e alteração da dispersão de 
pólen. O isolamento reprodutivo devido à fragmentação pode resultar em menor fluxo gênico 
entre as populações, associada à perda de variabilidade genética devido à deriva genética e ao 
acasalamento entre indivíduos aparentados, resultando em depressão endogâmica. 
 
2.1. Predominantemente alógamas (taxa de autofecundação, s < 0,05) 
 
As plantas desse grupo constituem a maioria das espécies vegetais e raramente sofrem 
autofecundação. Elas se reproduzem por acasalamentos ao acaso, que significa que cada 
indivíduo apresenta chance de se acasalar com qualquer outro indivíduo da população. Em termos 
probabilísticos o acasalamento ao acaso ocorre quando a probabilidade de acasalamento entre o 
genótipo Gi (macho) e do genótipo Gj (fêmea) é igual ao produto das probabilidades de suas 
frequências de ocorrência, isto é, 
 
     P G G P G Gim jf im jf. . 
para i, j = 1, ...N 
 
 Populações desse tipo são denominadas de panmíticas, se ocorrerem as condições abaixo: 
 
1) A população é composta por centenas ou milhares de indivíduos; 
2) Não há diferença de fertilidade e viabilidade entre os indivíduos; 
3) A meiose é normal nos dois sexos; 
4) Não ocorre seleção; 
5) Não ocorre fluxo gênico; 
6) A mutação gênica é desconsiderada. 
 
 É importante salientar que em algumas situações podem ocorrer acasalamentos ao acaso 
para um loco e não para outro loco ou caráter. Por exemplo, plantas que florescem em uma 
mesma época cruzam-se entre si, mas não com outras mais precoces ou tardias. Deste modo, está 
havendo acasalamentos preferenciais (“assortative and disassortative matings”) entre plantas com 
florescimento coincidente, mas ao mesmo tempo os acasalamentos podem ser ao acaso para a cor 
da semente ou qualquer outro caráter, supondo não haver ligação entre os genes que controlam a 
época do florescimento e os demais caracteres. 
 
 
 5 
Equilíbrio de Hardy-Weinberg 
 
 As populações panmíticas normalmente se encontram em equilíbrio de Hardy-Weinberg. 
Vejamos como isto acontece. Considere, por exemplo, um loco A em um organismo diplóide, 
contendo os alelos A
1
 e A
2
. No quadro abaixo são mostrados todos os acasalamentos possíveis 
entre os indivíduos da população, e as respectivas frequências genotípicas dos descendentes: 
 
Acasalamentos Frequências 
Frequência genotípica na descendência 
A
1
A
1
 A
1
A
2
 A
2
A
2
 
A
1
A
1
 x A
1
A
1
 D
2
 D
2
 - - 
A
1
A
1
 x A
1
A
2
 2DH DH DH - 
A
1
A
1
 x A
2
A
2
 2DR - 2DR - 
A
1
A
2
 x A
1
A
2
 H
2
 H
2
/4 H
2
/2 H
2
/4 
A
1
A
2
 x A
2
A
2
 2HR - HR HR 
A
2
A
2
 x A
2
A
2
 R
2
 - - R
2
 
 
Frequência de A A D DH
H
D H1 1 2
2 2
4
1
2
    





 
 
Frequência de A A DH DR
H
HR D H R H1 2
2
2
2
2
1
2
1
2
     





 





. 
Frequência de A A
H
HR R R H2 2
2
2
2
4
1
2
    





 
 
Como : 
 
)( 1ApH
2
1
D  e )( 2AqH
2
1
R  tem-se: 
 
A
1
A
1
 = p
2
 A
1
A
2
 = 2pq A
2
A
2
 = q
2
 
 
Assim, o acasalamento ao acaso gera uma descendência em que as proporções genotípicas 
dependem apenas das frequências alélicas da geração parental, e não das frequências genotípicas 
iniciais D, H e R. Estas frequências genotípicas (p
2
, 2pq, q
2
) poderiam ser obtidas também unindo 
aleatoriamente os gametas contendo os alelos A
1
 (com frequência p) e A
2
 (com frequência q), 
como mostrado no seguinte quadro: 
 
Gametas p(A
1
) q(A
2
) 
p(A
1
) 
p
2
 
A
1
A
1
 
pq 
A
1
A2
 
q(A
2
) 
pq 
A
1
A
2
 
q
2 
A
2
A
2
 
 
Assim, "o acasalamento aleatório dos indivíduos da população fornece frequências genotípicas na 
próxima geração, idênticas àquelas fornecidas pela união aleatória de gametas". Este postulado é 
conhecido como teorema dos acasalamentos ao acaso. 
 6 
 As novas frequências alélicas (p1 e q1) podem ser determinadas facilmente empregando-se 
a generalização feita anteriormente, isto é, ela é igual à frequência dos homozigotos mais a 
metade da frequência dos heterozigotos, ou seja: 
 
    pqpppqppqpp  221 221 
 
    qqpqpqqpqqq  221 221 
 
 Desse modo, fica demonstrado que as novas frequências alélicas (p1 e q1) são iguais às 
frequências alélicas da população parental (p e q). Usando-se o teorema dos acasalamentos ao 
acaso pode-se verificar que as novas frequências genotípicas serão: 2111
2
1 qqp2p ; ; , idênticas 
portanto às frequências genotípicas da geração anterior. 
 Verifica-se que, respeitadas as condições de panmixia, as frequências alélicas e 
genotípicas permanecem inalteradas geração após geração, e a população é dita estar em 
equilíbrio. Essa condição de equilíbrio é conhecida como Equilíbrio (ou Lei) de Hardy-Weinberg 
(descoberta independentemente por G.H. Hardy, um matemático britânico e W. Weinberg, um 
médico alemão, em 1908). Observe que o equilíbrio é atingido após uma única geração de 
acasalamentos ao acaso, indiferentemente das frequências D, H e R. A figura 2.1 ilustra as 
frequências genotípicas de populações em equilíbrio de Hardy-Weinberg para a amplitude total 
das frequências alélicas. 
 
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
q
0
10
20
30
40
50
60
70
80
90
100
F
re
q
ü
ê
n
c
ia
 g
e
n
o
tí
p
ic
a
 d
e
 u
m
a
 p
o
p
u
la
ç
ã
o
 e
m
 e
q
u
il
íb
ri
o
 (
%
) A1A1 A1A2 A2A2
 
Figura 2.1. Frequências genotípicas em populações em 
equilíbrio de Hardy-Weinberg em função das 
frequências alélicas em um loco com dois 
alelos. 
 
 O equilíbrio de Hardy-Weinberg independe do tipo de interação alélica e será atingido de 
modo semelhante tanto para genes codominantes como dominantes. 
 
 
 
 
 7 
Estimativa de frequências alélicas com dominância completa 
 
 Observe que as estimativas das frequências alélicas para genes codominantes requeriam as 
três frequências genotípicas (D, H, R). Entretanto, quando ocorre dominância (A
1
 > A
2
) os 
genótipos A
1
A
1
 e A
1
A
2
 se confundem fenotipicamente e as frequências D e H se somam, 
impossibilitando o cálculo das frequências alélicas. Contudo, sabendo-se que a população está em 
equilíbrio, a frequência q do alelo A
2
 pode ser estimada por: 
 
q1Ap
N
N
Aq 1222  )(ˆ e )(ˆ
 
A variância das frequências alélicas pode ser estimada por: 
N4
q1
qV
2ˆ
)ˆ(

 , em que N é o número 
de indivíduos da amostra. 
 
Alelismo múltiplo 
 
 O princípio de Hardy-Weinberg pode ser estendido para qualquer número de alelos. Essa 
extensão é particularmente importante para os marcadores moleculares do tipo SSR (micro-
satélites) que geralmente ocorrem em formas múltiplas. No caso de alelismo múltiplo envolvendo 
alelos dominantes, as frequências alélicas também podem ser estimadas, assumindo que a 
população esteja em equilíbrio de Hardy-Weinberg. Por exemplo, considere três alelos com a 
seguinte ordem de dominância: A
1
 > A
2
 > A
3
. Os genótipos possíveis e suas frequências são 
apresentados no quadro abaixo: 
 
Genótipos Números Frequências Fenótipos 
A
1
A
1
 N11 p1
2
 A
1
 
A
1
A
2
 N12 2p1p2 A
1
 
A
1
A
3
 N13 2p1p3 A
1
 
A
2
A
2
 N22 p2
2
 A
2
 
A
2
A
3
 N23 2p2p3 A
2
 
A
3
A
3
 N33 p3
2
 A
3
 
Total N 1 
 
 Assim, as frequências alélicas seriam dadas por: 
 
 232
332322
2
332
2
2
332322
33
33
2
)(
pp
N
NNN
pppp
N
NNN
N
N
Ap





 
 8 
N
N
N
NNN
Ap
pp
N
NNN
33332322
22
32
332322
)( 




 
E, finalmente: p1 = 1 - p2 - p3 
 
 Para um número m de alelos as frequências genotípicas em uma população em equilíbrio 
será dada por (p1 + p2 + ... + pm)
2
 = mmm ppppppppp 2121
22
2
2
1 2...22  . 
 
 
 As variâncias das frequências alélicas são estimadas por: 
N2
p1p
pV iii
)ˆ(ˆ
)ˆ(

 , para genes 
codominantes com m alelos, e 
N4
pp1
pV
2
32
1
)ˆˆ(
)ˆ(

 , 
)ˆ(
)]ˆ(ˆ[ˆ
)ˆ(
1
122
2
p1N4
p1p2p
pV


 e 
N
p
pV
4
ˆ1
)ˆ(
2
3
3

 , para uma série dominante com três alelos. 
 
 Essas variâncias são bem maiores que a variância para alelos codominantes. A razão 
entre variâncias é dada por 
q
q
ˆ2
ˆ1
 e será tanto maior quanto menor for o valor de q̂ . 
 
Teste de equilíbrio de Hardy-Weinberg 
 
 Para testar se uma população está em equilíbrio de Hardy-Weinberg utiliza-se o teste do 

2
 (Qui quadrado), 




k
1i E
2
EO2
F
FF )(
 
Em que FO e FE são as frequências observadas e esperadas e k é o número de classes genotípicas. 
 
 O número de graus de liberdade é dado por: GL = n
o
 de classes fenotípicas - 1 - n
o
 de 
frequências alélicas estimadas. No caso de caracteres controlados por genes com dominância 
completa ou de séries dominantes (caso de alelos múltiplos) não há graus de liberdade 
disponíveis, de forma que não é possível realizar o teste. 
 
 Dois pontos interessantes devem ser destacados para as populações em equilíbrio de 
Hardy-Weinberg: 
 
1) Admitindo dois alelos em um loco, a frequência máxima de heterozigotos é 50% e ocorre 
quando p = q = ½. No caso de alelos múltiplos a frequência de cada heterozigoto será sempre 
menor que ½ porém o somatório das frequências de heterozigotos será maior quanto maior for 
o número de alelos e se a frequência alélica for igual para todos os alelos (veja abaixo). 
 9 
Homozigotos = pi
i
m
2
1
 
 
Heterozigotos = 1- pi
i
m
2
1
 
Se pi = 1/m então: 
 
Heterozigotos = 1 1
1
2
2  





mp m
mi
 
 
Heterozigotos = 
m
m
 1
, em que m é o número de alelos. 
 Por exemplo, se ocorrem 5 alelos em igual frequência, a proporção de genótipos 
heterozigóticos seria 4/5 ou 80%. 
 
2) Quando a frequência do alelo recessivo é muito baixa, este alelo se encontra principalmente 
nos heterozigotos. Isto ocorre porque se q é pequeno a frequência do genótipo recessivo tende 
para zero. Assim, a proporção de indivíduos heterozigotos na população seria 
aproximadamente: 
 
2
2
2
2
2
1 2
2
12
pq
p pq
pq
p p q
q
q q
q
q



 

( )
 
 
 Por exemplo, se em uma população q = 0,01 então q
2
 = 1/10.000 e a proporção de 
indivíduos heterozigotos é 198/10.000. Outra maneira de visualizar este fato é determinar a 
frequência relativa do alelo recessivo presente no heterozigoto e no homozigoto recessivo. Como 
o heterozigoto possui apenas a metade dos alelos recessivos, então a frequência deste alelo é 
2pq/2 = pq. No homozigoto os dois alelos são recessivos, portanto a frequência é q
2
. A frequência 
relativa será dada por: 
pq
q
p
q2
 
 
Se q = 0,01 então p/q = 99 isto é, para cada alelo recessivo presente no homozigoto existem 99 
alelos ocultos no heterozigoto. Esse resultado tem uma importância muito grande no processo de 
seleção, que será visto posteriormente. 
 
2.1.1 Desequilíbrio de ligação ou desequilíbrio gamético 
 
 O ponto de equilíbrio das frequências genotípicas após uma única geração de 
acasalamentos ao acaso é alcançado para cada loco considerado individualmente. Entretanto, 
quando se consideram dois ou mais locos, o equilíbrio somente é atingido gradualmente. Até que 
seja atingido o equilíbrio, a população se encontra em desequilíbrio, que significa a associação 
não aleatória de alelos de locos diferentes. Para ilustrar esse fato, suponha uma população 
composta das linhagens A
1
B
1
/A
1
B
1
 e A
2
B
2
/A
2
B
2
 em igual número e com acasalamentos ao acaso. 
Inicialmente, admita que os locos A e B não estejam ligados. 
 
 
 
 10 
Geração0 Gametas 
½ A
1
B
1
/A
1
B
1
 ½ A
1
B
1
 
½ A
2
B
2
/A
2
B
2
 ½ A
2
B
2
 
 
De acordo com o teorema dos acasalamentos ao acaso, na primeira geração tem-se: 
 
Geração 1 Gametas 
¼ A
1
B
1
/A
1
B
1
 3/8 A
1
B
1
 
½ A
1
B
1
/ A
2
B
2
 1/8 A
1
B
2
 
¼ A
2
B
2
/A
2
B
2
 1/8 A
2
B
1
 
 3/8 A
2
B
2
 
 
 Observe que para cada loco separadamente a população já se encontra em equilíbrio de 
Hardy-Weinberg na geração 1, mas para os dois locos considerados juntos ocorrem apenas três 
dos dez genótipos possíveis. Portanto, a população ainda não se encontra em equilíbrio. Na 
geração 2 tem-se: 
 
Genótipos 
Frequências 
genotípicas 
observadas 
Frequências 
esperadas no 
equilíbrio 
Genótipos 
Frequências 
genotípicas 
observadas 
Frequências 
esperadas no 
equilíbrio 
A
1
B
1
/A
1
B
1
 9/64 4/64 A
1
B
2
/A
2
B
1
 2/64 8/64 
A
1
B
1
/A
1
B
2
 6/64 8/64 A
1
B
2
/A
2
B
2
 6/64 8/64 
A
1
B
1
/A
2
B
1
 6/64 8/64 A
2
B
1
/A
2
B
1
 1/64 4/64 
A
1
B
1
/A
2
B
2
 18/64 8/64 A
2
B
1
/A
2
B
2
 6/64 8/64 
A
1
B
2
/A
1
B
2
 1/64 4/64 A
2
B
2
/A
2
B
2
 9/64 4/64 
 
 Assim, mesmo após duas gerações de acasalamentos ao acaso, a população ainda não 
atingiu o equilíbrio, embora nesta geração ocorram todos os genótipos possíveis. 
 O equilíbrio só existirá quando houver independência entre os alelos do loco A e dos 
alelos do loco B, isto é: 
Equilíbrio: P(A
1
B
1
) = P(A
1
) . P(B
1
) 
 
Portanto, a diferença entre a frequência observada do gameta A
1
B
1
 e a frequência dada pelo 
produto das suas frequências alélicas [(A
1
) x (B1)], é chamada de Desequilíbrio de ligação ou 
Desequilíbrio gamético (DL), e é fornecida por: 
 
D = P(A
1
B
1
) - P(A
1
) . P(B
1
) 
 
No presente caso, verifica-se na geração 0 que: 
 
 P(A
1
B
1
) = 1/2 
 P(A
1
B
2
) = 0 
 P(A
2
B
1
) = 0 
 P(A
2
B
2
) = 1/2 
 
 P(A
1
) . P(B
1
) = 1/2 . 1/2 = 1/4 
 
 D0 = 1/2 - 1/4 = 1/4 
 
 
 
 11 
Na geração 1 tem-se: 
 
 P(A
1
B
1
) = 3/8 
 P(A
1
B
2
) = 1/8 
 P(A
2
B
1
) = 1/8 
 P(A
2
B
2
) = 3/8 
 
 D1 = 3/8 – 1/4 = 1/8 
 
Na geração 2 tem-se: 
 
 P(A
1
B
1
) = 5/16 
 P(A
1
B
2
) = 3/16 
 P(A
2
B
1
) = 3/16 
 P(A
2
B
2
) = 5/16 
 
 D1 = 5/16 – 1/4 = 1/16 
 
 Observa-se que o desequilíbrio ocorre mesmo para genes independentes, como 
demonstrado no presente exemplo. O termo “desequilíbrio de ligação” é empregado para 
enfatizar que a ligação gênica faz com que a população demore mais tempo para atingir o ponto 
de equilíbrio (veja abaixo). Para verificar como ocorre a aproximação ao equilíbrio considere as 
seguintes frequências gaméticas e alélicas: 
 
Gametas Frequência Alelos Frequência 
A
1
B
1
 x1 A
1
 p1 = x1 + x2 
A
1
B
2
 x2 A
2
 q1 = x3 + x4 
A
2
B
1
 x3 B
1
 p2 = x1 + x3 
A
2
B
2
 x4 B
2
 q2 = x2 + x4 
 
As frequências dos quatro gametas x1, x2, x3 e x4 podem ser escritas do seguinte modo: 
 
 A
1
 A
2
 Somatório p/ B 
B
1
 x1 = p1p2 + D x3 = q1p2 – D p2 
B
2
 x2 = p1q2 – D x4 = q1q2 + D q2 
Somatório p/ A p1 q1 
 
Portanto, para o gameta A
1
B
1
 o desequilíbrio será: 
 
 D = x1 – p1 p2 
 
Escrevendo p1 e p2 em função dos valores das frequências gaméticas, mostradas anteriormente 
tem-se: 
 
 D = x1 - (x1 + x2) (x1 + x3) 
 D = x1 - x1
2
 - x1x3 - x1x2 - x2x3 
 D = x1(1-x1 - x2 - x3) - x2x3 
 
 como x1 + x2 + x3 + x4 = 1 então: 
 
 12 
 x4 = 1 - x1 - x2 - x3 
 
e o desequilíbrio pode ser escrito: 
 
 D = x1x4 - x2x3 
 
 Com a expressão escrita dessa maneira nota-se que D é função do produto dos gametas 
em associação (A
1
B
1
 e A
2
B
2
) menos o produto dos gametas em repulsão (A
1
B
2
 e A
2
B
1
), isto é: 
 
 
 D = (A
1
B
1
)(A
2
B
2
) - (A
1
B
2
)(A
2
B
1
) 
 
 
 Após uma geração de acasalamentos ao acaso, e considerando que a frequência de 
recombinação entre os genes A e B seja c, as frequências gaméticas serão: 
 
 Frequências gaméticas da descendência 
Genótipos Freq. A
1
B
1
 A
1
B
2
 A
2
B
1
 A
2
B
2
 
A
1
B
1
/A
1
B
1
 x1
2
 x1
2
 - - - 
A
1
B
1
/A
1
B
2
 2x1x2 x1x2 x1x2 - - 
A
1
B
2
/A
1
B
2
 x2
2
 - x2
2
 - - 
A
1
B
1
/A
2
B
1
 2x1x3 x1x3 - x1x3 - 
A
1
B
1
/A
2
B
2
 2x1x4 (1-c)x1x4 cx1x4 cx1x4 (1-c)x1x4 
A
1
B
2
/A
2
B
1
 2x2x3 cx2x3 (1-c)x2x3 (1-c)x2x3 cx2x3 
A
1
B
2
/A
2
B
2
 2x2x4 - x2x4 - x2x4 
A
2
B
1
/A
2
B
1
 x3
2
 - - x3
2
 - 
A
2
B
1
/A
2
B
2
 2x3x4 - - x3x4 x3x4 
A
2
B
2
/A
2
B
2
 x4
2
 - - - x4
2
 
 
 Denominando-se de x' as novas frequências gaméticas, tem-se: 
 
 x'1 = x
2
1 + x1x2 + x1x3 + (1 - c)x1x4 + cx2x3 
 x'1 = x1(x1 + x2 + x3 + x4) - cx1x4 + cx2x3 
 x'1 = x1 - c(x1x4 - x2x3) 
 x'1 = x1 - cD0 
 
Por analogia: 
 
 x'2 = x2 + cD0 
 x'3 = x3 + cD0 
 x'4 = x4 - cD0 
 
 Sendo D0 o desequilíbrio inicial e c a frequência de recombinação entre os locos A e B, o 
valor de D após uma geração de acasalamentos ao acaso será: 
 
 D1 = x'1x'4 - x'2x'3 
 D1 = (x1 - cD0)(x4 - cD0) - (x2 + cD0)(x3 + cD0) 
 D1 = x1x4 - x1cD0 - x4cD0 + c
2
D0
2
 - x2x3 - x2cD0 - x3cD0 - c
2
D0
2
 
 D1 = x1x4 - x2x3 - cD0(x1 + x2 + x3 + x4) 
 D1 = x1x4 - x2x3 - cD0 
 13 
 D1 = D0 - cD0 
 D1 = (1-c)D0 
 
Analogamente: 
 D2 = (1-c)D1 
 
e substituindo D1 por (1-c)D0 tem-se: 
 
 D2 = (1-c)(1-c)D0 
 D2 = (1-c)
2
D0 
 
E após t gerações: 
 
 Dt = (1-c)
t
D0 
 
Resolvendo a equação em função de t tem-se: 
 
 
 
 
 
 
ln ln
ln .ln ln
ln ln
ln
ln /
ln
D c D
D t c D
t
D D
c
t
D D
c
t
t
t
t
t
 
  





1
1
1
1
0
0
0
0
 
 
Chamando Dt/D0 de x tem-se: 
 
t
x
c


ln
ln 1
 
 Por exemplo, se x = ½ , então o tempo dado pela expressão acima seria aquele necessário 
para reduzir o desequilíbrio inicial à metade. 
 Observe que quanto mais ligados estiverem os genes (isto é, menor valor de c) mais tempo 
será necessário para se aproximar do equilíbrio. A figura 2 ilustra as alterações do desequilíbrio 
em função do número de gerações, para diferentes frequências de recombinação. 
 A aproximação à condição de equilíbrio dada pelas fórmulas apresentadas, se aplica 
também para qualquer número de locos considerados simultaneamente. Lembrando-se que (1-c) é 
a proporção dos parentais (não recombinantes) e que esta se torna cada vez menor à medida que o 
número de genes aumenta, verifica-se que a aproximação ao equilíbrio será bem mais rápida para 
muitos locos do que para locos considerados aos pares. 
 Por exemplo, para dois locos independentes (1-c) é igual a 1/2; para três locos 
independentes (1-c) é igual a 1/4 e para n locos (1-c) é igual a (½)
n-1
. 
 Desta forma, à medida que se considera um número cada vez maior de locos, observa-se 
uma aproximação muito rápida ao equilíbrio, para todos estes locos considerados conjuntamente, 
porém, permanecerão desequilíbrios entre estes genes considerados dois a dois ou três a três, etc. 
 
 14 
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Geração
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
D
es
eq
u
il
íb
ri
o
Do = 1
 c = 0,5 c = 0,3 c = 0,2 c = 0,1 c = 0,05 c = 0,01
 
 
Figura 2.2. Aproximação ao equilíbrio para dois genes considerados 
simultaneamente e com várias frequências de 
recombinação, ao longo de 15 gerações. 
 
Estimação do desequilíbrio de ligação 
 
 É possível estimar o valor do DL entre dois genes, a partir das frequências fenotípicas. 
Para isto, considere as seguintes situações: 
 
a) Dois locos codominantes 
 
 A
1
A
1
 A
1
A
2
 A
2
A
2
 Total 
B
1
B
1
 N11 N12 N13 N1. 
B
1
B
2
 N21 N22 N23 N2. 
B
2
B
2
 N31 N32 N33 N3. 
Total N.1 N.2 N.3 N 
 
 Quando há codominância, os gametas de cada um dos genótipos (fenótipos) podem ser 
identificados, exceto para o duplo heterozigoto. Para este fenótipo, os dois tipos de heterozigotos, 
atração e repulsão, são indistinguíveis. Deste modo, apenas nove classes fenotípicas são 
fornecidas natabela (a). A partir desta informação a frequência do gameta A
1
B
1
 é: 
















3241
4122
2112111
ˆˆˆˆ
ˆˆ
2
2
1
ˆ
xxxx
xxN
NNN
N
x 
em que  ,  , x x x2 3 4 são expressões análogas para os outros gametas. O valor de D deve ser obtido 
por iteração. Um método sugerido é usar a expressão: 
 
211
ˆˆˆˆ ppxD  
 
onde p1 é a frequência de alelo A
1
 e p2 é a frequência do alelo B
1
, devendo-se avaliar x1 por 
iteração. 
 15 


. .
. .
p
N N
N
p
N N
N
1
1 2
2
1 2
1
2
1
2




 
As outras substituições são: 
  
  
   
x p x
x p x
x p p x
2 1 1
3 2 1
4 1 2 11
 
 
   
 
Assim, a expressão de x1 fica: 
 
 
    

   
       
x
N
N N N
N x p p x
x p p x p x p x
1 11 21 12
22 1 1 2 1
1 1 2 1 1 1 2 1
1
2
2
1
1






   
  
     





 
 
 A única variável desconhecida nesta expressão é x1 , que pode ser calculada assumindo 
um valor de x1 para o lado direito da equação e calculando o valor resultante de x1 . Este valor é 
então substituído do lado direito e o processo é repetido até que se obtenha estabilidade dos 
valores. Um possível ponto inicial de iteração é: 
 
 
x
N N N
N N
1
11 12 21
22
2
2

 

 
 
 Para testar se 0D  usa-se a estatística: 
 
Q
ND
p p q q


   
2
1 2 1 2
 
 
com distribuição aproximada de 
2
 com 1 grau de liberdade; onde:  , p q1 1 são as frequências 
alélicas do gene A e  , p q2 2 as frequências alélicas do gene B. 
 
 
b) Dois locos dominantes 
 
 A
1
__ A
2
A
2
 Total 
B
1
__ N11 N12 N1. 
B
2
B
2
 N21 N22 N2. 
Total N.1 N.2 N 
 
 Quando há dominância completa em dois genes, ocorrem apenas quatro fenótipos 
distintos (tabela b). Assumindo acasalamentos ao acaso tem-se: 
 16 
   2211
2
2
2..222
214
.22
2
2.2
1
22
4
ˆ2ˆˆ2ˆ
ˆ4
ˆ
ˆˆˆˆ
)(ˆ
)(ˆ
ˆ
pppp
DN
Q
N
NN
N
N
D
qqxD
N
N
Bq
N
N
Aq
N
N
x







 
 
A distribuição de Q é aproximadamente a de 
2
 com 1 grau de liberdade. 
 
Outras medidas de desequilíbrio 
 
 Além de D, outras medidas também são úteis para se entender o desequilíbrio nas 
populações. Entre estas, cita-se o parâmetro D’ de Lewontin (1964), definido como, 
 
max
ˆ
D
D
D  
 
em que Dmax é o desequilíbrio máximo possível para um dado conjunto de frequências alélicas nos 
dois locos. Dmax é o menor valor dos produtos p1q2 ou p2q1, se D é positivo (fase de atração), ou o 
menor dos valores p1p2 ou q1q2 se D é negativo (fase de repulsão). Lembre-se que p1 e q1 são as 
frequências dos alelos A
1
 e A
2
 e p2 e q2 as frequências dos alelos B
1
 e B
2
. 
 A vantagem dessa medida é que ela varia de –1,0 a 1,0, independentemente das 
frequências alélicas nos dois locos. À semelhança do valor de D, o parâmetro D’ também se reduz 
em função do tempo e da frequência de recombinação (c), e pode ser estimado pela expressão: 
 
  0
t
t Dc1D  
 
D’ é fortemente influenciado por tamanhos amostrais pequenos, resultando em comportamento 
errático quando se comparam locos com frequências alélicas baixas. 
 Outra medida importante é r
2
, também descrita como 
2
 na literatura, e que pode ser 
estimada por: 
2211
2
2 )ˆ(
qpqp
D
r  
 
 Devlin e Risch (1995) apresentam e comparam, também, várias outras medidas do DL 
empregadas para o mapeamento genético. Essas medidas são apresentadas no quadro abaixo. 
 
 
 
 17 
Símbolo Fórmulas 
 
2211 qpqp
D̂
 
D’ 
12qp
D̂
 
 
42 xp
D̂
 
d 
22qp
D̂
 
Q 
3241 xxxx
D

ˆ
 
 
 
 Como se podem observar, estas medidas diferem apenas no denominador, que servem 
para padronizar o D. Segundo os autores, D’ e  são mais fáceis de interpretar e exibem 
comportamento quase idêntico, e são indicados para o mapeamento de genes por meio do DL. 
 
Causas e fatores que afetam o desequilíbrio de ligação 
 
 Para Hartl & Clark (2010) o equilíbrio de ligação é resultado da história. Para entender as 
suas causas considere uma região cromossômica monomórfica e sem recombinação, representada 
pelos genes A e B. Em um dado momento o alelo A muta para a e, devido ao acaso ou à seleção 
natural, este alelo (a) aumente a sua frequência. Agora na população teremos as combinações AB, 
e aB. Agora suponha outra mutação, de B para b em um cromossomo de constituição aB. Então a 
população resultante terá as combinações AB, aB e ab. Observe que a combinação Ab está 
faltando, isto é, sua frequência é zero. Na ausência de recombinação ou mutação a sua frequência 
deverá permanecer 0. Neste caso, o valor de D’ = 1 e o valor de r
2
 depende de onde a mutação de 
B para b ocorreu. Se ela ocorreu cedo na linhagem que carregava a mutação a, a correlação entre 
a e b será alta, mas se ela ocorreu mais tarde na genealogia, então a correlação entre a e b será 
baixa. Por exemplo, considere as frequências das combinações PAB = 0,5, PAb = 0, PaB = 0,01 e Pab 
= 0,49; isso representa uma situação na qual a mutação b surgiu cedo na linhagem, e assim a 
maioria dos cromossomos que carregam a também carregam b: nesse caso r
2
 = 0,96. Suponha 
outro exemplo em que PAB = 0,5, PAb = 0, PaB = 0,49 e Pab = 0,01; isto representa uma situação na 
qual a mutação b apareceu tarde na linhagem a, e assim poucos cromossomos que carregam a 
também carregam b: nesse caso r
2
 = 0,01. 
 Dessa forma, D’ é uma medida de desequilíbrio de ligação que é influenciada 
principalmente pela frequência de recombinação enquanto r
2
 também captura informação sobre 
quando e onde na genealogia das combinações as mutações ocorreram. Segundo Hartl & Clark 
(2010) essa diferença explica por que D’ e r
2
 são medias complementares de desequilíbrio de 
ligação e também por que r
2
 pode assumir uma faixa de valores para qualquer valor de D’ (Figura 
2.3). 
 Segundo Flint-Garcia et al. (2003), a mutação fornece a matéria prima para produzir o 
polimorfismo que estará em DL. A recombinação é o principal fenômeno que reduz o DL 
intracromossômico, enquanto que DL intercromossômico é dissipado pela distribuição 
independente. O tamanho populacional também possui papel importante. 
 18 
 
 
Figura 2.3. Relação entre D’ e r
2
 para valores aleatórios de frequências gaméticas distribuídos 
uniformemente (Hartl & Clark, 2010). 
 
 
 Em populações pequenas, o efeito da deriva genética resulta em perda consistente de 
combinações alélicas raras, que aumentam os níveis de DL. Além disso, o DL pode ser criado em 
populações que passaram por redução drástica em seu tamanho devido ao afunilamento genético 
(bottleneck). Os sistemas de acasalamentos também podem afetar fortemente o DL. Geralmente o 
DL cai muito mais rapidamente em espécies alógamas comparada às espécies autógamas ou de 
acasalamentos mistos, pois nessas espécies a recombinação é menos efetiva. A seleção, que causa 
afunilamento genético para locos específicos, também pode criar DL entre o alelo selecionado e o 
loco ligado. Além disso, a seleção a favor ou contra um fenótipo controlado por dois genes não 
ligados (epistasia) pode criar DL embora os locos não estejam fisicamente ligados. Finalmente, o 
fluxo gênico (migração) entre indivíduos de diferentes populações pode introduzir novas 
combinações cromossômicas e diferentes frequências alélicas, resultando em DL. 
 
 
2.2. Predominantemente autógamas (taxa de cruzamento, t < 0,10) 
 
 Nas populações que se reproduzem por autofecundação, a população é dividida em várias 
linhas que se tornam altamente homozigóticas. Considerando apenas um loco com dois alelos, há 
apenas três tipos possíveis de acasalamentos e que ocorrem nas proporções relativas dos genótipos 
na população. 
 
 
 
Acasalamentos Frequências Progênies 
 A
1
A
1
 A
1
A
2
 A
2
A
2
 
A
1
A
1
 x A
1
A
1
 D0 1 - - 
A
1
A
2
 x A
1
A
2
 H0 1/4 1/2 1/4 
A
2
A
2
 x A
2
A
2
 R0 - - 1 
 
 Dessemodo, as novas frequências genotípicas serão: 
 19 
D D
H
H
H
R R
H
1 0
0
1
0
1 0
0
4
2
4
 

 
 
 
 A nova frequência (p1) do alelo A
1
 será: 
 
p D
H H
D
H
p1 0
0 0
0
0
4
1
2 2 2
  





    
 
isto é, não há alteração nas frequências alélicas com a autofecundação. Entretanto, as proporções 
genotípicas são alteradas drasticamente. A proporção de heterozigotos é dada por: 
 
 H1 = ½H0 
 H2 = ½H1 e substituindo H1 tem-se, 
 H2 = (½)
2
 H0 
 
e generalizando para um número (t) qualquer de gerações: 
 
H Ht
t







1
2 0
 
 Como o valor (½)
t
 é sempre menor que 1,0 e decresce rapidamente em direção a zero com 
o aumento de t, o heterozigoto se aproxima assintoticamente de zero. A redução é rápida e mesmo 
quando H0 = ½, a heterozigose é reduzida a menos de 1% após seis gerações. As frequências dos 
homozigotos são dadas por: 
D D H
R R H
t
t
t
t
  












  












0 0
0 0
1
2
1
1
2
1
2
1
1
2
 
 À medida que t aumenta, o valor (½)
t
 tende para zero e as frequências dos homozigotos se 
aproximam de: 
 
qHRRHDD tt  0000
2
1
 e p
2
1
 
 
pois os termos entre colchetes se aproximam de 1,0. Assim, as frequências dos homozigotos se 
tornam as frequências de seus alelos na geração inicial. 
 
2.3. Acasalamentos mistos 
 
 Para muitas plantas de autofecundação ocorre também uma certa taxa de cruzamentos. 
Neste sistema, o procedimento mais simples para se determinar as proporções genotípicas é 
designar uma proporção, S, da progênie produzida por autofecundação e a proporção 
remanescente, T, sendo produzida por cruzamentos, e onde (S + T = 1,0). 
 20 
 Para se determinar as frequências genotípicas após uma geração de acasalamentos pode-se 
utilizar o seguinte quadro: 
 
Acasalamentos Freq. Progênie 
 A
1
A
1
 A
1
A
2
 A
2
A
2
 
Autofecundação (S) 
A
1
A
1
 x A
1
A
1
 SD SD - - 
A
1
A
2
 x A
1
A
2
 SH ¼SH ½SH ¼SH 
A
2
A
2
 x A
2
A
2
 SR - - SR 
Cruzamento (T) 
A
1
A
1
 x A
1
A
1
 TD
2
 TD
2
 - - 
A
1
A
1
 x A
1
A
2
 T2DH TDH TDH - 
A
1
A
1
 x A
2
A
2
 T2DR - T2DR - 
A
1
A
2
 x A
1
A
2
 TH
2
 ¼TH
2
 ½TH
2
 ¼TH
2
 
A
1
A
2
 x A
2
A
2
 T2HR - THR THR 
A
2
A
2
 x A
2
A
2
 TR
2
 - - TR
2
 
 
A
1
A
1
 = SD + ¼SH + TD
2
 + TDH + ¼TH
2
 
A
1
A
1
 = T(D
2
 + DH + ¼H
2
) + S(D + ¼H) 
A
1
A
1
 = T(D + ½H)
2
 + S(D + ¼H) 
A
1
A
1
 = Tp
2
 + S(D + ¼H) 
 
 
A
1
A
2
 = ½SH + TDH + T2DR + ½TH
2
 + THR 
A
1
A
2
 = ½SH + 2T(D + ½H)(R + ½H) 
A
1
A
2
 = 2Tpq + ½SH 
 
A
2
A
2
 = ¼SH + SR + ¼TH
2
 + TRH + TR
2
 
A
2
A
2
 = T(¼H
2
 + HR + R
2
) + S(R + ¼H) 
A
2
A
2
 = T(R + ½H)
2
 + S(R + ¼H) 
A
2
A
2
 = Tq
2
 + S(R + ¼H) 
 
Assim: 
 
D1 = Tp0
2
 + S(D0 + ¼H0) 
H1 = 2Tp0q0 + ½SH0 
R1 = Tq0
2
 + S(R0 + ¼H0) 
 
 Nestas equações o primeiro termo indica a proporção da progênie produzida por 
cruzamento e o segundo, a produzida por autofecundação. Do mesmo modo que ocorre para a 
autofecundação, a frequência alélica não se altera na próxima geração. 
 
 p1 = D1 + ½H1 
 p1 = Tp0
2
 + S(D0 + ¼H0) + ½(2Tp0q0 + ½SH0) 
 p1 = Tp0(p0 + q0) + S(D0 + ½H0) 
 p1 = Tp0 + Sp0 
 p1 = p0 
 
 As frequências genotípicas mudam com o passar das gerações, mas os heterozigotos não 
se aproximam de zero, pois são restituídos com os acasalamentos ao acaso. As frequências 
 21 
genotípicas atingem um equilíbrio para uma dada proporção de autofecundação e uma dada 
frequência alélica. Estas proporções no equilíbrio podem ser obtidas das equações já fornecidas, 
isto é: 
 
 Ht + 1 = 2Tpq + ½SHt 
 
Em que os subscritos foram retirados porque as frequências alélicas são as mesmas em todas as 
gerações. No equilíbrio não há mais alteração nas frequências genotípicas e Ht + 1 = Ht = He, em 
que He é a proporção de heterozigotos no equilíbrio. 
 
 He = 2Tpq + ½SHe 
 He - ½SHe = 2Tpq 
 He(1 - ½S) = 2Tpq 
 
 H
Tpq
S
e 

2
1
1
2
 
 
Multiplicando o numerador e o denominador por 2 e substituindo T por 1 - S, tem-se: 
 
 H
pq S
Se



4 1
2
( )
 
 
 Para os homozigotos o procedimento é o mesmo: 
 
 
D Tp S D H
D Tp SD S
pq S
S
D Tp SD
Spq S
S
D SD Tp
Spq S
S
D S S p
Spq S
S
D
S p
S
Spq S
S S
D p
Spq
S
e e e
e e
e e
e e
e
e
e
  






  








  


  


   







 
 

2
2
2
2
2
2
2
1
4
1
4
4 1
2
1
2
1
2
1 1
1
2
1
1
1
2 1
2
( )
( )
( )
( ) ( )
( )
( )
( )
( )
( )( )
 
 
 
 
 
 
 
 
 
 22 
Assim as frequências de todos os genótipos serão dadas por: 
 
 
D p
Spq
S
H
pq S
S
R q
Spq
S
e
e
e
 




 

2
2
2
4 1
2
2
( )
 
 
 Após várias gerações, independentemente das proporções genotípicas iniciais, as 
proporções genotípicas da população atingem os valores de equilíbrio, os quais são determinados 
pelas frequências alélicas e pela taxa de autofecundação. 
 
 O desequilíbrio de ligação em espécies de autofecundação ou acasalamentos mistos é bem 
mais intenso e mais demorado de ser dissipado que em espécies de acasalamentos ao acaso. Isto 
ocorre porque nessas espécies a recombinação é menos efetiva, devido à maior proporção de 
indivíduos homozigotos. A taxa de recombinação efetiva é dada por Flint-Garcia et. al. (2003) 
como sendo: 
s2
s
1c

 
Assim, para espécies com s = 0,66 a taxa de recombinação efetiva é reduzida pela metade, 
comparada à espécie completamente alógama (com auto-incompatibilidade). Haverá redução 
de dez vezes na taxa de recombinação efetiva para espécies com 95% de autofecundação (s = 
0,95) e de 50 vezes para espécies com 99% de autofecundação. Essas diferenças no DL entre 
espécies endogâmicas (s > 0) e não endogâmicas (s = 0) têm implicações cruciais com 
respeito à análise de associação para o mapeamento genético por desequilíbrio de ligação. O 
número de marcadores necessários para cobrir todo o genoma é determinado pela extensão do 
DL. Assim, enquanto que para o milho estima-se a necessidade de um marcador a cada 100 – 
200 bp para cobrir todo o genoma, para a Arabidopsis esses marcadores poderiam ocorrer 
somente a cada 50 kbp (Flint-Garcia et. al., 2003). Uma alternativa para minimizar as 
dificuldades de mapeamento usando DL em plantas seria a obtenção de gerações F2, onde seria 
necessário menor número de marcadores e maior acurácia estatística. 
Estimação da taxa de cruzamento 
 
 Existem basicamente dois processos para se estimar a taxa de cruzamento: um 
processo direto em que as progênies individuais resultantes de polinizações livres são 
identificadas, e um processo indireto que assume que as proporções genotípicas estão em 
equilíbrio de endogamia. 
 Para estimar a taxa de cruzamento pelo método direto é necessário conhecer o 
genótipo da planta mãe (o genótipo paterno normalmente não é conhecido), e os genótipos da 
progênie. A proporção genotípica da progênie, esperada a partir de um genótipo materno 
homozigótico AiAi é dado por: 
 
Frequência de 
acasalamentos 
Genótipos na progênie 
AiAi AiAj 
S S - 
T Tpi Tpj 
1,0 S + Tpi Tpj 
 23 
Em que pi e pj são as frequências dos alelos Ai e Aj (ou todos os demais alelos além de Ai) nos 
grãos de pólen. Neste caso, há dois tipos de descendentes: os homozigotos (AiAi) obtidos por 
autofecundação ou por cruzamentos e os heterozigotos (AiAj) obtidos exclusivamente por 
cruzamentos. Assim, a frequência de heterozigotos na progênie é dada por: 
 
H Tp j 
 
que pode ser arranjada para fornecer a taxa de cruzamento: 
 
T
H
p j
 
 
 Se for identificado um número Nij de indivíduos heterozigotos em uma progênie de N 
indivíduos, a estimativa da taxa de cruzamento será dada por: 
 
Np
N
T
j
ij
ˆ 
A variância aproximada é dada por: 
 
   
'
2
ˆ
ˆ1ˆˆˆ1ˆ
ˆ
Np
pT
N
pTT
TV
j
jj 


 
emque p j é a estimativa da frequência do alelo Aj na população fonte de pólen e N’ é o 
tamanho da amostra usada para estimar a frequência de Aj. 
 A estimativa da taxa de cruzamento pelo método indireto assume que a população 
esteja em equilíbrio de endogamia e, nesse caso, emprega-se o índice de fixação (FST): 
qp
H
FST
ˆˆ2
ˆ
1ˆ  
 
Com o índice de fixação pode-se estimar a taxa de cruzamento a partir da seguinte 
expressão: 
ST
ST
ST
F
F
T
T
T
F






1
1ˆ
1
1ˆ 
 24 
2.4 EXERCÍCIOS 
 
1. Suponha que o alelo A1 seja representado pela peça vermelha e o alelo A2 pela peça branca. 
Cada duas peças unidas constituem um indivíduo que pode ser homozigótico (A
1
A
1
 ou 
A
2
A
2
) ou heterozigótico (A
1
A
2
). Construa uma população de 80 indivíduos, misturando um 
número qualquer de indivíduos vermelhos, brancos e vermelho-branco. 
a) Determine as frequências alélicas nessa população. 
b) Determine as frequências genotípicas esperadas na população em equilíbrio de Hardy-
Weinberg e verifique se a população se encontra em equilíbrio. 
c) Efetue acasalamentos ao acaso entre os indivíduos da população original, da seguinte 
maneira: Retira-se um indivíduo ao acaso e anota-se sua constituição genética; este será o 
progenitor feminino. Volta-se esse indivíduo para a população para que não haja 
alteração nas frequências. Retira-se agora outro indivíduo ao acaso; este será o 
progenitor masculino. Desta maneira fazem-se 200 retiradas obtendo-se 100 
acasalamentos. Anotar os tipos de acasalamento e as respectivas descendências 
obedecendo aos seguintes passos: 
1º. Quaisquer dois indivíduos poderão ser acasalados; 
2º. Todos os acasalamentos serão igualmente produtivos; 
3º. Cada acasalamento dará uma descendência de 4 indivíduos de acordo com a 
segregação Mendeliana. 
4º. Compare os números na nova geração com os números esperados em uma população 
em equilíbrio de Hardy-Weinberg, usando o teste de 
2
. 
 
2. Suponha um gene A com três alelos, sem dominância, e os genótipos dados abaixo. 
a) Determine as frequências desses alelos. 
b) Teste se a população se encontra em equilíbrio de Hardy- Weinberg. 
 
 
Genótipos Número Observado 
A
1
A
1
 20 
A
1
A
2
 30 
A
1
A
3
 100 
A
2
A
2
 52 
A
2
A
3
 240 
A
3
A
3
 408 
Total 850 
 
 
3. Considere uma população em equilíbrio e suponha a seguinte ordem de dominância 
A
1
>A
2
>A
3
. Calcule as frequências alélicas admitindo os seguintes números de indivíduos: 
fenótipos A
1
:278, fenótipos A
2
: 362, fenótipos A
3
: 360. 
 
4. Em uma população em equilíbrio o número de heterozigotos é oito vezes o número de 
homozigotos recessivos. Quantos indivíduos de cada genótipo são esperados na população 
contendo 1000 indivíduos? 
 
5. Considere apenas um loco com dois alelos e diferencie, em termos de frequências alélicas e 
genotípicas, um híbrido F1, híbrido intervarietal e cultivar de polinização livre. 
 
 25 
6. O alelo br2 em milho confere o fenótipo braquítico (plantas baixas). Se um melhorista tomar 
ao acaso plantas normais de uma população em equilíbrio onde q (br2) = 0,4 e as cruzar, qual 
a probabilidade de surgirem descendentes braquíticos? 
 
7. A partir de uma população com frequências genotípicas AA = 0,40; Aa = 0,30 e aa = 0,30, 
determine as frequências dos mesmos após três ciclos de autofecundação. 
 
8. A partir de uma população com frequências genotípicas AA=0,16; Aa=0,48 e aa=0,36 e taxa 
de autofecundação (S) igual a 0,8 determine as frequências genotípicas para as primeiras 
gerações. Coloque os resultados em um gráfico. 
 
9. Determine as frequências dos heterozigotos no ponto de equilíbrio para três populações com 
frequências alélicas p = 0,5; p = 0,3 e p = 0,1, respectivamente e taxas de autofecundação (S) 
igual a 0; 0,2; 0,4; 0,6; 0,8 e 1,0. Coloque os resultados em um gráfico. 
 
10. Considere a seguinte população e assuma que os genes A e B possuem distribuição 
independente. 
 
Genótipos Nº Indivíduos 
AB/AB 55 
AB/aB 5 
AB/ab 120 
aB/ab 5 
ab/ab 65 
Total 250 
 
a) A população se encontra em equilíbrio para o gene A e para o gene B, separadamente? E 
para os genes A e B simultaneamente? 
b) Calcule o desequilíbrio gamético na população original e na primeira geração obtida por 
acasalamentos ao acaso. Faça o mesmo considerando 90% de ligação entre os genes A e 
B. 
c) Quantas gerações seriam necessárias para se reduzir o desequilíbrio em 95%, 
considerando: 
1º. A e B são independentes; 
2º. A frequência de recombinação entre A e B é 10%. 
d) Discuta os resultados. 
 
11. Em milho, plantas normais domina plantas braquíticas e grãos amarelos domina grãos 
brancos. Estime o desequilíbrio de ligação (D) e sua significância, considerando uma 
população composta dos seguintes indivíduos: Plantas normais com grãos amarelos: 43, 
Plantas braquíticas com grãos amarelos: 70, Plantas normais com grãos brancos: 81, Plantas 
braquíticas com grãos brancos: 37. 
 
12. Em um experimento para estimar a taxa de cruzamento para certa espécie, um grupo de 
indivíduos A1A1 foram cultivados aleatoriamente no meio de uma população contendo 1000 
indivíduos e cuja frequência alélica era p1(A1) = 0,3. De uma progênie de 300 indivíduos 
obtidos das plantas A1 A1 , 97 eram heterozigotos. Qual é a estimativa da taxa de cruzamento 
e seu desvio padrão? Que proporção de homozigotos na progênie seria produzida por 
autofecundação? 
 
 26 
13. A partir da geração 2 em equilíbrio de ligação (quadro da página 8), selecione todos os 
indivíduos com fenótipo A
1
B
1
 e verifique se a população continua em equilíbrio. 
 
 
REFERÊNCIAS 
 
Devlin, B.; Risch, N. A comparison of linkage disequilibrium measures for fine-scale 
mapping. Genomics, v. 29, p. 311-322, 1995. 
 
Flint-Gracia, S.A.; Thornsberry, J.M.; Buckler IV, E.S. Structure of linkage disequilibrium in 
plants. Annu. Rev. Plant Biol., v. 54, p.357-374. 2003. 
 
 
 27 
3. MEDIDAS DE VARIAÇÃO, DE DISTÂNCIA E SIMILARIDADE GENÉTICA 
 
 Com o propósito de estimar a quantidade de variação genética em populações, de uma 
forma padronizada, inúmeras medidas são propostas. Algumas são mais apropriadas para 
caracteres morfo-fisio-agronômicos enquanto outras são mais adequadas para uso com 
marcadores moleculares (enzimáticos ou de DNA). 
 
3.1 Medidas de variação genética 
 
3.1.1. Diversidade Genética (H) 
 
 A medida de variação genética mais amplamente utilizada é a diversidade genética 
também chamada de heterozigosidade (H), índice de diversidade ou, ainda, de índice de 
polimorfismo, e que pode ser estimada por: 
 
 

H p
H P
e i
i
m
o ii
i
m
 
 




1
1
2
1
1
 
em que: 
He : diversidade esperada 
Ho : diversidade observada 
m: número de alelos 
Pii: frequência observada de homozigotos para o alelo i 
pi: frequência do alelo i 
 
Estas expressões são equivalentes a: 
 H p pi i
i
m
 

 1
1
 
 
e que tem sido chamado de índice de polimorfismo. 
 
 Deve-se salientar que a heterozigosidade é uma medida de diversidade e não apresenta, 
necessariamente, relação com a frequência de heterozigotos da população. Esta medida é definida 
inteiramente em função das frequências alélicas e não das frequências genotípicas. Portanto se 
aplica a populações com reprodução assexuada ou sexuada com alogamia ou endogamia. Para 
espécies com acasalamentos ao acaso as duas expressões (He e Ho) são semelhantes, mas para 
espécies autógamas, grandes discrepâncias podem ser observadas. 
 Quando o tamanho N de uma amostra é pequeno, é necessário fazer uma correção, e a 
expressão se transforma em: 
12
2
ˆ1ˆ
1
2








 N
N
pH
m
i
i 
 
 Se vários locos gênicos estiverem envolvidos, então a diversidade genética da população é 
estimada como sendo a média aritmética das diversidades obtidas para cada loco. 
 Nei (1973) propõe a partição da diversidade genética em seus componentesentre e dentro 
das unidades experimentais. A unidade experimental pode ser a espécie ou uma população 
 28 
grande, constituída por várias subpopulações ou demes. Assim, a diversidade total (HT) é 
constituída por: 
 
STST DHH  
 
em que: 
 
HT: diversidade total, estimada a partir das frequências alélicas médias de cada loco, envolvendo 
todas as populações consideradas. 
HS: componente da diversidade dentro da população. 
 
      
 n
nn
S
NNN
HNHNHN
H



...
......
21
2211 
 
 Sendo: N1, N2, Nn etc. o número de indivíduos da população 1, 2, n e H1, H2, Hn as 
diversidades estimadas para as n populações. 
 
DST: componente da diversidade entre populações, dentro da espécie considerada. 
 
 A proporção da diversidade genética que é atribuída ao componente entre populações é 
estimada por: 
G
D
H
ST
ST
T
 
 
 Utilizando-se marcadores de DNA ou isoenzimáticos, pode-se obter informações da 
diversidade genética em muitos locos e indivíduos na população. A partir destes dados pode-se 
calcular a diversidade média da população como sendo a média aritmética dos H’s considerando 
todos os locos analisados. 
 
3.1.2. Proporção de locos polimórficos (P) 
 
 Outra medida de variação genética é a proporção de locos polimórficos. O polimorfismo 
genético é definido como sendo a ocorrência de dois ou mais alelos em um loco, cada um com 
uma frequência inferior a 0,95 (ou 0,99). Esses valores são arbitrários, mas o valor 0,99 é mais 
usado quando o tamanho da amostra é adequado (aproximadamente 100 indivíduos ou mais). Esta 
medida é dada por: 
 
n
x
P ˆ 
em que, x é o número de locos polimórficos em uma amostra de n locos. 
 
3.1.3. Número de alelos por loco polimórfico (A) 
 
 Uma terceira medida de diversidade é o número de alelos por loco polimórfico, dada por: 
 
 Ap 
Nº total de alelos dos locos polimórficos
Nº de locos polimórficos
 
 
 29 
3.1.4. Número de alelos efetivos (Ae) 
 
 O número de alelos efetivos significa o número de alelos igualmente frequentes que seria 
necessário para produzir a mesma homozigosidade observada na população real. Ele é estimado 
pela expressão: 
 


2
1
i
e
p
A 
 
Estudos de aloenzimas de populações de Drosophila willistoni no Caribe mostrando as 
frequências alélicas dos locos Adk-1 (adenilato kinase-1), Lap-5 (leucina amino peptidase-5) e 
Xdh (xantina desidrogenase). 
 
 Adk-1 Lap-5 Xdh 
Alelo 1 0,574 0,801 0,446 
Alelo 2 0,309 0,177 0,406 
Alelo 3 0,114 0,014 0,092 
Alelo 4 0,003 0,004 0,034 
Alelo 5 - 0,004 0,014 
Alelo 6 - - 0,004 
Alelo 7 - - 0,002 
Alelo 8 - - 0,002 
 
 
3.2 Medidas de distâncias (similaridade) genéticas 
 
 O estudo da variação genética, envolvendo várias populações e muitos genes, permite 
avaliar a quantidade de variação comum entre populações. Estas medidas de variação comum 
entre grupos são chamadas de distâncias genéticas e permitem a visualização da relação entre 
grupos de indivíduos. Elas são análogas às distâncias geométricas, isto é, se a distância é zero não 
há diferença entre os grupos. As medidas de similaridade ou identidade genética geralmente são 
complemento das medidas de distância. Assim, não há diferença entre os grupos se a similaridade 
é igual a 1,0. 
 No melhoramento de plantas as medidas de distâncias genéticas têm sido utilizadas para a 
identificação de populações que possibilitam maior efeito heterótico quando cruzadas ou que 
possibilitam maior probabilidade de seleção de genótipos superiores nas gerações segregantes. 
Além disso, têm sido úteis na avaliação de acessos em bancos de germoplasma, no 
estabelecimento da relação entre a diversidade genética e geográfica e também, para evitar a 
vulnerabilidade genética das culturas. 
 Várias têm sido as medidas de distâncias genéticas empregadas, tais como: distância 
genética de Nei, distância Genotípica de Hedrick, distância de Rogers, distância Euclidiana, 
distância generalizada de Mahalanobis, e muitas outras. Para se estimar essas distâncias usam-se 
comumente padrões isoenzimáticos ou marcadores de DNA, bem como caracteres morfológicos, 
fisiológicos ou agronômicos; ainda podem ser empregadas análises dos pedigrees ou medidas de 
depressão endogâmica. 
 
 
 
 
 
 
Os números de alelos efetivos para cada loco 
foram: Ae = 2,28 para Adk-1, Ae = 1,49 para 
Lap-5 e Ae = 2,68 para Xdh. O número de 
alelos efetivos é determinado mais pela 
uniformidade das freqüências alélicas do que 
pelo número real de alelos. 
 30 
3.2.1 Distância Genética de Nei 
 
 Esta é uma das medidas genéticas mais utilizadas e é definida como: 
 
  NN ID ln , em que  21
12
* JJ
J
IN  
 
 Nesta expressão, IN é a identidade genética de Nei e J12, J1 e J2 são definidos a seguir: 
J p p
J p
J p
i i
i
n
i
i
n
i
i
n
12 1 2
1
1 1
2
1
2 2
2
1









. .
.
.
 
 
pi.1 e pi.2 são as frequências do alelo i nas populações 1 e 2, respectivamente. Quando se 
consideram vários locos, os valores de J12, J1 e J2 são calculados como as médias aritméticas de 
todos os locos. 
 Os valores de IN variam de zero, quando não há alelos em comum nas duas populações, 
até 1,0 quando as duas populações possuem frequências alélicas idênticas. DN varia de zero, para 
populações com frequências alélicas idênticas, até o infinito, para as populações que não possuem 
alelos em comum. 
 
3.2.2 Distância Euclidiana 
 
 A distância euclidiana é baseada em um espaço bidimensional e que pode ser representado 
como na figura 3.1. O espaço ocupado pela população A é definido pelas frequências alélicas p1 e 
q1 enquanto que a população B é definida pelas frequências p2 e q2. 
 
 
 
 
 
 
 
 
 
 
Figura 3.1. Representação esquemática da distância entre dois pontos (A e B) em um plano 
cartesiano 
 
 O teorema de Pitágoras estabelece que o quadrado da hipotenusa é igual à soma do 
quadrado dos catetos, então: 
 
     221
2
21
2
AB qqppd      
2
21
2
21AB qqppd  
Xi 
p2 p1 
q2 
q1 
B 
A 
DAB Xj 
 31 
 A distância euclidiana pode ser calculada a partir de dados de frequências alélicas. Nesse 
caso, cada população é representada como um ponto no espaço n dimensional baseado nas 
frequências alélicas dos n alelos. Para que duas populações sejam consideradas similares elas 
devem ocorrer na mesma região do espaço multidimensional, exibindo pequena distância entre si. 
Quando se têm n alelos, a distância entre duas populações A e B é dada por: 
 
 


n
i
iBiAAB ppd
1
2
 
 
em que: 
 
dAB : distância euclidiana entre as populações A e B; 
n : número de alelos 
piA e piB: frequências do alelo i nas populações A e B, respectivamente. 
 
 A distância euclidiana varia de zero, quando as duas populações apresentam as mesmas 
frequências alélicas, a um valor máximo de 2 , se as populações fixarem alelos contrastantes. 
A distância euclidiana foi originalmente proposta para caracteres quantitativos e, nesse 
caso há necessidade de padronização das variáveis, em função das diferentes escalas usadas para 
cada caráter. A padronização mais usual é Zij = Xij/sj , em que Zij é variável j padronizada, Xij é a 
variável original e sj o desvio padrão para a respectiva variável. Nesse caso, utiliza-se a distância 
euclidiana média, dada por: 
 
  
21
jiAB XX
n
d 
 
 A distância euclidiana pode ser aplicada também a dados de frequências alélicas, fazendo 
n igual ao número de locos. 
 
 
3.2.3 Distância generalizada de Mahalanobis 
 
 A distância generalizada de Mahalanobis apresenta vantagens em relação à distância 
euclidiana, pois considera as possíveis correlações entre as variáveis. Quando as variáveis não são 
correlacionadas, a distância generalizada de Mahalanobis é igual à distância euclidiana. Para se 
estimar a distância de Mahalanobis (D
2
) estimam-se, primeiramente, os desvios: 
 
niinn
2i2i2
1i1i1
XXdXXd
XXd
'
'
'
...



 
em que: 
 
Xi1 é a média do caráter i na população 1 
Xi2 é a média do caráter i na população 2 
 
 
 
 32 
A estatística D
2
 é definida por: 
 12D  ' 
em que: 
 
 : é vetor das diferenças entre as médias de duas populações (genitores) para as n características 
avaliadas (veja acima). 
 n21 ddd ...' 
1 : é a inversa da matriz de variâncias e covariâncias residuais. 
 
3.2.4 Distância de Rogers 
 
 Rogers (1972) propôs uma distância euclidiana modificada e que também utiliza 
frequências alélicas. Entretanto, essa medida tem a vantagem de se situar no intervalo de 0 a 1. 
Ela também obedece ao princípio da desigualdade triangular e é dada por: 
 
   
 
m
j
jm
i
ijijXY qp
n
d
1 1
2
2
11
 
em que: 
 
 dXY é a distância de Rogers entre as populações X e Y 
ijij qp e são as frequências do alelo i no loco j nas populações X e Y 
 n é o número de locos contendo os alelos i estudados. 
 m é o número de alelos 
 
3.2.5 Distância baseada no parentesco 
 
 Esta distância é dada pela expressão: 
 
 

 



m
i
ii
m
i
ii
XY
pp
pp
1
21
1
2
21
1
2/1
̂ 
 
em que: 
XY̂ é a distância baseada no parentesco entre as populações X e Y; 
piX e piY são as frequências do alelo i nas populações X e Y, respectivamente; 
m é o número de alelos no loco i. 
 
3.2.5 Coeficientes de similaridade 
 
 Os coeficientes de similaridade (sij) representam o complemento das distâncias genéticas, 
isto é, sij = 1- dij. Na maioria das vezes, esses coeficientes são baseados em dados binários do tipo 
0 e 1 utilizando-se de frequências de bandas em zimogramas ou por análises de marcadores de 
DNA. 
 A partir das análises das bandas monta-se uma tabela de contingência 2 x 2 como 
mostrado abaixo: 
 33 
 População X 
Total 
Presença (1) Ausência (0) 
População Y 
Presença (1) a b a + b 
Ausência (0) c d c + d 
 a + c b + d n 
 
 
em que: 
a é o número de indivíduos com presença de bandas nas duas populações; 
b é o número de indivíduos com presença de banda na população Y e ausência na população X; 
c é o número de indivíduos com presença de banda na população X e ausência na população Y; 
d representa a ausência de bandas nos indivíduos das duas populações. 
 
3.2.6.1 Coeficiente de Jaccard 
 
cba
a
SJ

 
 
3.2.6.2 Coeficiente de Dice ou de Nei e Li 
 
cba
a
SNL


2
2
 
 
3.2.6.3 Coeficiente de concordância simples ou simple matching 
 
dcba
da
SCS


 
 Os coeficientes de similaridade diferem quanto à inclusão ou não das concordâncias do 
tipo 00 (d), isto é, ausência de bandas nos indivíduos das duas populações. A justificativa para 
esse fato é porque a ausência da banda, muitas vezes, tem causas diferentes nos indivíduos 
considerados. A escolha de qual coeficiente usar depende dos objetivos da pesquisa, mas 
geralmente as correlações entre eles são altas. Santos Dias (1998) recomenda o coeficiente de 
Jaccard para comparar populações da mesma espécie, enquanto que o coeficiente de Dice é mais 
apropriado para comparações de itens muito diversos, como espécies, por exemplo. 
 Após a estimação das distâncias ou similaridades genéticas por uma metodologia 
qualquer, normalmente essas distâncias são empregadas em análises de agrupamentos, os quais 
procuram identificar padrões na distribuição da diversidade. Os métodos de agrupamentos mais 
empregados são os hierárquicos e os de otimização. Nos métodos hierárquicos, os materiais 
genéticos são agrupados por um processo que se repete em vários níveis até que seja estabelecido 
o dendrograma. Nos métodos de otimização, o conjunto de materiais genéticos é subdividido em 
subgrupos exclusivos por meio da maximização ou minimização de alguma medida 
preestabelecida. O estudo da divergência genética pode ser realizado, ainda, pela análise de 
componentes principais ou por variáveis canônicas. Esses e outros métodos de ordenação de 
dados podem ser utilizados facilmente graças à existência de pacotes estatísticos para 
microcomputadores. 
 34 
3. 3 EXERCÍCIOS 
 
1. Considere uma amostra de 5 indivíduos, retirados de duas populações diferentes e 
avaliados para três isoenzimas: ACP (fosfatase ácida), PGM (fosfogluco mutase) e GOT 
(glutamato desidrogenase): 
 
 
Indivíduos 
ACP PGM GOT 
1 2 1 2 
População 1 
1 aa ab cc aa aa 
2 aa bc ab aa ab 
3 aa ab cc aa bb 
4 aa aa ac aa ab 
5 aa bb cc aa ab 
 
População 2 
1 ab cc bb cc bc 
2 cc ab cc ab aa 
3 bb bc cc ac cc 
4 bc aa ac aa ac 
5 ac ac bc bb bb 
 
 
Determine, para cada população: 
a) as frequências alélicas p(a), p(b) e p(c) para todos os locos. 
b) a diversidade genética (H) para cada loco. 
c) a diversidade média considerando todos os locos. 
d) os componentes da diversidade entre e dentro das populações 
e) a proporção de locos polimórficos 
f) o número de alelos por loco polimórfico 
 
Veja referência: 
 
Carrera, A.D.; Pizarro, G.; Poverene, S.; Feingold, S.; Leon, A.J.; Berry, S.T. Variability 
among inbred lines and RFLP mapping of sunflower isozymes. Genetics and Molecular 
Biology, v. 25, n. 1, p.65-72, 2002. 
 
2. Estime a distância genética de Nei e a distância euclidiana entre as populações 1 e 2, 
considerando os locos ACP-1, ACP-2 e PGM. 
 
3. Estime os componentes da diversidade (entre e/ou dentro das populações) nas 
seguintes situações: 
 (a) (b) 
 População 1 População 2 População 1 População 2 
AA 1 0 AA 0,25 0,25 
Aa 0 0 Aa 0,50 0,50 
aa 0 1 aa 0,25 0,25 
 (c) 
 População 1 População 2 
AA 0,49 0,04 
Aa 0,42 0,32 
Aa 0,09 0,64 
 35 
4. Estime o coeficiente de similaridade de Jaccard para os dados binários (0 ou 1) obtidos 
com marcadores moleculares (12 bandas) para cinco linhagens (L-1 a L-5). 
 
Bandas L-1 L-2 L-3 L-4 L-5 
B-1 1 0 1 0 0 
B-2 1 1 0 0 1 
B-3 0 1 0 1 1 
B-4 1 1 0 0 1 
B-5 0 1 0 1 1 
B-6 0 0 1 1 1 
B-7 1 0 1 1 0 
B-8 0 1 0 1 1 
B-9 0 1 1 1 1 
B-10 0 1 0 1 1 
B-11 1 1 1 1 1 
B-12 1 1 1 0 0 
 
Monte a matriz de similaridade e construa os dendrogramas pelos métodos do vizinho mais 
próximo e UPGMA. 
 
5. Considere os dados apresentados na tabela 6.2 de Cruz e Regazzi, 1994, p. 290. Utilize 
apenas os genitores 1 a 5 e as variáveis X1, X2 e X3 e estime a distância euclidiana. 
Construa o dendrograma empregando o método do vizinho mais próximo. 
 
6. Suponha que um gene tenha oito alelos nas frequências de 0,55; 0,20; 0,09; 0,06; 0,04; 
0,03; 0,02 e 0,01. Estime o número de alelos efetivos. Qual seria este número se cada alelo 
estivesse na frequência de 0,125? 
 
 
REFERÊNCIAS 
 
1. Hamrick, J.L.; Godt, M.J.W. Allozyme diversity in plant species. In: Brown, H.D.; 
Clegg,M.T.; Kalher, A.L.; Weir, B.S. Plant population genetics, breeding, and genetic 
resources. Sinauer Associates Inc. Publishers, Sunderland, p. 43-63, 1990. 
 
2. Hamrick, J.L.; Godt, M.J.W. Allozyme diversity in cultivated crops. Crop Science, v. 37, 
p. 26-30, 1997. 
 
3. Wadt, L.H.O.; Kageyama, P.Y. Estrutura genética e sistema de acasalamento de Piper 
hispidinervum. Pesq. agropec. bras., Brasília, v.39, p.151-157, 2004. 
 
4. Ribeiro, R.A.; Lovato, M.B. Mating system in a neotropical tree species, Senna multijuga 
(Fabaceae). Genetics and molecular biology, v.27, n.3, p.418-424, 2004. 
 36 
4. PARENTESCO E ENDOGAMIA 
 
 Dois indivíduos são geneticamente relacionados (parentes) se eles possuem um ou mais 
ancestrais comuns ou se um é descendente do outro. A consequência fundamental desse fato é 
que esses indivíduos podem possuir cópias dos mesmos alelos dos ancestrais e, assim, passá-los 
aos descendentes, se eles forem acasalados. O termo genérico endogamia é utilizado para se 
referir a sistemas de acasalamentos entre indivíduos aparentados. O ponto culminante da 
endogamia é que, via de regra, os descendentes endogâmicos perdem vigor ou têm a média de 
um caráter qualquer reduzida. Além disso, a

Continue navegando