Buscar

Fundamentos da Genética Forense

Prévia do material em texto

— Curso de Especialização em Biologia Forense — 
 
 
 
 
 
Fundamentos de Genética Forense 
 
 
Marcelo André de Souza Baptista 
 
 
 
 
 
Rio de Janeiro, Setembro de 2008 
 2
Índice 
1. Conceitos Básicos de Genética e Biologia Molecular 03 
1.1. Estrutura do DNA 03 
1.2. Organização Cromossômica do DNA 04 
1.3. Organização dos Cromossomos Humanos 04 
1.4. Organização do Genoma Humano 06 
 1.4.1. Classes de DNA no Genoma Humano 07 
 1.4.1.a. Seqüências de DNA de Cópia Única 07 
 1.4.1.b. Famílias de DNA Satélite 07 
 1.4.1.c. Famílias de DNA Repetitivo Disperso 08 
2. Variação Individual no DNA 09 
2.1. Polimorfismos de DNA de Interesse Forense 10 
2.2. Detecção e Medida da Variação Genética ao Nível de DNA 11 
2.3. Polimorfismos de Tamanho de Fragmento de Restrição (RFLPs) 12 
2.4. Polimorfismos de Número de Repetições em Tandem (VNTRs e STRs) 13 
2.4.1. Amplificação de DNA pela Reação em Cadeia da Polimerase 14 
2.5. Polimorfismos de Nucleotídeos Individuais (SNPs) 17 
 2.5.1. Seqüenciamento de DNA 17 
3. Base Estatística e Populacional para Análise de Perfis de DNA 19 
3.1. Genética de Populações e a Teoria das Freqüências Alélicas 19 
3.1.1. Estimativa das Freqüências Alélicas 19 
3.1.2. O Princípio de Hardy-Weinberg 20 
3.1.3. Aplicações do Princípio de Hardy-Weinberg 22 
4. Bibliografia 24 
5. Anexo I: Figuras 25 
 3
1. Conceitos Básicos de Genética e Biologia Molecular 
 O texto a seguir tem como propósito fornecer ao aluno uma visão geral sobre os 
conceitos de genética e biologia molecular aplicados à identificação humana. Os temas 
específicos, inovações tecnológicas e estudos de casos em Genética Forense serão 
apresentados em sala de aula. 
1. 1. Estrutura do DNA 
 A informação genética dos organismos vivos, que determina suas características 
orgânicas hereditárias, está estocada em grandes macromoléculas chamadas ácidos 
nucleicos. Estes ácidos nucleicos podem ser de dois tipos: o DNA (ácido 
desoxirribonucleico) e o RNA (ácido ribonucleico). Em todos os organismos celulares, 
inclusive nós, o material genético é o DNA que permanece estocado no núcleo (ou 
nucleóide) na forma de cromossomos. O DNA é uma molécula linear na forma de uma 
dupla hélice, similar a uma escada em caracol. A dupla hélice é composta de duas 
cadeias (ou fitas) intercaladas de unidades menores chamadas nucleotídeos (Figuras 1 e 
2). Cada nucleotídeo consiste em um grupamento fosfato, um açúcar desoxirribose e 
uma das quatro bases nitrogenadas diferentes, adenina, citosina, guanina, ou timina. 
Cada um dos quatro nucleotídeos é geralmente designado pela primeira letra da base 
que contém: A, C, G ou T. Os quatro nucleotídeos são mostrados na Figura 1. Os 
carbonos da desoxirribose recebem números seguidos de apóstrofo (1’, 2’, e assim por 
diante) para distinguí-los na numeração dos átomos das bases. No DNA, os nucleotídeos 
são conectados uns aos outros nas posições 3’ e 5’, como mostrado na Figura 2. Assim, 
cada cadeia é dita como tendo uma polaridade, com uma ponta apresentando um grupo 
fosfato (PO42––) 5’ e a outra um grupo hidroxila (OH–) 3’. As ligações covalentes entre 
os grupos repetidos de fosfato e açúcar são chamadas ligações fosfodiéster. 
 As polaridades das duas cadeias de nucleotídeos entrelaçadas estão em sentidos 
opostos (Figura 2). As duas cadeias de nucleotídeos são mantidas juntas por ligações 
fracas chamadas pontes de hidrogênio. As pontes de hidrogênio são muito específicas 
devido a um ajuste tipo chave-e-fechadura entre a forma e a carga atômica das bases 
(Figura 2). A adenina pareia-se apenas com timina, e a guanina apenas com citosina. As 
bases que formam os pares são ditas complementares. 
 4
 Embora as pontes de hidrogênio sejam fracas individualmente, suas ligações 
combinadas mantêm as duas cadeias juntas de modo estável. Além disso, é importante 
que as ligações entre as bases sejam relativamente fracas porque as duas cadeias têm 
que ser separadas para que o processo de replicação da molécula ocorra. Os pares de 
bases, que se posicionam no interior da dupla hélice, são estruturas hidrofóbicas 
achatadas que têm uma tendência a se empilhar devido à exclusão de moléculas de água. 
Este empilhamento confere aos dois filamentos entrelaçados do DNA sua estrutura 
helicoidal. 
1.2. Organização Cromossômica do DNA 
 Quando uma célula divide, seu material nuclear (cromatina) perde a aparência 
relativamente homogênea típica das células que estão em divisão e condensa-se numa 
série de organelas em forma de bastão, denominadas cromossomos (Figura 3). Embora 
os cromossomos sejam visíveis como estruturas distintas apenas nas células em divisão, 
eles conservam sua integridade entre divisões celulares. A cromatina compõe-se de 
acido desoxirribonucleico (DNA) e uma classe complexa de proteínas cromossômicas. 
Os genes, neste ponto, definimos simplesmente como unidades de informações 
genéticas, estão localizados no DNA cromossômico. 
 Cada espécie tem um conjunto cromossômico típico (cariótipo) em termos do 
número e da morfologia dos cromossomos, cada gene possuindo uma posição precisa ou 
locus. O mapa gênico, gráfico da localização cromossômica dos genes, também é típico 
de cada espécie, sendo, até onde sabemos, idêntico em todos os indivíduos de uma 
mesma espécie. A posição relativa de alguns genes parece ter sido altamente conservada 
na evolução recente, até mesmo entre espécies tão diversas quanto homem e 
camundongo. 
1.3. Organização dos Cromossomos Humanos 
 Os 46 cromossomos das células somáticas humanas constituem 23 pares. Destes, 
22 são semelhantes em ambos os sexos e denominados autossomos. O par restante 
compreende os cromossomos sexuais XX no sexo feminino e XY no masculino. Os 
membros de um par (descrito como cromossomos homólogos ou apenas homólogos) 
possuem informações genéticas equivalentes; isto é, possuem os mesmos loci gênicos 
na mesma seqüência, mas em qualquer locus específico eles podem ter formas idênticas 
ou um pouco diferentes, quais são denominadas alelos. Um membro de cada par dos 
 5
cromossomos é herdado do pai, o outro da mãe. Normalmente, os membros de um par 
de autossomos são microscopicamente indistinguíveis um do outro. Nas mulheres, os 
cromossomos sexuais, os dois cromossomos X, também são indistinguíveis. Nos 
homens, contudo, os cromossomos sexuais diferem. Um é um X, idêntico aos Xs da 
mulher, herdado de sua mãe por um homem transmitido às suas filhas; o outro, o 
cromossomo Y, é herdado do pai e transmitido aos filhos. 
 Há dois tipos de divisão celular: mitose e meiose. A mitose é a divisão habitual 
das células somáticas, pela qual o corpo cresce, se diferencia e realiza reparos. A divisão 
mitótica resulta normalmente em duas células-filhas, cada uma com cromossomos e 
genes idênticos aos da célula-mãe. Pode haver dúzias ou mesmo centenas de mitoses 
sucessivas numa linhagem de células somáticas. A meiose ocorre somente nas células 
da linhagem germinativa e apenas uma vez numa geração. Resulta na formação de 
células reprodutivas (gametas), cada uma das quais tem apenas 23 cromossomos: um de 
cada tipo de autossomo e um X ou Y. As células somáticas têm o complemento 
cromossômico diplóide ou 2n (isto é, 46 cromossomos), enquanto os gametas possuem 
o complemento haplóide ou n (isto é, 23 cromossomos). As anormalidades do número 
ou estrutura dos cromossomos, que em geral são clinicamente significativas, podem 
surgir nas células somáticas e gametas por erros na divisão celular. 
 A variação hereditária do genoma é a base da genética humana e médica. As 
formas alternativas de informações genéticas num determinado locus denominam-se 
alelos. Muitos genes possuem apenas uma versão normal,que chamamos de alelo do 
“tipo selvagem”. Outros loci genéticos exibem polimorfismo (literalmente, “muitas 
formas”), o que significa que na população existe pelo menos dois alelos normais 
relativamente comuns no locus. Além do alelo ou alelo normais, a maioria dos loci 
identificados também tem um ou mais alelos raros; de fato, muitos loci humanos foram 
identificados através de um distúrbio clinicamente significativo causado alelo mutante 
raro. 
 O genótipo de uma pessoa é a sua constituição genética, seja coletivamente em 
todos os loci ou, mais tipicamente, em um locus isolado. O fenótipo é a expressão 
observável de um genótipo como um caráter morfológico, bioquímico ou molecular. 
Um fenótipo pode ser normal ou anormal num dado indivíduo. 
 Um caráter monogênico é aquele determinado por um alelo específico num 
único locus em um ambos os membros de um par de cromossomos. O alelo variante, 
 6
que surgiu por mutação em alguma época do passado recente ou remoto, e em geral é 
relativamente raro, substitui um alelo do tipo selvagem normal em um ou ambos os 
cromossomos. Quando uma pessoa tem um par de alelos idênticos diz-se que é 
homozigótica (um homozigoto); quando os alelos são diferentes, ela é heterozigótica 
(um heterozigoto). Esses termos (homozigótico, heterozigótico) podem ser aplicados a 
uma pessoa ou a um genótipo. Usa-se o termo mutação em genética com dois sentidos: 
para indicar uma nova alteração genética que não era previamente conhecida numa 
família e, às vezes, meramente para indicar um alelo alternativo. 
1.4. Organização do Genoma Humano 
 O genoma humano, na sua forma diplóide consiste em aproximadamente 6 a 7 
bilhões de pares bases (ou 6 a 7 milhões de quilobases [kb]) de DNA organizados 
linearmente em 23 pares de cromossomos. Pelas estimativas atuais, o genoma contém 
30.000 a 70.000 genes que controlam todos os aspectos da embriogênese, 
desenvolvimento, crescimento, reprodução e metabolismo – essencialmente todos os 
aspectos do que faz o ser humano um organismo funcional. Assim a influência dos 
genes e da genética nos estados de saúde e doença é ampla e suas raízes são as 
informações codificadas no DNA encontrado no genoma humano. Conhecemos o papel 
de apenas uma pequena percentagem do número total de genes. No entanto, o projeto 
molecular e estrutural geral do genoma, de seus cromossomos e de seus genes está 
sendo esclarecido. A análise da organização do genoma humano é uma área de 
considerável entusiasmo na genética humana e médica atual; espera-se que muitas (se 
não todas) informações genéticas no genoma serão num futuro próximo identificadas e 
examinadas a nível molecular como parte do que foi denominado Projeto Genoma 
Humano, um esforço internacional para mapear e estabelecer a seqüência de todo o 
genoma humano. 
 Embora a grande maioria dos genes se localize no núcleo, um subgrupo pequeno 
reside no citoplasma, nas mitocôndrias. Os genes mitocondriais exibem herança 
exclusivamente materna. Todas as células humanas possuem centenas de mitocôndrias, 
cada uma contendo várias cópias de uma pequena molécula circular, o cromossomo 
mitocondrial. A molécula de DNA mitocondrial mede apenas 16 kb de comprimento 
(menos de 0,03% do comprimento do menor cromossomo nuclear) e codifica 13 genes 
estruturais-chave, bem como vários genes de ácido ribonucleico (RNA) estruturais. 
 
 7
1.4.1. Classes de DNA no Genoma Humano 
 A organização do DNA no genoma humano é bem mais complexa do que se 
imaginava até pouco tempo atrás. Apenas três quartos de comprimento linear total do 
genoma consistem no denominado DNA singular ou de cópia única, isto é, o DNA cuja 
seqüência de nucleotídeos é representada apenas uma vez (ou no máximo algumas 
vezes) por genoma haplóide. O resto do genoma consiste em diversas classes de DNA 
repetitivo e abrange o DNA cuja seqüência de nucleotídeos se repete, seja perfeitamente 
ou com alguma variação, centenas a milhões de vezes no genoma. Embora a maioria 
dos (mas não todos os) 30.000 a 70.000 genes estimados no genoma seja representada 
em DNA de cópia única, acredita-se que a fração de DNA repetitivo desempenhe um 
papel na manutenção da estrutura do cromossomo, mas talvez não desempenhe um 
papel essencial. 
1.4.1.a. Seqüências de DNA de Cópia Única 
 Embora o DNA de cópia única constitua a maior parte do DNA no genoma, sua 
função ainda é um mistério porque as seqüências que codificam proteínas (isto é, a 
porção codificadora dos genes) compreendem apenas uma pequena proporção do DNA 
de cópia única. Longas extensões de seqüências de DNA singular (>25kb) são bastante 
raras no genoma. A maior parte do DNA de cópia única encontra-se em extensões curtas 
(vários kb ou menos), entremeadas com diversas famílias de DNA repetitivo. 
1.4.1.b. Famílias de DNA Satélite 
 São conhecidas várias categorias diferentes de DNA repetitivo. Uma 
característica distintiva útil é se as seqüências repetidas (“repetições”) estão agrupadas 
em um ou em alguns locais, ou se estão espalhadas por todo o genoma, intercaladas com 
seqüências repetidas agrupadas de cópia única ao longo do cromossomo. Estima-se que 
as seqüências repetidas agrupadas constituem 10 a 15% do genoma e consistem em 
séries de várias repetições curtas organizadas em tandem direto. Os diferentes tipos 
dessas repetições em tandem são denominados coletivamente DNAs satélites, assim 
chamados porque muitas das famílias de repetições em tandem originais podem ser 
purificadas do resto do genoma via centrifugação por gradiente de densidade como 
frações “satélites” do DNA. O uso do termo “satélite” está atualmente disseminado na 
genética humana e deve-se ter cuidado para não confundir DNAs satélites como os 
satélites citológicos vistos nos cromossomos acrocêntricos. 
 8
 As famílias de DNA satélite variam quanto à localização no genoma, tamanho 
total da série de tandem, e tamanho das unidades repetidas que constituem a série. 
Algumas seqüências satélites humanas baseiam-se em repetições ou variações, ou 
ambas, de uma curta seqüência como um pentanucleotídeo. Longas séries dessas 
repetições são encontradas nas regiões de heterocromatina nos braços curtos proximais 
dos cromossomos 1, 9 e 16 e em quase todo o braço longo do cromossomo Y. Outros 
DNAs satélites baseiam-se em repetições básicas um pouco mais longas. Por exemplo, a 
família satélite de DNA compõe-se de séries em tandem de diferentes cópias de uma 
unidade de aproximadamente 171 pares bases, encontradas na região centromédia de 
cada cromossomo humano. Em geral, as séries satélites estendem-se por vários milhões 
de pares de bases ou mais e constituem até uma alta fração do conteúdo de DNA de um 
cromossomo humano. 
 Um subgrupo particular de DNAs satélites no genoma humano compreende as 
seqüências designadas minissatélites porque o tamanho total da série parece ser bem 
mais limitado. Cada minissatélite baseia-se em repetições cabeça-para-cauda de um 
monômero de tamanho intermediário (15 a 65 pares de bases) e geralmente abrange 
apenas alguns quilobases (até 20kb) no total. À diferença das séries satélites altamente 
localizadas, acima descritas, os minissatélites distribuem-se mais ou menos ao longo da 
extensão de cada cromossomo. Muitas seqüências de minissatélites são importantes 
como instrumentos moleculares para examinar a variação acentuada que existe entre 
genomas de indivíduos diferentes. Como uma classe, esses “marcadores do DNA” , 
como são chamados, estão revolucionando muitas áreas de genética: mapeamento do 
genoma humano, análise dos cromossomos, medicina forense e diagnóstico de doenças 
hereditárias através de técnicas moleculares. 
1.4.1.c. Famílias de DNA Repetitivo Disperso 
 Além dos DNAs satélites repetitivos em tandem, outra classe importante de 
DNA repetitivo no genoma consiste em seqüências relacionadas que se espalham portodo o genoma, e vez de ficarem localizadas. Embora muitas famílias pequenas de DNA 
satisfaçam esta descrição genérica, duas em particular merecem destaque porque juntas 
perfazem uma proporção significativa do genoma e porque foram implicadas em 
doenças genéticas. 
 Os elementos repetidos dispersos mais extensamente estudados pertencem à 
família Alu, assim denominada porque a maioria dos seus membros é clivada por uma 
 9
endonuclease de restrição bacteriana designada AluI, que era usada na purificação 
inicial deste DNA. (vide descrição sobre endonucleases de restrição no item 2.3). Os 
membros dessa família têm um comprimento de cerca de 300 pares de bases e são 
relacionados uns aos outros, mas não exibem uma seqüência idêntica. No total, existem 
cerca de 500.000 membros da família Alu no genoma, estimando-se que constituam 3% 
do DNA humano. A segunda família importante de DNA repetitivo disperso é a família 
L1. Os elementos L1 são seqüências repetitivas longas (com comprimento de até 6kb) 
encontradas em cerca de 10.000 cópias por genoma 
 Num genoma tão complexo e sofisticado quanto o nosso é interessante que uma 
proporção tão grande do DNA cromossômico (incluindo os DNAs satélites e repetitivos 
dispersos e parte do DNA de cópia única) não tenha nenhuma função óbvia ou 
identificada. De fato, embora a idéia seja execrável para alguns, propôs-se que muitas 
destas seqüências (às vezes denominadas DNA “egoístas” ou “sucata”) não tem 
absolutamente nenhuma função, mantendo-se no genoma apenas porque exploram 
processos celulares para garantir a própria propagação. 
 
2. Variação Individual no DNA. 
 O genoma humano é mais ou menos o mesmo em todas as pessoas, os mesmos 
genes estarão na mesma ordem com as mesmas regiões intergênicas os separando. Mas 
o genoma humano, bem como o dos demais organismos contém muitos polimorfismos, 
posições onde a seqüência de nucleotídeos não é a mesma em cada membro da 
população. Dentre os polimorfismos (ou marcadores genéticos) conhecidos, incluem-se 
como os mais importantes: polimorfismos de tamanho de fragmento de restrição 
(RFLP), número variável de repetições em tandem (VNTR), repetições curtas em 
tandem (STR) e polimorfismos de nucleotídeos individuais (SNP) — vide abaixo, para 
um descrição detalhada. Cada um desses polimorfismos pode ser analisado como uma 
região genética em si mesma e, em virtude da variabilidade observada, podem existir em 
duas ou mais formas alélicas, em geral vários alelos alternativos são descritos para um 
determinado locus. Não devemos esquecer que para cada locus, seja de um gene ou de 
um marcador genético, é possível encontrar um ou dois alelos (no máximo) por 
indivíduo, identificado respectivamente como homozigoto ou heterozigoto para esse 
locus. 
 10
2.1. Polimorfismos de DNA de Interesse Forense 
Devido ao grande número de polimorfismos observados em seres humanos, é 
virtualmente certo que cada um de nós é geneticamente único (com exceção de gêmeos 
idênticos, vide Figura 4). Esta mesma variação genética pode ser usada para identificar 
pessoas, como a impressão digital o faz. Tendo em vista que o DNA pode ser 
encontrado em qualquer amostra de tecido, incluindo sangue, sêmen, e até mesmo em 
saliva e cabelo, a análise da variação genética pode contribuir de maneira substancial na 
elucidação de casos forenses (casos criminais, disputas de paternidade, identificação de 
vítimas de acidentes, pessoas desaparecidas, e assim por diante, vide Figura 5). 
 O princípio subjacente a um perfil de DNA é bem simples. Se forem examinados 
polimorfismos suficientes em uma determinada pessoa, a probabilidade de que qualquer 
pessoa da população tenha os mesmos alelos em cada locus, torna-se extremamente 
reduzida (Figura 5). O DNA deixado na cena de um crime sob a forma de sangue ou 
sêmen, por exemplo, pode ser tipificado quanto a uma série de polimorfismos genéticos. 
Devido a extrema sensibilidade da técnica de PCR, até mesmo uma amostra residual de 
muitos anos pode conter DNA suficiente para uma análise de laboratório (Figura 6). O 
perfil genético obtido a partir da análise de laboratório é então comparado com o de um 
suspeito. Se os alelos que compõem estes perfis forem correspondentes então o suspeito 
é implicado. 
 Uma questão importante é se outra pessoa na população geral poderia ter os 
mesmos alelos que o suspeito. O perfil do DNA poderia então implicar falsamente a 
pessoa errada? Nos casos criminais, a probabilidade de se obter uma correspondência de 
alelos com um membro aleatório na população é calculada. Em função do alto grau de 
variação genética nos polimorfismos mais utilizados para finalidades forenses (mini- e 
microssatélites, vide abaixo), estas probabilidades são, via de regra, desprezíveis. Um 
conjunto de apenas quatro loci de VNTR tipicamente fornecerá a probabilidade de 
correspondência aleatória de um em um milhão. O uso de loci adicionais tornará esta 
probabilidade muito menor. Portanto, que um número suficiente de loci seja usado sob 
condições laboratoriais bem definidas e que os dados sejam coletados e avaliados 
cuidadosamente, estes perfis de DNA fornecerão uma evidência forense altamente útil. 
 Embora tenhamos a tendência de pensar em tal evidência em termos de 
identificação do culpado, devemos ter em mente que quando não é obtida a 
correspondência, um suspeito pode ser libertado. Foi relatado que aproximadamente um 
 11
terço dos casos de estupro nos quais foi usado o perfil de DNA, o suspeito foi libertado 
porque o seu DNA não correspondia à amostra de evidência. Assim, os perfis de DNA 
podem beneficiar os que são falsamente acusados. 
2.2. Detecção e Medida da Variação Genética ao Nível de DNA 
 Durante séculos, ficamos intrigados com as diferenças existentes entre as 
pessoas. A atenção era enfocada nas diferenças observáveis, como a coloração da pele e 
a forma e o tamanho do corpo. Apenas no século XX tornou-se possível examinar as 
variações dos genes, conseqüência de mutações que se acumularam com o tempo. A 
avaliação da variação genética ao nível dos genes foi levada a cabo pela análise direta 
dos polimorfismos de seus produtos, as proteínas. Contudo, esta abordagem mostrou-se 
insuficiente para finalidades forenses. 
As diferenças genéticas identificáveis via polimorfismos de proteínas têm sido 
usada em laboratórios forenses desde o final da década de 1960. Inicialmente, os 
marcadores proteicos baseavam-se nos grupos sangüíneos do sistema ABO. 
Posteriormente, outros grupos sanguineos, proteínas do soro, e, mais recentemente, 
antígenos de histocompatibilidade (HLA) foram tipados por reação imunológica ou 
eletroforese. Como os genes, em sua maioria, representam regiões do DNA 
codificadoras de proteínas e, portanto, sujeitas a rígidas pressões seletivas, uma 
desvantagem do uso de polimorfismos de proteínas é o limitado grau de variação 
associado com esses marcadores. Assim, a identificação de alelos com alta freqüência 
na população entre duas amostras é de menor valor se a probabilidade de ocorrência é 
alta simplesmente por mero acaso. Portanto, a ênfase na aplicação legal tem sido para a 
exclusão em vez da identificação positiva quando duas amostras são comparadas. 
Outros problemas inerentes à analise de proteínas relacionam-se à quantidade de 
tecido necessário para o teste e à relativa facilidade com que as proteínas se degradam. 
Essas considerações são particularmente relevantes quando se tem em mente a cena de 
um crime onde freqüentemente as condições de análise da amostra estão longe da ideal. 
Por fim, as regiões codificadoras de proteínas correspondem a apenas 3% do 
genoma humano. E o que dizer sobre a diversidade genética nos demais 97% de DNA? 
Avalia-se que os seres humanos difiram em aproximadamente 1/300 a 1/500 pb. Assim, 
aproximadamente 10 milhões de polimorfismos podem existirentre os 3 bilhões de 
pares de bases que compõem o genoma humano. Como existem apenas uns 100 grupos 
 12
sangüíneos e polimorfismos eletroforéticos de proteínas, estes enfoques detectam 
apenas uma pequena fração de nossa variação de DNA. E como acessar então a enorme 
variabilidade genética humana? Felizmente novas técnicas moleculares foram 
desenvolvidas nos últimos 20 anos, possibilitando a detecção direta de milhares de 
novos polimorfismos a nível de DNA. Estas análises que revolucionaram tanto a prática 
quanto o potencial da genética médica e forense, serão discutidas a seguir. 
2.3. Polimorfismos de Tamanho de Fragmento de Restrição (RFLPs) 
 O primeiro enfoque importante para a detecção da variação genética em nível de 
DNA tirou proveito da existência de enzimas bacterianas conhecidas como 
endonucleases de restrição ou enzimas de restrição. Essas enzimas são produzidas por 
várias espécies de bactérias para restringir a entrada de DNA exógeno na célula 
bacteriana, cortando o DNA em seqüências específicas feito verdadeiras “tesouras 
moleculares”. As seqüências reconhecidas pelas enzimas de restrição são chamadas 
sítios de restrição. Por exemplo, a bactéria intestinal Escherichia coli produz uma 
enzima de restrição, a EcoRI, que reconhece a seqüência de DNA 5’GAATTC3’. Cada 
vez que este sítio é encontrado, a enzima cliva a seqüência entre G e A em ambas as 
fitas do DNA. Isto resulta em fragmentos de restrição de DNA. 
 Imagine agora uma região do DNA que tem milhares de pares de bases de 
comprimento e inclua três sítios de restrição para EcoRI. Suponha que exista um 
polimorfismo no meio do sítio de restrição (por exemplo, algumas pessoas podem ter a 
seqüência 5’GAATTT3’ em vez de 5’GAATTC3’ reconhecida pela EcoRI. A enzima 
não cortará a seqüência 5’GAATTT3’, embora corte os sítios de restrição normais que 
estejam situados em ambos os lados da seqüência polimórfica. Este fragmento de DNA 
será maior na pessoa que não tem o sítio do que nas que o têm (Figura 7). Se estes 
tamanhos diferentes puderem ser diretamente visualizados, será possível observar 
diferenças de seqüências de DNA entre as pessoas (polimorfismo de DNA). 
 Foram criadas várias etapas que permitem esta visualização. Primeiro, o DNA 
genômico total é extraído de uma amostra de tecido, geralmente sangue. Então o DNA é 
exposto a uma enzima de restrição tal como a EcoRI. Este processo é chamado de 
digestão enzimática. A digestão produz mais de um milhão de fragmentos de DNA. Para 
avaliar a variação de tamanho, estes fragmentos são submetidos à eletroforese em gel, 
onde os fragmentos menores migram mais rapidamente que os maiores. O DNA é 
desnaturado (convertido de bifilamentar para a forma unifilamentar) por exposição a 
 13
soluções alcalinas. Para fixar permanentemente as posições dos fragmentos de DNA, 
eles são transferidos por capilaridade para uma membrana sólida, tal como 
nitrocelulose, o que é conhecido como transferência de Southern, em homenagem ao 
inventor do processo, em meados da década de 1970. Neste ponto, a membrana sólida 
contém muitos milhares de fragmentos dispostos de acordo com o seu tamanho. Diante 
de tantos fragmentos de DNA seria impossível distinguir um do outro devido a sua 
abundância. Como obter fragmentos específicos de DNA? 
 Aqui, é possível explorar o princípio do pareamento complementar de bases do 
DNA. Para identificar um ou mais fragmentos relevantes dentre os milhões de 
fragmentos na membrana, utiliza-se uma sonda radiomarcada. A sonda consiste em um 
pequeno fragmento de DNA humano purificado que foi marcado, em geral com um 
isótopo radioativo, e desnaturado até a condição de filamento único. A membrana é 
exposta a milhares de cópias da sonda que, em condições que favorecem a formação de 
DNA bifilamentar, irá então hibridizar, isto é, formar um pareamento complementar de 
bases, apenas com os fragmentos unifilamentares de DNA apropriados. Para visualizar a 
posição da sonda hibridizada, a membrana é exposta a um filme de raios X, que 
escurece na posição da sonda devido à emissão de partículas radioativas dela emanadas, 
formando as bandas de DNA. 
 Ao final desta descrição metodológica, cujas etapas podem ser vistas 
esquematizadas na Figura 8, o termo “polimorfismos de tamanho de fragmentos de 
restrição” (abreviados como RFLP, pronuncia-se riflip) agora deve ser auto-explicativo. 
Os RFLPs são polimorfismos revelados pela variação nos tamanhos de fragmentos de 
restrição. 
2.4. Polimorfismos de Número de Repetições em Tandem (VNTRs e STRs) 
O enfoque descrito acima geralmente detecta a presença ou ausência de um sítio 
de restrição. Estes polimorfismos são em geral chamados de polimorfismos de sítios de 
restrição (RSPs). Neste caso, um polimorfismo só tem dois alelos possíveis, 
estabelecendo um limite na quantidade de diversidade genética que pode ser vista. Mais 
diversidade pode ser observada se um sistema polimórfico tiver muitos alelos e não 
apenas dois. Uma variação no enfoque de RFLP forneceu tal sistema. Esta variação em 
particular explora os minissatélites que existem pelo genoma. Os minissatélites são 
regiões nas quais a mesma seqüência de DNA é repetida várias vezes, em tandem. A 
variação genética medidas aqui está no número de repetições em uma determinada 
 14
região, que varia substancialmente de indivíduo para indivíduo (origem do termo 
“número variável de repetições em tandem” ou VNTRs). 
Os VNTRs são detectados usando-se um enfoque similar ao usado para os RFLPs 
convencionais. O DNA é digerido com uma enzima de restrição, e os fragmentos são 
submetidos a eletroforese, desnaturados e transferidos para o meio sólido. A diferença 
principal é que as sondas especiais são usadas para se hibridizar apenas com uma 
determinada região de minissatélite (Figura 9). Enquanto os RSPs revelam 
polimorfismo devido a presença ou ausência de um sítio de restrição, os VNTRs 
revelam polimorfismos devido a números diferentes de repetições situadas entre dos 
sítios de restrição (compare os enfoques analisando a Figura 10). O número dessas 
repetições pode variar consideravelmente nas populações: uma região de minissatélite 
pode ter apenas duas ou três repetições, ou até 20 ou mais. Estes polimorfismos podem, 
portanto, revelar um alto grau de variação genética. 
Do mesmo modo que as regiões de minissatélites podem variar de tamanho, os 
microssatélites também pode variar em comprimento como resultado de números 
diferentes de repetições. Cada repetição de microssatélite é substancialmente menor que 
uma repetição de minissatélite (2, 3, 4 ou 5 pb de comprimento). Elas são chamadas de 
repetições de dinucleotídeos, trinucleotídeos, tetranucleotídeos e pentanucleotídeos, 
respectivamente, que em conjunto recebem a denominação de repetições curtas em 
tandem (STR). Uma repetição de microssatélite pode ocorrer em tandem até várias 
centenas de vezes, e este número varia consideravelmente entre as pessoas (e 
geralmente entre os dois cromossomos homólogos de uma pessoa). Estes polimorfismos 
de repetição de microssatélites diferem dos VNTRs já discutidos, em termos de seus 
tamanhos, e também porque não são definidos por sítios de restrição que flanqueiam a 
região de repetição. A técnica da reação em cadeia de polimerase (PCR), discutida a 
seguir, é usada para isolá-las (Figura 11). Os STRs são mais abundantes que os VNTRs, 
mais uniformemente distribuídos no genoma, e mais fáceis de se avaliar no laboratório. 
Assim, eles se tornaram o polimorfismo de escolha da maioria dos estudos de tipagem 
genética individual. Ambos os tipos de polimorfismos são úteis em aplicações forenses, 
como os testes de paternidade e a identificação de suspeitos de crimes. 
2.4.1. Amplificação de DNA pela Reação em Cadeia da Polimerase 
 As análises de RFLP e VNTR, que foram úteis em muitas aplicações, 
originalmente dependiamda transferência de Southern e dos procedimentos de 
 15
clonagem. Estas técnicas apresentam algumas limitações. A clonagem consome muito 
tempo, em geral precisando de uma semana ou de mais de tempo de laboratório. Além 
disso, o enfoque padrão da transferência de Southern requer quantidades relativamente 
grandes de DNA purificado, em geral vários microgramas (até 1 ml de sangue fresco 
seria necessário para produzir esse DNA). Um enfoque mais novo para se fazer cópias 
do DNA, a reação em cadeia da polimerase (PCR), tornou a detecção da variação 
genética ao nível de DNA muito mais eficiente. Essencialmente, a PCR é um meio 
artificial de replicar uma seqüência curta específica de DNA (vários kb pelo menos) 
muito rapidamente, de modo que são feitas milhões de cópias da seqüência. 
 O processo da PCR exige quatro componentes principais: 
I) Dois iniciadores (ou primers), consistindo de 15 a 20 bases de DNA cada. Estas 
pequenas seqüências de DNA são chamadas de oligonucleotídeos, oligo 
indicando “poucos”. Os iniciadores correspondem a seqüência de DNA 
imediatamente adjacentes à seqüência de interesse (esta seqüência pode conter 
uma mutação que cause doença, pode conter um polimorfismo de repetição de 
microssatélite). Estes iniciadores oligonucleotídeos são sintetizados usando-se 
um instrumental de laboratório; 
II) DNA polimerase. Uma forma termicamente estável desta enzima, inicialmente 
derivada da bactéria Thermus aquaticus, efetua o processo vital de replicação do 
DNA (aqui chamado de amplificação); 
III) Nucleotídeos livres: dATP, dCTP, dGTP, dTTP; 
IV) DNA genômico humano. Devido à extrema sensibilidade da PCR, a quantidade 
deste DNA pode ser muito pequena (aproximadamente 20ng); 
O DNA genômico é inicialmente aquecido a uma temperatura relativamente alta 
(95ºC mais ou menos) de modo que a molécula se desnatura e fica uniflamentar. Este 
DNA então exposto a grandes quantidades de iniciadores, com os quais se hibridiza por 
meio das bases complementares do DNA, à medida que é resfriado a uma temperatura 
de helicoidização de aproximadamente 35º a 65ºC. O DNA é então aquecido a uma 
temperatura intermediária (70º a 75ºC). Na presença de um grande número de 
nucleotídeos livres, um novo filamento de DNA é sintetizado pela DNA polimerase a 
esta temperatura, estendendo a seqüência do iniciador. O DNA recém-sintetizado 
consiste em um duplo filamento que tem a ponta 5’ do iniciador em uma extremidade, 
 16
seguido das bases adicionadas por meio da extensão do iniciador pela DNA polimerase. 
O DNA bifilamentar é então aquecido novamente a uma alta temperatura, fazendo com 
que ele se desnature. O ciclo de aquecimento-resfriamento é então repetido. Agora, o 
DNA recém-sintetizado serve como molde para outras sínteses. À medida que os ciclos 
de aquecimento-resfriamento são repetidos, o DNA ligado ao iniciador é amplificado 
geometricamente: o número de cópias dobra a cada ciclo (2,4,8,16, e assim por diante). 
Daí o processo ser chamado “reação em cadeia”. Tipicamente os ciclos são repetidos a 
cada 20 a 30 vezes, produzindo milhões de cópias do DNA original. Em resumo, o 
processo de PCR consiste em três etapas básicas: desnaturação do DNA em alta 
temperatura, hibridização do iniciador a uma temperatura intermediária e polimerização. 
O resultado é um produto que consiste quase que inteiramente de uma seqüência de 
DNA específica. A Figura 12 resume todo o processo. 
Como cada ciclo de aquecimento-resfriamento requer apenas alguns minutos ou 
menos, uma típica molécula de DNA pode ser amplificada para fazer milhões de cópias 
em poucas horas. Sendo o procedimento simples e autocontido, foram desenvolvidos 
aparelhos para automatizá-lo totalmente. Uma vez que o DNA tenha sido amplificado, 
ele pode ser analisado de vários modos. 
A PCR tem várias vantagens em relação às técnicas anteriores. Primeiro, pode 
ser usada com quantidades extremamente pequenas de DNA (nanogramas ou mesmo 
picogramas, em oposição aos microgramas necessários para clonagem). A quantidade 
de DNA em uma mancha de sangue de vários anos, um único fio de cabelo ou mesmo a 
parte de uma goma de um selo lambido são em geral suficientes para análise. Segundo, 
como não requer clonagem gênica, o procedimento é portanto muito mais rápido. Um 
exame de DNA, que requeria uma semana ou mais usando técnicas antigas pode ser 
feito em um único dia com PCR. Finalmente, como a PCR pode produzir grandes 
quantidades de DNA purificado, é menos freqüentemente necessário usar sondas 
radioativas para detectar seqüências ou polimorfismos específicos. Ao invés disso, 
compostos marcadores não radioativos, como biotina, podem ser usados. 
A PCR tem algumas desvantagens. Primeira, a síntese dos iniciadores 
obviamente requer o conhecimento das seqüências de DNA que flanqueiam o DNA de 
interesse. Quando não há nenhuma informação disponível sobre a seqüência, outras 
técnicas devem ser usadas. Segunda, a extrema sensibilidade da PCR a torna suscetível 
à contaminação no laboratório. Várias preocupações são comumente tomadas de modo a 
 17
se proteger contra contaminação. Finalmente, é difícil aplicar a PCR para seqüências 
maiores que um ou alguns kb. Assim, ela não poder ser usada para detectar regiões 
maiores que isso. Nestes casos, são usadas técnicas típicas, como a transferência de 
Southern. 
Como a PCR é uma técnica poderosa e versátil, ela é hoje amplamente usada no 
diagnóstico de doenças genéticas, medicina forense e genética evolutiva. Ela suplantou 
a transferência de Southern em muitas aplicações, e hoje é freqüentemente usada para 
avaliar RFLPs e VNTRs, e principalmente STRs. A PCR é tão sensível que tem sido 
usada para estudar o DNA de múmias, e mesmo de um neandertal com 30.000 anos. A 
análise deste material mostrou que os seres humanos modernos são geneticamente bem 
diferentes dos neandertais, e portanto é improvável que descendam deles. 
2.5. Polimorfismos de Nucleotídeos Individuais (SNPs) 
 Os polimorfismos de nucleotídeos individuais (SNPs) são os polimorfismos mais 
comuns no genoma humano e consistem em posições de um genoma em que qualquer 
um de dois ou mais nucleotídeos pode ocorrer (Figura 13). Tais mutações pontuais 
podem ser tipificadas por RFLP, caso o polimorfismo recaia dentro de um sítio de 
restrição; análise com sondas de oligonucleotídeos específicos (técnica abreviada como 
ASO, de Allele Specific Oligonucleotides), as quais se hibridizam com formas 
alternativas de SNP; e mais diretamente por seqüenciamento de DNA. 
2.5.1. Seqüenciamento de DNA 
 O método didesoxi de seqüenciamento por terminação de cadeia do DNA 
inventado por Frederick Sanger que faz uso de didesoxinucleotídeos terminadores de 
cadeia. Eles são quimicamente muito similares aos desoxinucleotídeos comuns, a não 
ser por falta do grupo hidroxila na posição 2’ (Figura 14). Isto impede a formação 
subseqüente de ligações fosfodiéster com bases livres de DNA. Assim, embora os 
didesoxinucleotídeos passam a ser incorporados à hélice crescente de DNA, nenhum 
nucleotídeo adicional pode ser acrescentado após terem sido incluídos. São usados 
quatro didesoxinucleotídeos diferentes, cada um correspondendo a um dos quatro 
nucleotídeos (A, C, G e T). O DNA unifilamentar cuja seqüência desejamos determinar 
é misturado a iniciadores marcados com radiação, DNA polimerase, nucleotídeos 
comuns e um tipo de didesoxinucleotídeos. O iniciador se hibridiza à posição 
complementar apropriada no DNA unifilamentar, e a DNA polimerase adiciona bases 
 18
livres à molécula crescente de DNA, similar à etapa de extensão de iniciador no 
processo de PCR. Os didesoxinucleotídeos são incorporados às cadeias do mesmo modo 
que o nucleotídeo correspondente. Entretanto, uma vez que o didesoxinucleotídeo se 
incorpore, a polimerização é interrompida e a cadeia terminada. Em qualquer posiçãopode ser incorporado ou o nucleotídeo comum ou o didesoxinucleotídeo 
correspondente. Este é um processo aleatório. O procedimento produz fragmentos de 
DNA de tamanhos variados, cada um terminado com um dos quatro 
didesoxinucleotídeos. Os fragmentos de DNA podem ser separados de acordo com o 
seu tamanho pela eletroforese (Figura 15). Assim, são efetuadas quatro reações 
diferentes de seqüenciamento, uma para cada base. Os fragmentos obtidos de cada 
reação são submetidos a eletroforese lado a lado no mesmo gel, de modo que a posição 
de cada fragmento pode ser comparada. Como cada banda corresponde a uma 
terminação de cadeia de DNA com uma única base, a seqüência de DNA pode ser lida 
observando-se a ordem das bandas no gel após a auto-radiografia (o iniciador radioativo 
indica a posição dos fragmentos no filme de raio X). Várias centenas de pares de bases 
podem em geral ser seqüenciadas em uma série de reações (Figuras 14 e 15). 
 Seqüenciar o DNA deste modo é um processo relativamente lento, trabalhoso e 
sujeito a erro. Mais recentemente, foram desenvolvidas estratégias para seqüenciamento 
automatizado de DNA usando-se sistemas de detecção fluorescente, 
quimioluminescente ou colorimétrico. O uso de iniciadores ou didesoxinucleotídeos 
marcados com fluorocromos tornou-se o mais popular destes métodos, em parte, porque 
pode ser facilmente adaptado à rápida automação. 
 Tipicamente, um molde de DNA é seqüenciado usando-se um método similar à 
etapa de extensão de iniciador da PCR. Cada um dos quatro nucleotídeos diferentes 
pode ser marcado com um fluorocromo que emite um espectro diferente de luz. Os 
produtos de reação marcados com o fluorocromo são submetidos a eletroforese em um 
gel fino de poliacrilamida, e à medida que migram, são excitados por um feixe de luz de 
um laser. A luz emitida é capturada por uma câmera digital para a tradução em um sinal 
eletrônico, sendo, gerada uma imagem composta do gel. Esta imagem do gel é estudada 
para produzir um gráfico, no qual cada um dos quatro nucleotídeos diferentes é 
representado por um pico de luz diferente. Atualmente o sistema de separação em gel 
em placa foi otimizado para capilares. Seqüenciadores automatizados também podem 
 19
ser adaptados para triar polimorfismos de microssatélites (STRs) e polimorfismos de 
nucleotídeos únicos (SNPs). 
 Usando-se computadores e técnicas de automação avançadas, enfoques como 
esses têm aumentado muito a velocidade potencial de seqüenciamento do DNA. Estas 
técnicas permitiram o seqüenciamento de todos os três bilhões de pares bases do 
genoma humano. 
 
3. Base Estatística e Populacional para Análise de Perfis de DNA 
3.1. Genética de Populações e a Teoria das Freqüências Alélicas 
 A teoria da genética de populações é uma teoria de freqüências alélicas. Cada 
gene no genoma existe em diferentes estados alélicos, e se for enfocado um determinado 
gene, um indivíduo diplóide é um homozigoto ou heterozigoto. Em uma população de 
indivíduos, podemos calcular as freqüências dos diferentes tipos de homozigotos e 
heterozigotos de um gene, e por estas freqüências podemos avaliar a freqüência de cada 
um dos alelos dos genes. Estes cálculos são a fundação da teoria da genética de 
populações. 
3.1.1. Estimativa das Freqüências Alélicas 
 Como uma população inteira em geral é muito grande para ser estudada, 
analisamos uma amostra representativa de indivíduos dela apresentando dados de uma 
amostra de pessoas que foram testadas quanto aos tipos sangüíneos M-N. Estes tipos 
sangüíneos são determinados por dois alelos de um gene no cromossomo 4: LM, que 
produz o tipo sangüíneo M e LN , que produz o tipo sangüíneo N. As pessoas que são 
heterozigotas LMLN têm o tipo sangüíneo MN. 
 
Freqüência de Tipo Sangüíneos M-N em uma Amostra de 6.129 Pessoas 
 
Tipo Sangüíneo Genótipo Número de Pessoas 
 M LMLM 1.787 
 MN LMLN 3.039 
 N LNLN 1.303 
 20
 Para estimar as freqüências dos alelos LM e LN, simplesmente calculamos a 
incidência de cada alelo entre todos os alelos demonstrados. 
1- O número total de alelos na amostra é duas vezes o tamanho da amostra: 2 x 
6.129 = 12.258. 
2- A freqüência de alelo LM é duas vezes o número de homozigotos LMLM mais o 
número de heterozigotos LMLN e o total dividido pelo número total de alelos 
amostrados: [(2 x 1.787) + 3.039]/12.258 = 0,5395. 
3- A freqüência do alelo LN é duas vezes o número de homozigotos LNLN mais o 
número de heterozigotos LMLN e o total dividido pelo número total de alelos 
amostrados: [(2 x 1.303) + 3.039]/12.258 = 0,4605. 
Assim se p representar a freqüência do alelo LM e q representar a freqüência do 
alelo LN, avaliamos que na população onde a amostra foi obtida p = 0,5395 e q = 
0,4605. Alem disso, como LM e LN são únicos dois alelos deste gene em particular, p + q 
= 1. Quando a contagem direta do número de alelos em uma amostra não é possível 
porque um dos alelos é fenotipicamente dominante, não podemos estimar as freqüências 
alélicas. Entretanto, outro método, discutido na sessão seguinte, fornece estas 
estimativas. 
 Neste exemplo, cada um dos alelos tem uma freqüência razoavelmente alta, uma 
que pode ser avaliada confiavelmente com uma amostra de tamanho moderado. 
Entretanto, alguns alelos têm freqüências de 0,01 ou menos, e a avaliação de suas 
freqüências, ou mesmo a sua detecção, requer uma grande amostra. Sempre que o 
segundo alelo mais freqüente de um gene tem uma freqüência maior que 0,01, nos 
referimos à situação como um polimorfismo genético. 
3.1.2. O Princípio de Hardy-Weinberg 
 As freqüências alélicas avaliadas têm algum valor preditivo? Podemos usá-las 
para prever as freqüências genotípicas? Na primeira década do século XX, estas 
perguntas foram feitas independentemente por G. H. Hardy, um matemático britânico, e 
por Wilhelm Weinberg, um médico alemão. Em 1908, Hardy e Weinberg publicaram, 
cada um, trabalhos descrevendo uma relação matemática entre freqüências alélicas e 
freqüências genotípicas de uma população por suas freqüências alélicas. 
 21
 Suponhamos que em uma população um determinado gene está segregando dois 
alelos, A e a, e que a freqüência A é p e a de a é q. Se considerarmos que os membros 
da população se reproduzem aleatoriamente, então os genótipos diplóides da geração 
seguinte serão formados pela união aleatória de ovócito (ou espermatozóide). A 
probabilidade que o gameta carregue o alelo A é p, e a probabilidade que carregue o 
alelo a é q. Assim, a probabilidade de produzir um homozigoto AA na população é 
simplesmente p x p = p2, e a probabilidade de produzir um homozigoto aa é q x q = q2. 
Para os heterozigotos Aa existem duas possibilidades. Um espermatozóide A pode se 
juntar a um ovócito a, ou um espermatozóide a pode se unir a um ovócito a. Cada um 
destes eventos ocorre com a probabilidade p x q , e como são igualmente prováveis, a 
probabilidade total de formar um zigoto Aa é 2pq. Assim, supondo um casamento 
aleatório, as freqüências previstas para os três genótipos na população são: 
 
Genótipo Freqüência 
 AA p2 
 Aa 2pq 
 aa q2 
 
 Estas freqüências previstas são os termos na expansão binomial (p + q)2 = p2 + 
2pq + q2. Os geneticistas de população referem-se a elas como freqüências genotípicas 
de Hardy-Weinberg. A suposição final adjacente ao Princípio de Hardy-Weinberg é que 
os membros da população se reproduzem aleatoriamente com relação ao gene em 
estudo. Esta suposição significa que os adultos na população essencialmente formam 
um pool de gametas, que na fertilização, combinam-se aleatoriamente para produzir os 
zigotos da geração seguinte. Se estes zigotos têm chances iguais de sobreviver até o 
estágio adulto, então as freqüências genotípicas nomomento da fertilização serão 
preservadas, e quando a geração seguinte se reproduzir, estas freqüências novamente 
aparecerão na prole. Assim com a reprodução aleatória sem sobrevida e reprodução 
diferencial entre os membros da população, as freqüências genotípicas de Hardy-
Weinberg e, logicamente, as freqüências alélicas subjacentes — persistem geração após 
geração. Esta condição é chamada de Equilíbrio de Hardy-Weinberg. O equilíbrio de 
Hardy-Weinberg muitas vezes não é observado em populações naturais devido à 
 22
interferência de forças que perturbam este equilíbrio alterando freqüências alélicas. 
Estas forças — mutação, migração, seleção natural e deriva genética aleatória — têm 
papéis importantes no processo evolutivo. 
3.1.3. Aplicações do Princípio de Hardy-Weinberg 
 O Princípio de Hardy-Weinberg se aplica ao exemplo do tipo sangüíneo M-N em 
população real. A partir dos dados do quadro a seguir, a freqüência do alelo LM foi 
estimada como sendo p = 0,5395 e a freqüência do alelo LN foi estimada como sendo q 
= 0,4605. Com o Princípio Hardy-Weinberg, agora podemos usar freqüências alélicas 
para prever as freqüências genotípicas dos genes para o tipo sangüíneo M-N: 
 
Genótipo Freqüência de Hardy-Weinberg 
 LMLM p2 = (0,5395)2 = 0,2911 
LMLN 2pq = 2 (0,5395) (0,4605) = 0,4968 
LNLN q2 = (0,4605)2 = 0,2121 
 
 Estas previsões correspondem aos dados originais dos quais as duas freqüências 
alélicas foram estimadas? Para responder a esta pergunta, devemos comparar os 
números de genótipos observados com os números previsto pelo Princípio de Hardy-
Weinberg. Obtemos estes números previstos multiplicando as freqüências de Hardy-
Weinberg pelo tamanho da amostra obtida da população. 
 
Genótipo Número Previsto 
LMLM 0,2911 X 6.129 = 1.784,2 
LMLN 0,4968 X 6.129 = 3.044,8 
LNLN 0,2121 X 6.129 = 1.300,0 
 
Assim, os resultados são extraordinariamente próximos aos dados da amostra 
original apresentados e os desvios observados foram obtidos por obra do acaso. 
Podemos verificar a concordância entre os números observados e os previstos 
 23
calculando uma estatística apropriada como a do teste do qui-quadrado. No entanto, o 
desenvolvimento da estatística do qui-quadrado está além do objetivo deste texto. 
Concluímos então que as freqüências genotípicas previstas estão de acordo com 
as freqüências observadas na amostra, e mais ainda, deduzimos que na população da 
qual a amostra foi obtida dos genótipos M-N estão nas proporções de Hardy-Weinberg, 
um achado que não é surpreendente tendo em vista que o casamento em geral não é 
baseado no tipo sangüíneo. 
 Para os genes alelos múltiplos, as proporções genotípicas de Hardy-Weinberg 
são obtidas expandindo-se a expressão multinomial. Por exemplo, os tipos sangüíneos 
ABO são determinados pelos três alelos IA, IB e IO . Se as freqüências deles são p, q, r, 
respectivamente, então as freqüências dos seis genótipos diferentes no sistema de tipo 
sangüíneo ABO são obtidas pela expansão trinomial (p + q + r)2 = p2 + q2 + r2 + 2pq + 
2qr + 2pr: 
 
Tipo Sangüíneo Genótipo Freqüência 
 A IAIA p2 
 IAIO 2pr 
 B IBIB q2 
 IBIO 2qr 
 AB IAIB 2pq 
 O IOIO r2 
 
 Existem muitos motivos pelos quais o Princípio de Hardy-Weinberg não pode 
ser aplicado a uma população particular. A reprodução pode não ser aleatória, os 
membros da população portadores de alelos diferentes podem não ter chances iguais de 
sobrevida e reprodução, a população pode ser dividida em unidades parcialmente 
isoladas ou pode ser um amálgama de populações diferentes que se juntaram 
recentemente por migração. 
 
 24
4. Bibliografia 
Brown, T. A. (2003). Clonagem Gênica e Análise de DNA: Uma Introdução. 4ª Ed. 
ARTMED. 
Comitê sobre a Tecnologia do DNA na Ciência Forense. (1999). A Tecnologia do DNA 
na Ciência Forense. FUNPEC, Ribeirão Preto. 
Jeffreys, A. J., Wilson, V., & Thein, L. S. (1985). Individual-specific fingerprints of 
human DNA. Nature. 314: 67-73. 
Krawczak, M. & Schmidtke, J. (1998). DNA Fingerprinting. 2nd edn. BIOS. Scientific 
Publishers, Oxford. 
 25
5. Anexo: Figuras 
 
 
Figura 1. Estrutura química dos quatro nucleotídeos que são os blocos de construção 
fundamentais do DNA. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 26
 
 
 
Figura 2. A dupla hélice do DNA desenrolada para mostrar as ligações desoxirribose-
fosfato e os degraus de pares de bases. 
 27
 
Figura 3. Organização cromossômica do DNA. 
 
Figura 4. Perfis de DNA de dois pares de gêmeos monozigóticos (ou idênticos) e um par 
de gêmeos dizigóticos (ou fraternos). 
 28
(A) (B) 
 
Figura 5. Perfis de DNA de interesse forense utilizando sondas multilocal (A) e unilocal 
(B) de VNTR. 
 
Figura 6. Perfis de DNA de interesse forense utilizando sistema de PCR multiplex para 
oito loci de STR. 
�VNTR 
 29
 
 
Figura 7. Polimorfismo de Tamanho de Fragmento de Restrição (RFLP). 
Heterozigosidade no sítio de restrição da enzima HpaII (isolada de Haemophilus 
parainfluenzae) que reconhece a seqüência 5’CCGG 3’. 
 
 30
 
 
 
Figura 8. Transferência e Hibridização de Southern. 
 
 31
 
 
Figura 9. Detecção de polimorfismos de minissatélites (VNTR) por hibridização de 
Southern. 
 
 
 
Figura 10. Comparação entre dois tipos de polimorfismo detectados por hibridização de 
Southern: (A) RFLP dialélico e (B) VNTR multialélico. 
 
 
 32
 
 
 
Figura 11. Detecção de polimorfismos de microssatélites (STR) por PCR. 
 
 
Figura 12. A Reação em Cadeia da Polimerase (PCR). 
 
Oligo A Oligo B 
Oligo A Oligo B 
Alelo 1 
Alelo 2 
 1 STR 
 33
 . . . A T A G A C C A C A T G G C A A . . . 
 . . . A T A G A C T A C A T G G C A A . . . 
 
Figura 13. Polimorfismo de Nucleotídeos Individuais (SNP). 
 
 
Figura 14. Seqüenciamento de DNA pelo método didesoxi de Sanger. 
 
 34
 
Figura 15. Interpretação da auto-radiografia de um seqüenciamento de DNA pelo 
método didesoxi.

Continue navegando