Baixe o app para aproveitar ainda mais
Prévia do material em texto
GENÉTICA FORENSE Autores: Felipe Gonçalves Murga Sérgio Paulo Lopes Fernandes Professora: Zulmira Lacava Brasília 2008 LISTA DE ILUSTRAÇÕES Figura 1 – Esquema da amplificação de DNA pela reação em cadeia da polimerase 9 Figura 2 – Seqüenciamento de DNA pelo método de Sanger 14 Figura 3 – Eletroferograma de uma análise de DNA mitocondrial 15 Figura 4 – Perfis de STR de dois diferentes indivíduos 19 Figura 5 – Tabela de loci utilizados em determinados métodos multiplexados 20 Figura 6 – Análise de STR de um indivíduo homem 21 Figura 7 – Análise de STR de um indivíduo mulher 22 LISTA DE ABREVIATURAS ABI – Applied Biosystems, Inc. CODIS – Sistema Conjunto de Indexação de DNA [Combined DNA Index System] DNA – Ácido desoxirribonucléico DNAmt – DNA mitochondrial EDNAP – European DNA Profiling Group ENFSI – European Network of Forensic Science Institutes IPCR – Inverse-PCR LCN – Low Copy Number mRNA – Ácido ribonucléico mensageiro PIA – Paternally imprinted allele PCR – Reação em cadeia da polimerase RACE – Rapid Amplification of cDNA Ends RFLP – Polimorfismo do comprimento dos fragmentos de restrição [restriction fragment length polymorphisms] RT – Transcriptase reversa rTth – enzima que realiza simultaneamente a transcrição reversa e a reação em cadeia da polimerase SGM – Sistema multiplex de segunda geração STR – Repetições curtas enfileiradas [short tandem repeats] Taq – DNA polimerase derivada da Thermus aquaticus XL PCR – PCR extra-longas SUMÁRIO 1 – Introdução 1 2 – Histórico 3 3 – DNA fingerprinting 6 4 – Reação em cadeia da polimerase (amplificação de DNA in vitro) 8 5 – Seqüenciamento 13 6 – Futuro 15 6.1 – Amplificação de quantidade traço de DNA 15 6.2 – Banco de dados 16 6.2.1 – Seleção de loci STR para multiplexação forense 17 6.2.2 – Nomenclatura do locus STR 18 6.3 – Patentes 22 BIBLIOGRAFIA CONSULTADA 23 ANEXOS 24 Anexo A – Genetic Fingerprinting 24 1 1 Introdução: Barry Scheck e Peter Nefeuld expressaram bem a questão no prefácio de seu livro Actual innocence: “Os testes de DNA são para a justiça o que o telescópio é para as estrelas; não uma lição de bioquímica, não uma exibição das maravilhas da lente de aumento, mas uma maneira de ver as coisas como realmente são”. O que poderia haver de errado nisso? O ácido desoxirribonucleico (DNA) é o código genético de muitos organismos. O DNA de humanos e de muitos outros organismos como gatos, cães, ovelhas, tigres, cavalos, plantas (e.g., Cannabis sativa), e bactérias tem sido utilizado em aplicações forenses. Os primers para humanos podem ser utilizados para amplificar DNA de alguns outros primatas. A maioria do DNA humano está presente no núcleo da célula. Ele está empacotado nos 46 cromossomos da maioria das células. Este DNA é denominado DNA nuclear. Entretanto, uma pequena porção do DNA de cada célula está localizada nas mitocôndrias. Este DNA mitocondrial é herdado por um mecanismo diferente e é tratado de forma diferente no contexto forense. A maioria das células humanas é diplóide, isto significa que elas têm duas cópias de cada cromossomo. São exceções, as células sexuais (esperma ou óvulos), que são haplóides (tem uma cópia simples de cada cromossomo), e as células do fígado, que são poliplóides – triploidia (69,XXX) e tetraploidia (92,XXXX) são diferentes de aneuploidia (47,XXX) e (48,XXXX). As células diplóides contêm 46 cromossomos em 23 pares (durante 40 anos considerou-se 48 cromossomos). Os cromossomos humanos são numerados de 1 a 22, no qual o maior recebe o número 1 e o segundo maior o número 2. Os 23 pares compreendem os cromossomos X e Y, que dá o sexo do indivíduo. Este par pode ser denominado como “não autossômico” ou “germinativo”. Cada cromossomo possui um centrômero. Esta estrutura está envolvida na organização do DNA durante a divisão celular. Ele é sempre fora do centro e por conseqüência produz o braço curto e o braço longo do cromossomo. Uma fêmea normal tem dois cromossomos X enquanto que um macho normal tem um cromossomo X e um Y. Um dos cromossomos X da fêmea é desativado em cada célula, tornando-se uma estrutura visível ao microscópio conhecida como corpo visível de Barr. O cromossomo X desativado pode diferir entre cada célula. Em mamíferos, a existência de um cromossomo Y determina que o organismo seja macho. De fato, a existência de uma pequena seção do braço curto do cromossomo Y resultará em um macho (outras ordens de 2 vida, tais como os répteis, determinam o sexo utilizando outros mecanismos). Um cromossomo de cada um dos 23 pares é herdado da mãe e outro do pai. Pela análise de um único indivíduo, não é possível dizer que cromossomo veio do pai ou da mãe, com a exceção do cromossomo sexual de um indivíduo macho cujo cromossomo Y advém de seu pai e cujo cromossomo X advém de sua mãe. Entretanto, há estudos recentes utilizando identificação do tipo paternally imprinted allele (PIA) que sugerem que isto pode ser possível para alguns loci. Em mamíferos, alguns genes sofrem impressão paterna e tanto o alelo da mãe quanto do pai pode ser preferencialmente expresso nos seus descendentes. A razão para isto ainda é desconhecida. A impressão parece estar associada com a metilação diferencial do alelo. Trinta e nove genes humanos têm sido identificados como sujeitos à impressão paterna. Quando o perfil de DNA da maioria dos indivíduos é verificado, eles mostram um ou dois alelos para cada locus. Se eles apresentam um, nós assumimos que eles serão homozigóticos – isto significa que eles têm recebido duas cópias de um mesmo alelo, um de cada pai. Se os indivíduos mostram dois alelos, ele ou ela é denominado heterozigótico. Em tais casos, o indivíduo herdou diferentes alelos de cada pai. A exceção é causada pelos alelos nulos ou silenciosos. Acredita-se que todos os humanos, exceto os gêmeos idênticos, diferem em seu DNA nuclear. Mesmo gêmeos idênticos podem diferir em menor proporção. Não há uma prova formal deste conceito de unicidade, contudo isto tem pouca influência nos trabalhos forenses porque somente algumas poucas regiões ou loci do genoma humano são examinadas. As áreas do genoma humano utilizadas para os perfis de DNA STR [short tandem repeats] são largamente intrônicas. Isto significa que elas são segmentos de DNA que não codificam para proteínas distribuídas entre áreas do DNA que codificam para proteínas. Elas foram inicialmente consideradas não funcionais; entretanto, acumulam-se evidências de que estas regiões de DNA podem, certamente, ter uma função. Uma das funções para essas regiões pode ser a regulação do desenvolvimento de eucariotos. Interessantemente, grandes áreas de DNA que não codificam proteínas, muitas das quais não estão relacionadas à regulação, são fortemente conservadas entre as espécies. Isto pode ser uma forte evidência que elas também são, certamente, funcionais. Introns são peculiares de eucariotos e acredita-se que se desenvolveram posteriormente na evolução eucariótica. Eles apresentam uma característica de conter regiões polimórficas, ou seja que têm muitas formas diferentes. Acredita-se que isto se deve à 3 pequena ou à quase nenhuma pressão seletiva em alguns destes loci e, que por conseqüência, diferentes formas podem subsistirlado a lado na população. Algumas alterações alélicas têm sido registradas em células da mucosa oral e colorretal de pacientes com câncer e isto pode afetar a genotipagem quando um DNA de referência é tomado de um tecido diferente do corpo na amostra de cena de crime. 2 Histórico: Até meados da década de 1980, a amplificação de uma determinada região do DNA dependia do método Cohen-Boyer de clonagem molecular, a saber: recortar o pedaço desejado de DNA, inseri-lo num plasmídeo, e inserir o plasmídeo modificado numa célula bacteriana. Essa célula então se replicava, duplicando em cada replicação o segmento inserido de DNA. Quando as bactérias se multiplicassem o suficiente, purificava-se o segmento de DNA desejado separando-o da massa total de DNA da população bacteriana. Embora houvesse sido aprimorado desde os experimentos originais de Boyer e Cohen, esse procedimento continuava sendo trabalhoso e demorado. A descoberta da reação em cadeia da polimerase (PCR) foi, portanto, um grande avanço: alcançava-se o mesmo fim – a amplificação seletiva de um segmento de DNA – em poucas horas, sem a necessidade de ficar lidando com bactérias. Nesta época, a controvérsia genômica estava no auge, talvez porque a tecnologia forense estivesse sendo aplicada cada vez mais, embora ainda se usasse a técnica original, ainda não aperfeiçoada, de Jeffreys – a barulhenta e obscura análise dos polimorfismos do comprimento dos fragmentos de restrição [conhecidos pela sigla em inglês RFLP = restriction fragment length polymorphisms]. Inevitavelmente, alguns resultados eram difíceis de interpretar e, com isso, a identificação genômica passara a ser contestada por motivos técnicos e legais. No início, quando a identificação genômica era realizada em laboratórios forenses não especializados no manuseio e na análise do DNA, erros crassos não eram incomuns. Os órgãos de segurança pública logo perceberam que, se quisessem que essa nova e poderosa arma continuasse sendo usada, essas questões teriam de ser resolvidas. Foi quando um novo tipo de marcador genético – as chamadas “repetições curtas enfileiradas”, conhecidas pela sigla em inglês STRs [short tandem repeats] – substituiu o método dos 4 RFLPs. O tamanho das STRs pode ser medido com bastante precisão, eliminando-se assim a avaliação subjetiva das faixas de RFLPs num filme de raios X. E a comunidade da ciência forense também resolveu rapidamente o problema da competência técnica variável ao estabelecer não só um código uniforme de procedimentos para a identificação genômica, mas também um sistema de credenciamento de laboratórios. Na Rússia, a identificação dos resquícios esqueletais da família do czar Romanov foi recebida com certo ceticismo, especialmente pela discórdia entre os cientistas russos e uma equipe americana que participava do projeto. Mas, em setembro de 1992, o dr. Pável Ivanov levou nove amostras de ossos ao laboratório de Peter Gill, do Serviço de Ciência Forense [Forensic Science Service] da Grã-Bretanha. Gill e um colega, David Werrett, eram co-autores do primeiro trabalho que Alec Jeffreys publicou nesse campo e haviam fundado o Serviço de Ciência Forense, o primeiro laboratório do Reino Unido especializado em identificação genômica. Gill desenvolvera um método de identificação que utilizava DNA mitocondrial (DNAmt) – que, como vimos na análise dos restos neandertais, é muito mais profícuo quando o DNA disponível é velho ou difícil de obter (o DNAmt é muito mais abundante do que o DNA cromossômico do núcleo celular). A primeira incumbência de Gill e Ivanov foi o delicado trabalho de extrair DNA nuclear e DNAmt das amostras de ossos. A análise mostrou que cinco corpos eram aparentados e que três deles pertenciam a três irmãs. Mas seriam ossos dos Romanov? No caso da czarina Alexandra, pelo menos, era possível encontrar uma resposta comparando a impressão genômica do DNAmt de seus ossos com a impressão do DNAmt de seu sobrinho- neto, o príncipe Phillip, duque de Edimburgo. As impressões eram simétricas. Encontrar um parente do czar foi bem mais difícil. O corpo do grão-duque Georgij Romanov, irmão caçula do czar, jazia num requintado sarcófago de mármore considerado precioso demais para ser arrombado. O sobrinho do czar recusou-se a cooperar, ainda rancoroso com a recusa do governo britânico em conceder asilo à sua família quando irrompeu a revolução. Sabia-se da existência de um lenço ensangüentado no Japão, que o czar usara após ser atacado por um espadachim homicida em 1892. Gill e Ivanov obtiveram um pequeno pedaço do lenço, mas verificaram que ao longo dos anos a relíquia fora tão contaminada por DNA estranho que se tornara inútil para esse fim. Só quando dois parentes 5 distantes puderam enfim ser localizados é que se confirmou que a impressão do DNAmt era realmente do czar. Contudo, a análise guardava mais uma surpresa: as seqüências de DNAmt do suposto czar e de seus parentes modernos eram semelhantes, mas não idênticas. Especificamente, na posição 16.169, o DNAmt do suposto czar continha um C e o dos dois parentes apresentava um T. Testes subseqüentes mostraram outras complicações. O DNA mitocondrial do czar era, na realidade, uma mistura de dois tipos (C e T), uma condição bastante rara conhecida como heteroplasmia – a coexistência num mesmo indivíduo de mais de um tipo de DNAmt. Alguns anos depois, as dúvidas de todos (exceto as dos mais ferrenhos adeptos de teorias conspiratórias) foram finalmente resolvidas. O governo russo concordara em romper o sarcófago e proporcionar a Ivanov uma amostra de tecido de Georgij Romanov, irmão do czar. As mitocôndrias do grão-duque apresentavam exatamente a mesma heteroplasmia encontrada nos ossos do fosso em Koptiaki. Agora não havia dúvida de que os ossos eram do czar. Quando Brian Sykes fundou uma empresa para oferecer serviços de identificação genômica, um dos primeiros clientes foi a Sociedade John Clough, cujos membros remontam suas origens a um bretão de mesmo nome que emigrara para Massachusetts em 1635. A sociedade sabia também que certo antepassado de John Clough, Richard, da linhagem galense da família, recebera o título de cavaleiro por feitos numa cruzada à Terra Santa. Mas não havia nenhuma prova histórica que associasse suas famílias àquelas do outro lado do Atlântico. A empresa de Sykes analisou o DNA de cromossomos Y dos Clough de Massachusetts e de um homem que descendia diretamente de sir Richard: eram idênticos – comprovação para o ramo de Massachusetts. Mas nem todos os Clough americanos tiveram a mesma sorte, pois se constatou que membros da sociedade no Alabama e na Carolina do Norte não tinham parentesco nem com sir Richard nem com os Clough de Massachusetts. Um caso recente mereceu várias manchetes devido ao grande interesse histórico do suposto pai. Há muito suspeitava que Thomas Jefferson, terceiro presidente dos Estados Unidos e principal autor da Declaração de Independência, fora mais do que um dos pais fundadores da nação, pois teria tido um ou mais filhos com sua escrava, Sally Hemings. 6 A primeira acusação data de 1802, apenas doze anos após o nascimento de um menino, Tom, que adotaria o sobrenome de um de seus donos subseqüentes, Woodson. Além disso, uma forte semelhança com Jefferson havia sido notada no último filho de Hemings, Eston. Mas era o DNA que estava fadado a resolver a questão. Thomas Jefferson não deixou descendentes homens legítimos, de modo que era impossível determinar os marcadores do seu cromossomo Y. Em vez disso, os pesquisadores obtiveram amostras do DNA dos descendentes masculinos do seutio paterno, Field Jefferson (cujo cromossomo Y teria sido idêntico ao do presidente), e as compararam com amostras dos descendentes masculinos de Tom Woodson e Eston Hemings. Os resultados identificaram uma inconfundível impressão jeffersoniana no cromossomo Y, mas a impressão genômica não estava presente nos descendentes de Tom Woodson. A reputação de Jefferson conseguiu escapar ilesa dessa bala. Todavia, nos descendentes de Eston Hemings, a assinatura jeffersoniana no cromossomo Y estava clara e distinta. O que o DNA não pode confirmar sem razoável sombra de dúvida é a origem desse cromossomo. Não podemos dizer com certeza se o pai de Eston foi realmente Thomas Jefferson ou se algum outro homem da linhagem jeffersoniana teve acesso a Sally Hemings. 3 DNA fingerprinting: DNA fingerprinting ou “identificação genômica” [literalmente, “datiloscopia do DNA”], como é chamada a técnica que salvou Marvin Anderson de uma prisão perpétua indevida, foi uma descoberta acidental de um geneticista britânico, Alec Jeffreys. Desde o início da revolução instaurada pela tecnologia do DNA recombinante, Jeffreys se interessara pelas diferenças genéticas entre as espécies. Suas pesquisas na Universidade de Leicester se concentraram no gene da mioglobina, que produz uma proteína semelhante à hemoglobina, encontrada principalmente em tecido muscular. Foi durante essa “dissecação molecular” que ele constatou algo muito estranho; um pequeno trecho de DNA que se repetia continuamente. Um fenômeno similar havia sido observado em 1980 por Ray White e Arlene Wyman, que, ao examinarem outro gene, constataram que o número dessas repetições variava de indivíduo para indivíduo. Jeffreys concluiu que faziam parte do DNA-lixo, por não participarem de codificação de proteínas, mas logo verificou que esse lixo em particular poderia ser muito bem aproveitado. Jeffreys constatou que esse curto trecho de DNA repetitivo aparecia não apenas no gene da mioglobina, mas espalhado por todo o genoma. E, embora os trechos variassem 7 um pouco de uma repetição para outra, todos tinham em comum uma seqüência curta, praticamente idêntica, de cerca de quinze nucleotídeos. Ele decidiu usar essa seqüência como uma “sonda”: utilizando uma amostra purificada da seqüência, marcada com uma molécula radioativa, pôs-se a “caçar” a seqüência por todo o genoma. O DNA do genoma é espalhado numa folha de náilon especial e, por emparelhamento das bases, a sonda irá grudar na sua seqüência complementar sempre que a encontrar. Usando um filme de raios X sob a folha de náilon, Jeffreys pôde registrar o padrão desses pontos radioativos. Quando revelou o filme desse experimento, ficou pasmo com o que viu. Embora a sonda houvesse detectado muitas seqüências similares em inúmeras amostras de DNA, ainda restava tanta variação entre uma amostra e as demais que, mesmo naquelas extraídas de membros da mesma família, era possível distinguir um indivíduo do outro. Como disse no artigo que escreveu a respeito para a revista Nature em 1985, o “perfil nos fornece uma fingerprint [impressão digital] específica de cada indivíduo”. O nome identificação genômica, ou DNA fingerprinting, é pertinente, pois essa tecnologia tem a capacidade de identificar indivíduos por meio da sua “impressão” – impressão digital na datiloscopia tradicional, uma impressão genômica no caso do DNA fingerprinting. Jeffreys e seus colegas extraíram amostras de DNA do próprio sangue e as submeteram ao mesmo procedimento. Conforme esperado, as imagens estampadas no filme de raios X permitiram distinguir, sem ambigüidade, cada um deles. Jeffreys percebeu que havia um amplo espectro de utilidades possíveis. Hoje, as “repetições curtas enfileiradas” (STRs = short tandem repeats) substituíram os polimorfismos do comprimento dos fragmentos de restrição (RFLPs = restriction fragment length polymorphism) como o principal método de identificação genômica. As STRs, cujas seqüências de duas a quatro bases podem se repetir até dezessete vezes, são segmentos comumente amplificados pela reação em cadeia da polimerase. Os loci STR selecionados têm alelos muito menores, entre 100 e 400 pares de base (pb). Por exemplo, a D7S820 é uma região do cromossomo 7 onde a seqüência AGAT pode ocorrer entre sete e quatorze vezes. No entanto, a DNA polimerase não é muito eficiente em copiar esses trechos repetidos de DNA – seu sistema de contagem não é muito preciso –, de modo que há um grande número de mutações nas cópias que ela faz da seqüência AGAT na posição D7S820 (a DNA polimerase de procariotos não apresenta unidades de verificação como as de eucariotos). Em outras palavras, há muita variação no número de cópias de AGAT em cada 8 ser humano. Como possuímos duas cópias do cromossomo 7 (uma de nosso pai, outra de nossa mãe), costumamos ter um número diferente de repetições AGAT em cada uma – digamos, oito em uma das cópias e onze na outra –, mas isso não significa dizer que um indivíduo não possa ser homozigótico para um determinado número de repetições (e.g., onze e onze). Se realizarmos uma análise de identificação genômica numa amostra de sangue encontrada na cena de crime e constatarmos que ela corresponde às características do suspeito na região D7S820 (digamos, oito e onze repetições), haverá um indício, mas não uma prova conclusiva da sua culpabilidade – afinal, muitas outras pessoas também têm um genótipo 8/11 na região D7S820. Portanto, é necessário examinar diversas regiões; quanto maior o número de regiões em que o DNA da cena de crime corresponder às do suspeito, maior a probabilidade de ele ser culpadas e mais remotas as chances de o DNA encontrado no local de crime ter vindo de outra pessoa. No sistema do FBI, a identificação genômica se faz mediante análise de doze regiões, mais um marcador que determina o sexo do indivíduo de quem a amostra de DNA foi retirada. 4 Reação em cadeia da polimerase (amplificação de DNA in vitro): Ela é para os genes aquilo que o sistema de impressão de Gutenberg foi para a palavra escrita. A técnica de reação em cadeia da polimerase [Polymerase Chain Reaction (PCR)] pode amplificar uma seqüência desejada de DNA de fita simples ou dupla de qualquer origem (DNA genômico, DNA viral, seqüências clones, lisados de células, DNA bacteriano, DNA de planta, ou DNA antigo, por exemplo) centenas de milhões de vezes em questão de horas, uma tarefa que teria exigido muitos dias com a tecnologia recombinante. A técnica de PCR é especialmente valiosa porque a reação é altamente específica, facilmente automatizada, e capaz de amplificar diminutas quantidades de amostra. Por estas razões, a PCR também tem proporcionado um grande impacto na medicina clínica, no diagnóstico de doenças genéticas, na ciência forense, e na biologia evolucionária. A PCR é um processo baseado em uma enzima polimerase especializada, que pode sintetizar uma fita complementar para uma dada fita de DNA, utilizando uma mistura contendo a seqüência alvo, as 4 bases do DNA, 2 fragmentos (primers, cada qual com cerca de 20 bases de comprimento), e geralmente 10 mM de tampão Tris-HCl, 50 mM de KCl para conferir força iônica, e Mg+2 como um co-fator (concentrações ótimas de Mg+2 podem ter que ser determinadas para cada reação). 9 A reação em cadeia da polimerase foi originalmente descrita em 1986 e desde então tem se tornado uma das técnicas mais freqüentemente utilizadas e largamente aplicadas na biologia celular. Em sua forma mais simples, dois oligodesoxiribonucleotídeos (oligos) são utilizados para selecionar uma seqüência alvo específica de uma mistura de moléculas de DNA e atuar como primers paraa extensão do DNA utilizando o DNA alvo como molde. Figura 1: Esquema da amplificação de DNA pela reação em cadeia da polimerase: A reação em cadeia da polimerase é um processo ao mesmo tempo requintado e simples. Por meio de métodos químicos, sintetizamos dois primers – pequenos trechos de uma única fita de DNA, normalmente com vinte pares de bases de comprimento – cuja seqüência corresponde às regiões que margeiam o segmento de DNA em que estamos interessados. Os primers, que delimitam o gene desejado, são adicionados ao molde de DNA, que foi extraído de uma amostra de tecido e que essencialmente contém o genoma inteiro. Quando o DNA é aquecido a 95 °C ± 1°C, as duas fitas se separam. Isso permite que cada primer se ligue aos fragmentos de vinte pares de bases do molde cujas seqüências sejam complementares às suas. A Tm (temperatura na qual metade das moléculas está na forma de 10 fita dupla e metade na forma de fita simples) é freqüentemente utilizada para a temperatura de acoplamento e então ajustada para cima ou para baixo se necessário [se o primer tem 18 bases de comprimento ou menos, a Tm pode ser estimada pela seguinte fórmula: Tm = 4 °C (número de pares de base GC) + 2 °C (número de pares de base AT)]. Desse modo, formamos duas pequenas ilhas, com vinte pares de bases de DNA de dupla fita, ao longo das fitas simples do molde de DNA. A DNA polimerase – a enzima que copia DNA incorporando novos pares de bases em posições complementares ao longo de uma fita de DNA – só funcionará a partir do ponto em que o DNA já for de fita dupla. Portanto, a DNA polimerase passa a atuar na ilha de fita dupla criada pela união do primer com a região complementar do molde quando a temperatura é baixada para 72 °C. A polimerase faz uma cópia complementar do molde de DNA a partir de cada primer, copiando assim a região-alvo. No final do processo, a quantidade total do DNA-alvo terá dobrado. Em seguida, repetimos a etapa de aquecimento e o processo todo ocorre novamente. E, mais uma vez, dobra-se o número de cópias do DNA delimitado pelos dois primers. Cada ciclo do processo resulta na duplicação da região visada. Após 25 ciclos da reação em cadeia da polimerase – ou seja, em menos de duas horas –, nosso DNA-alvo terá sido amplificado 225 vezes (cerca de 34 milhões de vezes). Com isso, a solução resultante, que começou como uma mistura de molde de DNA, primers, enzimas DNA polimerase e As, Ts, Gs e Cs livres, terá se tornado uma solução concentrada da região- alvo do DNA. Um grave problema inicial da reação em cadeia da polimerase é que a DNA polimerase, a enzima responsável pela multiplicação, é destruída a 95 °C. Portanto, torna-se necessário obter enzimas novas em cada um dos 25 ciclos do processo. A polimerase é cara, de modo que logo ficou evidente que a sua reação em cadeia, por maior que fosse o potencial, não seria uma ferramenta economicamente viável se significasse “transformar em fumaça” enormes quantidades do material. Mas a natureza acabou dando uma mãozinha. Muitos organismos vivem em temperaturas muito superiores aos 37 °C ideais para a E. coli, a fonte original da enzima; as proteínas dessas criaturas, incluindo enzimas como a DNA polimerase, foram se adaptando ao longo de milênios de seleção natural para suportar o calor. Hoje, a reação em cadeia da polimerase costuma ser realizada usando uma forma de DNA polimerase derivada da Thermus aquaticus (Taq), uma bactéria que vive nas termas quentes do parque nacional Yellowstone. Embora a Taq apresente taxas baixas de erro, é suficientemente exata para a maioria das aplicações. Se a exatidão for fundamental para o experimento, pode ser necessário utilizar uma polimerase que tenha uma exonuclease 3’-5’ intrínseca, com atividade 11 de verificação, como a polimerase vent. Para a amplificação de seqüências de mais do que 10 kpb, devem ser utilizadas condições de PCR extra-longas (XL PCR), e, por esta razão, torna- se fundamental utilizar uma polimerase com atividade de verificação, porque os erros podem levar a terminação da síntese. Repetidos ciclos de aquecimento e resfriamento multiplicam o DNA alvo exponencialmente, pois cada nova fita dupla se separa para servir de molde para as sínteses subseqüentes. Em aproximadamente 1 hora, 20 ciclos de PCR podem amplificar o alvo por um milhão. A DNA polimerase utilizada no PCR é específica para DNA, mas é possível analisar RNA mensageiros (mRNA) utilizando o método de PCR pela incorporação de uma etapa com uma transcriptase reversa (RT) de forma a converter mRNA em uma fita dupla complementar de DNA; esta técnica é conhecida como RT-PCR. A transcrição reversa e a PCR podem ser realizadas por uma única enzima, rTth, porque ela apresenta tanto atividade de transcriptase reversa como de polimerase. Para alguns experimentos, é necessário e mais eficiente amplificar um número de produtos diferentes simultaneamente em uma única reação, usando diferentes primers. Isto é denominado PCR multiplexado. Para o PCR multiplexado, faz-se necessário otimizar a escolha dos primers1 e as condições da reação de modo a eliminar produtos de amplificação espúrios. A reação em cadeia da polimerase pode ser utilizada para: amplificação de DNA (na identificação e isolamento de uma ou poucas cópias de uma seqüência alvo específica de uma matriz complexa); na manipulação de DNA (os primers de PCR podem ser desenvolvidos para ter um sítio de restrição incorporado à extremidade 5’, desta forma torna-se possível utilizar o PCR para amplificar genes inteiros ou porções de genes para propósitos de engenharia genética); na clonagem de genes com primers degenerados (PCR é utilizada para clonar genes mesmo quando a seqüência exata do gene de interesse não é conhecida, por exemplo, quando a seqüência de um gene é determinada por tradução reversa da seqüência de 1 Há várias considerações no desenvolvimento de primers para PCR. Embora a extremidade 3’ do primer, sobretudo suas duas últimas bases, seja importante para a especificidade e logo deveria ser complementar à seqüência alvo, é possível acoplar seqüências não complementares ao terminal 5’, por exemplo, sítios de enzima de restrição (para facilitar a clonagem dos amplicons de PCR) ou promotores. Os pares GC são mais estáveis do que os pares AT (os pares GC têm três pontes de hidrogênio e os pares AT têm duas), e é preferível ter G’s ou C’s na extremidade 3’ do primer e um conteúdo GC de 45 a 55%. Existem programas de computador que ajudam a desenvolver primers mais eficientes para seqüências conhecidas. Idealmente a temperatura para ambos primers deveria ser a mesma (dentro da fixa de 1 a 2 °C) de maneira que ambos acoplamentos ocorram na mesma temperatura. De forma a prevenir o acoplamento entre primer, que reduziria a eficiência da amplificação, os primers não devem ser complementares entre si ou em relação a cada outro. 12 uma proteína); na recombinação e na mutagênese de sítios específicos; na clonagem de seqüências desconhecidas: Inverse-PCR (IPCR) e Rapid Amplification of cDNA Ends (RACE); no mapeamento genético utilizando PCR; na análise de expressão gênica; no seqüenciamento de DNA; e na análise forense e na análise de DNA antigo (a sensibilidade da PCR e sua habilidade para detectar uma molécula alvo em uma mistura complexa, e o fato de que a PCR é utilizada para amplificar produtos de amostras de DNA não clonáveis – quando o DNA não tem sido purificado ou quando ele é parcialmente degradado – tem feito da PCR uma ferramenta valiosa quando o material inicial é limitado ou de baixa qualidade. Por estas razões, a técnica de PCR tem semostrado especialmente útil na análise de DNA antigo isolado de, por exemplo, espécimes de museu, lâminas, mamutes congelados, ou insetos em âmbar). A técnica de PCR é utilizada na ciência forense pelas mesmas razões que ela é aplicada na análise de DNA antigo. Ela ajuda na produção de material de alta qualidade suficiente para as análises subseqüentes. Por este motivo, a análise de marcadores baseado na técnica de PCR é muito mais rápida do que os métodos antigos, tais como a análise de RFLP, para confrontar amostras (tais como amostras de sangue ou esperma) com indivíduos. A introdução da análise de STR baseada na técnica de PCR expandiu a utilidade de perfil de DNA. Eis os motivos: • O desenvolvimento de PCR melhorou a sensibilidade da análise; • O tempo por análise foi reduzido a menos de 24 horas; • O custo efetivo do método foi amplamente melhorado devido à redução do trabalho necessário; • Loci STR menores permitiram a análise de amostras de DNA degradados, que são freqüentemente encontrados pelos peritos forenses. Isto ocorre porque esses segmentos menores de DNA apresentam mais chances de estarem intactos após degradação do material; • Loci STR podem ser multiplexados juntos utilizando diferentes tipos de pares de primers para amplificar diversos loci em uma reação. A multiplexação foi posteriormente facilitada pelo desenvolvimento de primers marcados que podiam ser analisados em um seqüenciador automático; • A coleta de dados foi automatizada, e a análise de dados foi parcialmente automatizada. 13 5 Seqüenciamento: O outro burro de carga foi o próprio método de seqüenciar DNA. Também aqui, a teoria química subjacente não era nova; o Projeto Genoma Humano usou o mesmo método desenvolvido por Fred Sanger em meados dos anos 1970. A inovação estava na escala, na mecanização do processo de seqüenciamento. Os dois métodos básicos de seqüenciamento, Maxam-Gilbert e Sanger, diferem principalmente na forma que os fragmentos de DNA são produzidos. Ambos os métodos funcionam porque a eletroforese em gel produz separações de elevada resolução de moléculas de DNA; mesmo fragmentos que diferem por apenas um simples nucleotídeo podem ser resolvidos. O seqüenciamento de Maxam-Gilbert (também chamado método de degradação química) utiliza substâncias químicas para quebrar o DNA em regiões de bases específicas, resultando em fragmentos de diferentes tamanhos. Um refinamento do método de Maxam- Gilbert, conhecido como seqüenciamento multiplexado, tornou os pesquisadores capazes de analisarem aproximadamente 40 clones de um único seqüenciamento em gel de DNA. O seqüenciamento de Sanger (também chamado de terminação da cadeia ou método da dideóxi) utiliza um procedimento enzimático para sintetizar cadeias de DNA de comprimentos variáveis por meio de quatro diferentes reações, parando a replicação do DNA nas posições ocupadas por uma das quatro bases, e, portanto, determinando o tamanho dos fragmentos resultantes. Cada tubo de reação de seqüenciamento (T, C, G, e A) no diagrama da figura 2 contém: um molde de DNA, uma seqüência primer, e uma DNA polimerase para iniciar a síntese de uma nova fita de DNA a partir do ponto no qual os primers hibridizam com o molde; quatro trifosfato deoxinucleotídeos (dATP, dTTP, dCTP, e dGTP) para estender a fita de DNA; um trifosfato de deoxinucleotídeo (usando um elemento radioativo ou corante); e um trifosfato de dideoxinucleotídeo, que termina o alongamento da cadeia quando ele é incorporado. O tubo A tem didATP, o tubo C tem didCTP, etc. Por exemplo, no tubo de reação A, a razão de dATP para didATP é ajustada de forma que o tubo tenha uma coleção de fragmentos de DNA com uma didATP incorporada para cada posição de adenina nos fragmentos moldes de DNA. Os fragmentos de tamanhos variados são então separados por eletroforese (1) e as posições dos nucleotídeos analisadas para determinar a seqüência. Os fragmentos são separados com base em seu tamanho, com os fragmentos mais curtos movendo-se mais rapidamente e aparecendo na base do gel. A seqüência é lida da base para o topo (2) (figura 2). 14 Figura 2: Seqüenciamento de DNA pelo método de Sanger: A automação do seqüenciamento começou a ser desenvolvida no laboratório de Lee Hood, no Caltech. Na verdade, o seqüenciamento automatizado nasceu das idéias de Lloyd Smith e Mike Hunkapiller. Quando trabalhava no laboratório de Hood, Hunkapiller procurou Smith para falar sobre um método de seqüenciamento que usava um corante diferente para cada tipo de base. Em princípio, a idéia prometia tornar o processo de Sanger quatro vezes mais eficiente: em vez de quatro reações de seqüenciamento separadas, cada uma numa banda de gel distinta, o código de cores permitiria realizar tudo num único conjunto de reações e obter o resultado numa única banda de gel. Smith mostrou-se inicialmente pessimista, temendo que as quantidades de corantes exigidas pelo método seriam pequenas demais para detectar. Mas, 15 sendo um especialista em aplicações de laser, logo concebeu uma solução usando corantes especiais que ficam fluorescentes sob raios laser. Segundo o método de Sanger, cria-se uma série de fragmentos de DNA, que são selecionados pelo gel de acordo com o tamanho de cada um. Cada fragmento é marcado com o corante fluorescente que corresponde ao seu nucleotídeo dideóxi demarcador de cadeia; desse modo, a cor emitida pelo fragmento identifica qual é a base. Em seguida, um laser rastreia o fundo do gel, ativando a fluorescência, e uma célula fotoelétrica ali colocada detecta a cor emitida por cada pedaço de DNA. Essas informações são alimentadas diretamente num computador, evitando-se assim o extenuante processo de digitar dados que transtornava o seqüenciamento manual. Figura 3: Eletroferograma de uma análise de DNA mitocondrial: 6 Futuro: 6.1 Amplificação de quantidade traço de DNA: Com os métodos antigos, anteriormente descritos, se necessitava tipicamente de 500 ng de material. Por outro lado, com a técnica da reação em cadeia de polimerase, 1 ng ou menos pode ser analisado. Geralmente, a perfil de STR baseado em PCR é sensível a cerca de 250 pg; no entanto, uma concentração de 0.5 a 1.0 ng é geralmente analisada. Para aumentar a sensibilidade de amostras de DNA abaixo deste limiar, podem ser empregados até 34 ciclos. Isto dá um fator de amplificação teórico de 17.179.869.184 e permite analisar amostras que tem somente quantidades traço de DNA tais como superfícies que foram tocadas. Na verdade, é possível amplificar o DNA de uma única célula. A análise de vestígios de DNA em quantidades traço é denominada “low copy number” (LCN). Os relatórios de 16 análise de vestígios de LCN são diferentes dos relatórios de perfil de DNA convencional devido ao aumento da incerteza na origem do DNA e ao aumento de artefatos. 6.2 Banco de dados: Em 1990, o FBI montou uma base de dados de DNA, o Sistema Conjunto de Indexação do DNA [CODIS = Combined DNA Index System], que, em junho de 2002, continha 1.013.746 impressões genômicas. Dessas, 977.895 eram de criminosos condenados e 35.851 provenientes de amostras obtidas no local de crimes não resolvidos. Desde a sua criação, o CODIS já efetuou 4.500 identificações que não teriam sido possíveis de outra maneira. Uma das principais justificativas para uma base de dados nacional é o potencial de se fazer cold hits – identificações a partir exclusivamente de dados já cadastrados. Suponha que investigadores encontrem um pouco de DNA – sangue numa janela quebrada, sêmen numa peça íntima – no local de um crime e determinem a impressãogenômica dessa amostra. Suponha agora que eles não tenham obtido nenhum outro tipo de pista convencional. Porém, quando a impressão genômica é cadastrada no CODIS, o sistema acusa uma correspondência. Foi o que aconteceu em Saint Louis em 1996. A polícia investigava o estupro de duas jovens em regiões opostas da cidade e, embora as duas amostras de sêmen analisadas pelo método dos RFLPs mostrassem que o mesmo homem cometera ambos os crimes, não tinha sido possível identificar um suspeito. Três anos depois, as amostras foram re-analisadas usando as STRs e os resultados comparados com as impressões cadastradas no CODIS. Com isso, se encontrou o estuprador em 2001, certo Dominic Moore, cuja impressão genômica fora cadastrada no CODIS ao confessar três outros estupros em 1999. O intervalo entre o crime e o cold hit pode ser ainda mais impressionante; alguns malfeitores devem ter levado um choque ao se depararem com o j’accuse molecular de vítimas há muito tempo enterradas. Na Grã-Bretanha, Marion Crofts, de catorze anos, foi estuprada e assassinada em 1981, muito antes de as técnicas de identificação genômica entrarem em uso. Felizmente, algumas provas materiais foram preservadas, tornando possível estabelecer uma impressão genômica em 1999. Mas as autoridades e a família pesarosa de Crofts acabaram desapontadas mais uma vez, ao serem informadas agora de que não havia impressão correspondente na Base Nacional de Dados de DNA do Reino Unido. Dois anos depois, em abril de 2001, Tony Jasinskyj foi preso por atacar sua esposa e uma amostra de 17 DNA foi extraída dele como procedimento de rotina. Após ser inserida na base de dados, a correspondência veio à tona; Jasinskyj era o estuprador desconhecido de vinte anos antes. Assim, os períodos de prescrição visam a impedir erros judiciários. O DNA, entretanto, é uma testemunha de outra ordem. Amostras armazenadas em condições apropriadas permanecem estáveis por muitos anos, enquanto as impressões genômicas nunca perdem seu poder incriminativo. O Departamento de Defesa Americano instituiu o Armed Forces Repository of Specimen Samples for Identification of Remains [Repositório das Forças Armadas para Amostras de Espécimes para Identificação de Restos Mortais]. Desde então, amostras de sangue e de DNA são obtidas de todos os novos membros das forças armadas, tanto os da ativa como os reservistas, e em março de 2001 o repositório continha mais de 3 milhões de amostras. 6.2.1 Seleção de loci STR para multiplexação forense: Loci STR consistem de segmentos repetidos de duas a oito bases. Eles são denominados diméricos, triméricos, e assim por diante. Loci diméricos não são utilizados para aplicações forenses devido ao grande número de bandas espúrias que se formam durante a amplificação, as quais são difíceis de interpretar. Loci triméricos, tetraméricos, e pentaméricos são menos sujeitos a este problema. Diversos fatores são considerados na escolha de um loci STR: • Deseja-se um alto nível de variabilidade dentro de um locus de forma que o locus tenha uma baixa probabilidade de coincidência. • O comprimento dos alelos deve estar entre 90 e 500 pb. Tipicamente, quanto maior o peso molecular dos alelos, menor a precisão de sua medida. Alelos menores são menos afetados pela degradação. • Loci podem ser selecionados com base na localização cromossômica para garantir que loci próximos não sejam escolhidos. Na figura 4, há localização de alguns loci comuns. Como um guia rápido para a nomenclatura de localização do locus, aqueles que começam com D5 estão no cromossomo 5. • Robustez e reprodutibilidade de resultados são essenciais. • De forma a facilitar a interpretação, é desejável que os loci não repitam excessivamente. 18 Sistemas multiplexados antigos foram baseados em uns poucos loci STR. O sistema de quatro locus quadruplex foi provavelmente o primeiro a ser largamente utilizado para propósitos forenses. A probabilidade de coincidência era baixa para os padrões modernos, na ordem de 10-4. Em 1996, um sistema de seis locus STR combinado com o teste do sexo da amelogenina foi introduzido. Esse sistema, conhecido como multiplex de segunda geração (SGM) tinha mais loci e incluía os loci complexos HUMD21S11 e HUMFIBRA/FGA, que são altamente polimórficos. A probabilidade de coincidência esperada foi diminuída para aproximadamente 1 em 50 × 106. Sistemas multiplexados com mais loci e maior poder de discriminação estão tornando-se cada vez mais disponíveis. Com base nos exercícios iniciais da European DNA Profiling Group (EDNAP) e nas recomendações da European Network of Forensic Science Institutes (ENFSI) e nos trabalhos da Interpol, quatro sistemas foram definidos como padrão europeu de loci: HUMTHO1, HUMVWFA, HUMD21S11, e HUMFIBRA/FGA. Recentemente, três posteriores loci foram adicionados: HUMD3S1358, HUMD8S1179, e HUMD18S51. Um processo similar ocorreu no Canadá e nos Estados Unidos, onde a padronização foi baseada no sistema Conjunto de Indexação do DNA [CODIS = Combined DNA Index System] de 13 loci. Os 13 loci designados pelo CODIS e os 8 loci (os sete mencionados acima mais a amelogenina) designados pelo ENFSI estão assinalados na figura 4. No momento, há sete loci que são comuns entre os Estados Unidos e a Europa. As posições cromossômicas desses loci também são mostradas na figura 4. Os braços curtos e longos de um cromossomo são designados como p e q, respectivamente. Note que no sistema CODIS, há dois loci no cromossomo 5. 6.2.2 Nomenclatura do locus STR: Diferentes classes de loci STR têm sido definidas. Urquhart et al classificou os diferentes loci de acordo com a complexidade de suas seqüências. Um dos mais ubíquos loci STR usados é o HUMTHO1. Ele consiste de uma seqüência de repetição simples (TCAT)5-11 com um alelo não consensual (TCAT)4CAT(TCAT)5. Loci STR compostos, tais como HUMVWFA31, consistem de seqüências repetidas (ATCT)2(GTCT)3-4(ATCT)9-13, enquanto que repetições complexas tais como HUMD21S11 são menos uniformes. Informações detalhadas podem ser obtidas do STRBase. 19 Figura 4: Perfis de STR de dois diferentes indivíduos: 20 Figura 5: Tabela de loci utilizados em determinados métodos multiplexados: 21 Figura 6: Análise de STR de um indivíduo homem. 22 Figura 7: Análise de STR de um indivíduo mulher: 6.3 Patentes: Hunkapiller deixou o laboratório de Hood em 1983 e foi trabalhar para a Applied Biosystems, Inc. (ABI), uma fabricante de instrumentos que acabara de ser fundada e que produziria a primeira máquina de seqüenciamento Smith-Hunkapiller. Desde então, a eficiência do processo aumentou imensamente: os géis (lentos e difíceis de manusear) foram descartados e substituídos por sistemas capilares de grande vazão – finíssimos tubos nos quais os fragmentos de DNA são separados em alta velocidade de acordo com o tamanho. Hoje, a última geração de seqüenciadores da ABI é de uma rapidez descomunal, sendo alguns milhares de vezes mais ágeis do que o próprio protótipo. Com um mínimo de intervenção humana (cerca de quinze minutos a cada 24 horas), essas máquinas conseguem seqüenciar até meio milhão de pares de bases por dia. Estes loci estão incluídos no sistema multiplexado comercial fabricado pela PE Applied Biosystems, Promega Corporation, e outros. 23 7 Bibliografia Consultada: WATSON, James D. DNA: o segredo da vida. São Paulo: Companhia das Letras, 2005. U.S. DEPARTMENT OF ENERGY. DOE Human Genome Program: primer on molecular genetics. Washington: Office of Health and Environmental Research, 1992. BUCKLETON,John; TRIGGS, Cristopher M. Forensic DNA Evidence Interpretation. Wasshington: CRC Press, 2005. CREIGHTON, Thomas E. Encyclopedia of Molecular Biology. Nova Iorque: John Wiley & Sons, Inc., 1999.
Compartilhar