Prévia do material em texto
344 COMO SABEMOS SEQUENCIANDO O GENOMA HUMANO Quando as técnicas de sequenciamento de DNA se torna- ram totalmente automatizadas, a determinação da ordem dos nucleotídeos em um fragmento de DNA deixou de ser um projeto de tese de doutorado elaborado para ser uma tarefa de rotina de laboratório. Alimentar com DNA a máquina de sequenciamento, adicionar os reagentes necessários e obter o resultado procurado: a ordem dos As, Ts, Gs e Cs. Nada po- deria ser mais simples. Então por que o sequenciamento do genoma humano foi uma tarefa tão formidável? Muito por causa do seu tamanho. Os métodos de sequenciamento de DNA empregados na épo- ca eram limitados pelo tamanho físico do gel utilizado para separar os fragmentos marcados (ver Figura 10-20). Quando muito, apenas algumas centenas de nucleotídeos podiam ser lidas a partir de um único gel. Como, então, você lidaria com um genoma que contém bilhões de pares de nucleotídeos? A solução é romper o genoma em fragmentos e sequen- ciar esses segmentos menores. O principal desafio, então, está na organização dos fragmentos curtos na ordem correta para gerar uma sequência ampla de um cromossomo inteiro e, por fim, todo um genoma. Existem duas estratégias prin- cipais para realizar a quebra e reorganização do genoma: o método aleatório e a abordagem clone por clone. Sequenciamento aleatório (shotgun) A abordagem mais direta para sequenciar o genoma é que- brá-lo em fragmentos aleatórios, separar e sequenciar cada um dos fragmentos de fita simples e então utilizar um com- putador potente para ordenar esses pedaços, usando sobre- posições de sequências (Figura 10-24). Essa abordagem é chamada de “estratégia do sequenciamento aleatório”. Como analogia, imagine despedaçar algumas cópias do Fundamen- tos da Biologia Celular, misturar seus pedaços e então tentar montar uma cópia inteira do livro novamente, combinando as palavras ou frases ou sentenças que aparecem em cada pedaço. (Algumas cópias seriam necessárias para gerar uma sobreposição suficiente para a remontagem.) Isso poderia ser feito, mas seria muito mais fácil se o livro fosse do tamanho de, apenas, vamos dizer, duas páginas. Por essa razão, uma abordagem aleatória direta é a es- tratégia de escolha para sequenciar genomas pequenos. Esse método provou o seu valor em 1995, quando foi utilizado para sequenciar o genoma da bactéria infecciosa Haemophi- lus influenzae, o primeiro organismo a ter determinada a sua sequência genômica completa. O problema com o sequen- ciamento aleatório é que o processo de remontagem pode ficar confuso com sequências repetitivas de nucleotídeos. Embora raras em bactérias, essas sequências fazem parte de uma grande fração dos genomas de vertebrados (ver Figura 9-33). Segmentos de DNA altamente repetitivos tornam difícil reorganizar as sequências de DNA com acuidade (Figura 10- 25). Retornando à analogia com o Fundamentos, apenas este capítulo contém mais do que alguns exemplos do sintagma “o genoma humano”. Imagine que uma tira de papel do Fun- damentos rasgado contenha a informação: “Então por que o sequenciamento do genoma humano” (que aparece no início desta seção); e outra contenha a informação: “o consórcio de sequenciamento do genoma humano combinou o sequencia- mento aleatório com uma abordagem clone por clone” (que aparece a seguir). Você poderia estar tentado a unir esses dois fragmentos com base no sintagma sobreposto “o ge- noma humano”. Entretanto, você concluiria com a sentença sem sentido: “Então por que o consórcio de sequenciamento do genoma humano combinou o sequenciamento aleatório com uma abordagem clone por clone”. Você também perde- ria vários parágrafos de texto importantes que originalmente apareciam entre esses dois exemplos de “o genoma humano”. E isso apenas nesta seção. O sintagma “o genoma huma- no” aparece em vários capítulos deste livro. Essas repetições compõem o problema de colocar cada fragmento no seu con- texto correto. Para evitar esses problemas de organização, os pesquisadores no consórcio de sequenciamento do geno- ma humano combinaram o sequenciamento aleatório com a abordagem clone por clone. Sequenciamento e clone por clone Nessa abordagem, os pesquisadores iniciaram preparando uma biblioteca de DNA genômico. Eles quebraram o genoma huma- no em fragmentos que se sobrepunham, de 100 a 200 pares de quilobases de tamanho. A seguir, ligaram esses segmentos a cromossomos artificiais bacterianos (BACs, de bacterial artifi- cial chromosomes) e os inseriram em E. coli. (BACs são simi- lares aos plasmídeos bacterianos discutidos anteriormente, com exceção de que podem carregar fragmentos de DNA muito maiores.) À medida que as bactérias se dividem, elas copiam os BACs, produzindo, dessa forma, uma coleção de fragmentos clonados que se sobrepõem (ver Figura 10-10). Fragmentação aleatória Sequência de uma fita dos fragmentos GTTCAGCATTG--- ---GCCATTAGTTCA ---GCCATTAGTTCAGCATTG--- Sequência original reconstruída com base na sobreposição das sequência dos fragmentos Múltiplas cópias do genoma Sequências de dois fragmentos Figura 10-24 O sequenciamento aleatório é o método de escolha para sequenciar genomas pequenos. Primeiro, o ge- noma é quebrado em fragmentos menores que se sobrepõem. Cada fragmento é então sequenciado, e o genoma é organizado com base nas sequências que se sobrepõem. Alberts_10.indd 344Alberts_10.indd 344 16/01/2017 10:23:5016/01/2017 10:23:50