Engenharia Genética - P6 semanal (1)

•

UFSCAR

Cláudia Reginato da Silva

14/10/2020

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Engenharia Genética

377 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

P4 Semanal - ENGENHARIA GENÉTICA

MÉTODOS DE SEQUENCIAMENTO DE ÁCIDOS NUCLEICOS E GENOMAS

Desde a descoberta da dupla fita de DNA, surgiram diversas ciências dedicadas a estudar essa molécula,
como a genética e a biologia molecular. Para que estudos fossem feitos com o objetivo de compreender o
funcionamento de uma célula, e entender como seu material genético era capaz de determinar ou
expressar um caractere, foram desenvolvidas algumas técnicas. Dentre elas, pode-se citar o
SEQUENCIAMENTO GENÉTICO.
 SEQUENCIAMENTO DE DNA = consiste em métodos químicos ou enzimáticos para identificar e
determinar a sequência das bases nitrogenadas no DNA. Essa técnica é usada, principalmente, para
conhecer a sequência de bases nitrogenadas correspondente a um gene.

Já sabemos que não adianta nada eu saber a sequência de um DNA de um ser vivo se eu não sei o
que é gene e o que não é, como aconteceu em 2001, com a publicação do Genoma Humano. Muitos
acreditaram que, logo em seguida, já seria possível obter respostas para perguntas mirabolantes,
mas conhecer a sequência não significa conhecer o que é transcrito e o que é expresso, ou seja,
conhecer a sequencia de bases não significa nada.
Apenas para recordar, nossa sequência de DNA é constituída de bases que FAZEM PARTE DE UM
GENE, e bases que NÃO FAZEM PARTE DE UM GENE. As bases que constituem o gene são as
que irão determinar a produção de determinada proteína ao fim da tradução, e são, na maioria das
vezes, as bases de interesse em um sequenciamento. Saber a sequencia, mas não saber quais
regiões serão traduzidas em proteínas não resolve muita coisa.

O primeiro método de sequenciamento de DNA surgiu em meados dos anos 70 e ficou conhecido como
método Maxam–Gilbert, método amplamente aplicável na época. Alguns anos depois, em 1977, Frederick
Sanger propõe um método diferente e mais eficiente chamado de MÉTODO ENZIMÁTICO ou MÉTODO
DE SANGER. Esse método logo se tornou altamente replicável, e pode ser utilizado até os dias de hoje,
apesar de existirem técnicas mais modernas para isso.

1) MÉTODOS DE SEQUENCIAMENTO
Existem basicamente dois métodos amplamente conhecidos: o método de Sanger (também chamado de
“sequenciamento clássico” ou “método dideoxi”) e o método Next Generation (também chamado de
“sequenciamento de nova geração”), e são sobre esses métodos que iremos comentar.

a) Sanger manual
O método de Sanger, tanto o manual quanto o automático, foi muito importante para o estudo de genes,
identificação de indivíduos, estudos comparativos, etc. Para entender este método, vamos recapitular
como o DNA é formado.
O DNA é uma molécula formada por uma dupla fita de nucleotídeos. Cada nucleotídeo é composto por um
açúcar, um grupo fosfato e uma base nitrogenada. No sequenciamento, são essas bases nitrogenadas
que são lidas. As bases podem ser de 4 tipos: Adenina, Timina, Citosina e Guanina. As bases A ligam-se
a bases T na fita complementar, e as bases C ligam-se a bases G na fita complementar.
Quando vamos fazer uma reação PCR, por exemplo, o
que nós fazemos é, basicamente, simular in vitro a
replicação que acontece naturalmente no meio celular,
como já foi visto na prova passada. Para isso, é
necessário adicionar no meio: amostra de DNA, dNTPs
(dATP, dTTP, dCTP, dGTP), primers, etc... O que eu
quero chamar a atenção aqui são os dNTPs, também
chamados de desoxirribonucleotídeos trifosfatos, que
nada mais são do que nucleotídeos ligados a 3 fosfatos. Esses nucleotídeos, na reação de PCR, simulam
os nucleotídeos naturais da célula, e são essenciais para que a polimerização da fita complementar
ocorra. O açúcar do dNTP é idêntico ao açúcar do nucleotídeo encontrado na célula, e portanto, a reação
de amplificação é bem sucedida.
Baseando-se nesse dNTP, Sanger criou os chamados ddNTPs (didesoxiribonucleotídeos), que variam de
acordo com a base nitrogenada (ddATP, ddTTP, ddCTP, ddGTP). Os ddNTPs diferem dos dNTPs pela
ausência da hidroxila (OH) livre no carbono 3’ da pentose. Relembrando o que foi visto em Biologia
Método Old School
Método de Maxam-Gilbert (ou
método de degradação química): se
baseava na clivagem química do DNA
Método de Sanger (ou método dideoxi):
baseia-se na terminação controlada da
replicação. É dividido no método
MANUAL e AUTOMÁTICO
Método de Nova
Geração (NGS)
Método Illuminna, PACbio, etc
Molecular, a replicação e a transcrição sempre acontece no sentido 5’ para o 3’. Isso porque é o OH do
carbono 3’ que realiza o ATAQUE NUCLEOFÍLICO sobre o grupo fosfato, e promove a formação da
ligação fosfodiéster entre os nucleotídeos. Se não houver um OH livre no carbono 3’, a ligação fosfodiéster
não é estabelecida, e o alongamento da cadeia é interrompido. Desse modo, Sanger elaborou uma
molécula ddNTP que, por não ter um OH livre, não é capaz de estabelecer uma ligação com o próximo
nucleotídeo.
Com isso, na reação de sequenciamento, quando um ddNTP era aleatoriamente adicionado a uma cadeia,
a replicação da cadeia era interrompida. Assim foi possível obter fitas do mesmo DNA com número de
resíduos diferentes. Assim, Sanger, descobriu que se conseguisse interromper a replicação de um mesmo
DNA em pontos diferentes, ele poderia juntar essas fitas menores e formar a sequência completa do DNA.
ddNTP = terminadores da síntese de DNA

A reação de sequenciamento de Sanger é realizada em 4 tubos. Os materiais colocados nos tubos são
bem semelhantes ao do PCR, visto que aqui a intenção também é promover a replicação, mas ao invés de
ocorrer a síntese de uma fita complementar completa, o objetivo aqui é promover e interromper a
replicação em pontos aleatórios.
No PCR, precisamos de uma amostra de DNA, primers, dNTPs (dATP, dTTP, dCTP, dGTP), enzima DNA
Polimerase, tampão da enzima e Mg2+ (MgCl2 ou MgSO4). Já na reação de sequenciamento, EM CADA
UM DOS QUATRO TUBOS são adicionados:
 Amostra de DNA
 Primers
 Enzima DNA Polimerase
 Solução tampão
 dNTPs dos quatro tipos (dATP, dTTP, dCTP, dGTP, tudo misturado no mesmo tubo)
 ddNTP de apenas UM TIPO POR TUBO (ou seja, no primeiro tubo, eu coloco ddATP, no segundo tubo
coloco ddTTP, no terceiro tubo coloco ddCTP, e no quarto eu coloco ddGTP). EM CADA TUBO, SEMPRE
HÁ MAIS dNTP do que ddNTP! (os nucleotídeos normais são colocadas em maior quantidade e os
ddNTPs em menor quantidade, SEMPRE).
 Para possibilitar a leitura ao fim da reação, é necessário marcar radioativamente ou o primeiro
nucleotídeo do primer, ou os ddNTPs adicionados na reação com P32 ou S35. Após incorporação na
cadeia de DNA, estes átomos marcados emitem radiação que é utilizada para impressão de uma
chapa radiográfica, permitido visualizar os fragmentos amplificados.
Dentro de cada tubo, ocorre uma reação de amplificação (PCR em termociclador), ou seja, primeiro ocorre
a desnaturação das fitas (cerca de 95ºC), depois o anelamento de primers (que vão indicar a região que
eu quero sequenciar) (cerca de 60ºC), e por fim, a polimerização da fita complementar (cerca de 72ºC). A
DNA polimerase então começa a sintetizar a nova cadeia a partir do primer, adicionando os dNTPs
normalmente, e assim por diante. Em determinado momento, no entanto, a DNA polimerase ao invés de
incorporar um dNTP na cadeia, como havia fazendo, ela incorpora um ddNTP, que por não ter um OH
livre no carbono 3’, interrompe a síntese. Esse processo é repetido em vários ciclos, garantindo que
haja, ao fim da reação, fragmentos de todos os tamanhos possíveis, com um ddNTP contido em todas as
posições do DNA molde.
A chance dos dNTP ou dos ddNTP serem incorporados numa determinada posição da cadeia de DNA é a
mesma, uma vez que a DNA polimerase não consegue distinguir estes dois nucleotídeos pelo fato da
diferença entre eles ser apenas a ausência do grupo OH na posição 3´. Se pensarmos que existem, na
mistura, muitas moléculas domesmo DNA molde, compreenderemos que todas as posições do DNA
molde, em algum momento, terá um ddNTP complementar. Assim, teremos amplicons (produto da PCR)
terminando em diferentes posições do DNA molde, produzindo um conjunto de fragmentos
complementares ao DNA molde com tamanhos variados, sendo o tamanho de cada fragmento dependente
da posição onde o ddNTP terminador foi adicionado.
 Ou seja: se um dNTP é adicionado, a síntese da cadeia de DNA continua, pois haverá a presença
de uma hidroxila livre na posição 3´, onde deverá ser ligado o próximo desoxinucleotídeo. Se um
ddNTP for adicionado, a síntese será interrompida neste ponto (por isso este método é também
conhecido como “terminador de cadeia” ou “didesoxi”).

Para a leitura da sequencia, o produto obtido em cada um dos 4 tubos é aplicado em canaletas diferentes,
contendo geralmente gel de poliacrilamida como matriz (como cada tubo corre em canaletas diferentes, há
ao todo, 4 canaletas para leitura). A reação precisa ser feita em 4 tubos diferentes para que, ao analisar as
bandas, eu saiba se o ddNTP adicionado é um A, T, C ou G, já que em cada canaleta, apenas um tipo
desses ddNTPs será encontrado. Devido ao alto poder de resolução (separação dos fragmentos) deste
gel, é possível separar os fragmentos por tamanho (eletroforese). Os fragmentos menores ficaram mais
em baixo (porque correram mais) e os maiores mais em cima (porque correram menos).
As bandas produzidas são visualizadas numa chapa radiográfica (raio-X),
e o resultado da eletroforese torna-se conhecido através de um
autorradiograma. A análise da ordem das bandas na chapa radiográfica
começa pelo final do gel, permitindo determinar a sequencia de
nucleotídeos da fita de DNA recém- sintetizada (leitura é feita de baixo
para cima). O analista, então, ia lendo e anotando, passo a passo.
Esta técnica permitiu inicialmente separar de 200 a 300 nucleotídeos por corrida, sendo considerada uma
revolução na época em que foi descoberta. No entanto, dentre as desvantagens, estava o TEMPO (era
uma técnica muito demorada) e o USO DA RADIOATIVIDADE, prejudicial à saúde humana.

b) Sanger automático
A ciência não para, e está sempre buscando melhorar as mais variadas técnicas. Não foi diferente com o
método de Sanger. Classificada como manual por não utilizar o computador em nenhuma de suas etapas,
esta metodologia foi aperfeiçoada por Leroy Hood, originando o método SANGER AUTOMÁTICO. O
princípio do método proposto por Sanger permaneceu o mesmo. No entanto, a técnica foi aprimorada
ficando mais simples, mais rápida e mais segura, por não utilizar compostos radioativos prejudiciais a
saúde humana (a revelação ficou automatizada).
A principal modificação foi a adição de corantes nos ddNTPs, capazes de emitir fluorescência quando
excitados. Cada um dos ddNTPs foi marcado com uma cor específica: o ddATP foi marcado de verde; o
ddTTP de vermelho; o ddCTP de azul, o ddGTP de amarelo (não tenho certeza se foram essas cores, mas
segue o baile). O método utiliza fluoróforos diferentes para cada um dos quatro tipos de ddNTP, que ao
serem excitados, emitem luz característica do ddNTP incorporado.
 Fluoróforos: corantes especiais, que emitem luz ao serem atravessados por feixe de raios laser.
Os materiais necessários para a realização do Sanger automático são os mesmos: a única diferença é
que, ao invés de eu dividir a reação em 4 tubos, todos os ddNTPs (ddATP, ddTTP, ddCTP e ddGTP) são
colocados em um ÚNICO TUBO devido à marcação com o corante. Desse modo, as quatro reações
passam a ocorrer em um único tubo, e seu conteúdo podia agora ser aplicado em uma única canaleta do
gel, otimizando o numero de amostras analisadas.

Nos anos 90, os géis (de difícil manuseio) foram substituídos por finíssimos capilares preenchidos com gel
onde os fragmentos de DNA são separados em altíssima velocidade. Nesse caso, após as reações de
sequenciamento (amplificação interrompida via PCR), as amostras são aplicadas, através de um sistema
de eletroinjeção, diretamente nos capilares.
Após a eletroinjeção, os fragmentos começam a migrar e encontram, num determinado
ponto, um feixe de raios laser que excita os fluoróforos presentes na extremidade 3´ de
cada fragmento, fazendo com que estes emitam fluorescência característica de um dos
quatro tipos de fluoróforos.
Um detector registra esta fluorescência e a transmite para um computador que
possui um software capaz de converter fluorescência em picos coloridos,
sendo utilizado uma única cor para cada um dos quatro tipos de nucleotídeos.
Este procedimento é efetuado para cada fragmento no gel. No final do
processo, o software gera um cromatograma (ou eletroferograma) que corresponde a sequencia de DNA
complementar ao DNA molde utilizado.
Apenas para retomar o principio do sequenciamento: no Sanger automático, a amostra de DNA, os
primers, a DNA polimerase, a solução tampão, todos os dNTPs e todos os ddNTPSs são colocados em
um único tubo de reação. Ao longo da reação, fitas complementares ao DNA molde vão sendo sintetizadas
a partir da incorporação de dNTPs. No entanto, quando um ddNTP é incorporado, a amplificação é
interrompida e a fita para de crescer. Como várias fitas são construídas, em cada fita o ddNTP pode estar
incorporado em um lugar diferente. Ao correr as fitas nos capilares, as fitas menores correm mais, e as
fitas maiores correm menos. Como os ddNTPs de A, T, C e G tem cores diferentes, é possível identificar
quais os nucleotídeos de terminação, e a partir de uma câmera CCV, que lê os comprimentos de onda
emitidos pelos corantes, a informação é enviada a um software para que ele elabore um cromatograma
(também chamado eletroferograma).
Dentre as vantagens desse método, podemos citar: menor custo, maior segurança devido a não utilização
de radioatividade na revelação (aqui, é usada a fluorescência), e é um método mais rápido. A técnica
permite sequenciar cerca de 300 bases (tem lugar que fala que sequencia até 300, outros de 300 a 500).
O problema é que ela não permite sequenciar genomas inteiros.
 Monalisa disse que a concentração de ddNTP é igual a de dNTP nesse método, mas não sei.

Após a desnaturação da dupla
fita, ddNTP marcados com
compostos florescentes são
incorporados à cadeia de DNA
sintetizada pela DNA polimerase.
Através de um sistema de
eletroinjeção, os fragmentos de
DNA recém sintetizados come-
çam a migrar e encontram, num
determinado ponto, um feixe de
raios laser que excita os
fluoróforos fazendo com que
estes emitam fluorescência
característica de um dos quatro
tipos de nucleotídeos. Um
detector registra a intensidade e
comprimento de onda desta
fluorescência e a transmite a um
computador que possui um
software capaz de converter
fluorescência em um cromatogra-
ma, que são decodificados na
sequencia de nucleotídeos do
fragmento.
DISCUSSÃO EM AULA: pelo método Sanger, eu consigo sequenciar um gene? NÃO! Um gene eucarioto
tem, em média, 3000 pares de bases, e o método de Sanger sempre sequencia de 300 a 500 pares de
bases. O que pode acontecer é: na sequencia obtida pelo Sanger, eu posso ter um fragmento de algum
gene, ou fragmentos de 2 genes. SE EU QUISER SEQUENCIAR um genoma eucariótico completo, isso é
possível, mas é necessário utilizar técnicas de shotgun e sobreposição de sequências (reads). Com isso,
consigo montar meu assembly (assembly é o ato de juntar pequenos fragmentos sequenciados; é a utlima
figura abaixo), e por fim montar o meu contig (contig é a sequencia contínua do DNA que eu sequenciei). A
sequência completa do meu genoma consiste na união de vários contigs. (arquivo do SHOTGUN em anexo)

DISCUSSÃO EM AULA (II): como eu identifico um gene? Eu posso fazer isso de três formas,
principalmente:  Alinhando meu contig a um banco de dados
 Identificando regiões promotorasno próprio DNA, ou seja, regiões que antecedem um
gene (ex: TATA box)
 Eu posso fazer um knockout para verificar se aquela sequência é, realmente,
responsável pela expressão daquela característica. Knockout é uma técnica que consiste
em bloquear a expressão de um gene específico (gene sofre deleção ou inativação).

c) Método de Nova Geração (NGS – Next Generation Sequencing)
Após a publicação do genoma humano houve um avanço nas tecnologias de sequenciamento culminando
no surgimento dos “sequenciadores de segunda geração” ou “sequenciadores de nova geração”. Os
sequenciadores de Nova Geração permitiram uma ampla aplicação do uso das sequências. Eles
permitiram o sequenciamento do genoma COMPLETO, permitiram o uso da técnica de RNA-seq (que
permite o estudo da expressão gênica em situações adversas, como o estresse), metagenômica, analise
de variantes (SNPs – polimorfismo de nucleotídeo único - e INDEL – inserção e deleção de bases),
sequenciamento de uma única célula, etc.
O método NGS é mais rápido, demanda menor custo e possui maior capacidade de leitura (com
capacidade de sequenciar genomas rapidamente). Nesse método, as sequencias fornecidas são mais
curtas, mas MUITAS sequências são lidas por rodada, acelerando o processo.
Existem vários equipamentos NGS, como Illumina, Ion torrent, etc. O Illuminna é capaz de ler 7 GB de
dados de 3 a 7 dias. Já o Ion Torrent é capaz de ler 1 GB de dados em 4h30, ou seja, é mais rápido, além
de ser barato.

Nessa aula, vamos comentar sobre a tecnologia Illumina. Atualmente, é o padrão-ouro para muitas das
análises de NGS. Utiliza como base o sequenciamento por síntese (SBS). Além do mais, é uma
metodologia extremamente versátil e barata. O princípio desta metodologia é similar ao método proposto
por Sanger, pois temos em ambas a síntese de uma fita complementar ao DNA alvo utilizando DNA
polimerase e nucleotídeos marcados com diferentes fluoróforos. A fluorescência emitida após a
incorporação de cada nucleotídeo é registrada como imagem e no final, através de uma decodificação
destas imagens, tem se a sequencia de interesse.
A técnica se baseia em 3 etapas: preparação de bibliotecas  formação de clusters  sequenciamento 
análise de dados.

 PREPARAÇÃO DE BIBLIOTECAS
Como toda técnica de sequenciamento de segunda geração, é preciso primeiro preparar as bibliotecas
contendo o DNA a ser sequenciado. A preparação da amostra começa com a extração e a purificação do
DNA. Em seguida, o DNA é fragmentado por enzimas de restrição (mas também pode ser fragmentado
por um processo químico ou mecânico). Usam-se enzimas de restrição porque desejamos a formação de
extremidades coesivas, formadas pela clivagem ao redor do eixo de simetria. Ao usar um enzima de
restrição X, eu já sei quais os nucleotídeos existem nas extremidades dos fragmentos.
Apenas para retomar o funcionamento das enzimas de restrição: cada enzima de restrição é capaz de
reconhecer um conjunto de nucleotídeos específico, e clivar essa sequência. Quando falamos de enzimas
do tipo II, o local de clivagem ocorre dentro ou nas extremidades da sequência reconhecida. A clivagem
Um dos problemas do Illumina é que, como ele gera
sequências curtas, o contig é mais difícil de ser
montado quando comparado ao método de Sanger.
Basta imaginar, por exemplo, um quebra cabeças: o
que é mais difícil montar, um quebra cabeça com
peças grandes ou com peças pequenas? As pequenas
são mais difíceis, e o mesmo vale para o Illumina.
Esses sequenciadores, então, precisam de um
GENOMA DE REFERÊNCIA, que funciona como a
caixa do quebra cabeça, contendo a figura que deve
ser montada. Se eu não tiver um genoma de
referência, eu posso usar um PSEUDOGENOMA DE
REFERÊNCIA (ex: se eu quero sequenciar a cana,
mas não tenho seu genoma de referência, eu posso
usar a sequência do sorgo como PSEUDOGENOMA).

pode ser no eixo de simetria, formando fragmentos com extremidades “cegas”, ou ao redor do eixo de
simetria, formando fragmentos com extremidade coesiva. O interessante aqui são as extremidades
coesivas. Como eu sei que cada enzima reconhece uma determinada sequência, eu já sei quais
nucleotídeos estão presentes nas extremidades dos fragmentos. Tendo como exemplo a EcoRI da
imagem abaixo, eu sei que ao usar essa enzima de restrição no meu DNA, terei fragmentos com
extremidade CTTAA ou AATTC

Após a fragmentação do DNA, é adicionado um oligonucleotídeo (chamado de “adaptador”) em ambas as
extremidades de cada fragmento (vamos chamar de adaptadores A e B). Os adaptadores têm a função de
imobilizar os fragmentos fita simples, pela hibridização a primers complementares, numa placa de vidro
(flowcell) onde acontecerá todo o processo.

 Diferente do método de Sanger, aqui o sequenciamento e a leitura das sequências acontece tudo
junto, na lâmina de vidro (flowcell). Uma lâmina tem 8 canais, e eu posso colocar de 1 a 12 amostras
por canal (375 MB por canal). Logo, eu teria de 3 a 3,5 GB de bases por lamina em 48 horas.

 FORMAÇÃO DOS CLUSTERS
As moléculas de DNA fita simples são aderidas por afinidade a placas de vidro, onde estão também
aderidos, em alta densidade, oligonucleotídeos complementares aos adaptadores A e B (como mostra a
imagem ao lado). Cada lâmina da flowcell é composta por canais, e
cada canal é revestido por dois tipos de oligonucleotídeos: um
complementar ao adaptador A e outro complementar as adaptador B.
Esses oligonucleotídeos são fixados na placa pela extremidade 5’, deixando a extremidade 3’ livre para
servir de iniciador (primer) para a síntese de cadeia.
O adaptador da extremidade livre liga-se ao primeiro tipo de oligonucleotídeo complementar, adjacente na
placa de vidro. A alta densidade de oligonucleotídeos ligados a flowcell facilita esta ligação. Após a
ligação, ocorre a fixação da fita de DNA na flowcell.

 Clusterização nada mais é do que a amplificação de cada fragmento.
Em seguida, a DNA polimerase cria uma fita complementar ao fragmento de DNA molde fixado na placa
utilizando nucleotídeos NÃO MARCADOS. A dupla fita é, então, desnaturada, e a amostra de DNA original
é removida.

O adaptador da extremidade livre desta fita recém-sintetizada se anela ao segundo tipo oligonucleotídeo
complementar presente no suporte, formando uma estrutura em ponte, que dá nome ao processo de
amplificação (amplificação em ponte). Uma vez fornecidos os reagentes necessários, a DNA polimerase
começa a polimerizar a partir do oligonucleotideo do suporte, estendendo uma fita complementar. Com
isso, uma “ponte de dupla fita” é formada.

Posteriormente ocorre uma elevação de temperatura no suporte sólido. Com isso, essa ponte é
desnaturada, resultando em duas fitas simples, fixadas na flowcell.

Cada uma dessas duas fitas realiza, novamente, a etapa de anelamento, onde suas extremidades livres
vão ao encontro dos oligonucleotídeos complementares no suporte, formando novas estruturas de ponte.
Com a elevação da temperatura, as fitas se separam e, com isso, um novo ciclo de amplificação é iniciado.

Esses ciclos são repetidos 35 vezes e assim as cerca de mil cópias geradas de cada fragmento nessa
PCR de fase sólida permanecem próximas umas das outras, formando um cluster de sequenciamento.
 Cada um desses grupinhos consiste em um conjunto de uma única sequência, ou seja, dentro de
cada um, apenas uma sequencia molde é amplificada. Com isso, no grupinho da esquerda eu tenho
clusters frutos da amplificação do fragmento de DNA X, no grupinho do meio eu tenho clusters frutos
da amplificação do fragmento de DNA Y, etc. Pode acontecer, as vezes, de dois grupinhos
amplificarem o mesmo fragmento.

Depois da “amplificação de ponte” e da desnaturação, as fitas reverse são clivadas e removidas, deixando
apenas as fitas forward..

 SEQUENCIAMENTO
Nessa etapa, paraque ocorra o sequenciamento, é necessário bloquear a extremidade 3’ da fita para
evitar um anelamento indesejado com um oligonucleotídeo do suporte. Em seguida, eu anelo um primer na
fita (na região de “sequencing primer”, da primeira figura), e é a partir desse primer que a cadeia
complementar será sintetizada.
Após os 35 ciclos de sequenciamento, são adicionados, ao longo de toda a extensão da placa, uma
solução contendo os quatro tipos de nucleotídeos (A, T, C, G) terminadores reversíveis, marcados com
fluoróforos. Com isso, durante a polimerização da fita complementar, os nucleotídeos marcados com
fluorescência que sejam complementares à fita molde, são incorporados na cadeia, e depois da
incorporação de cada nucleotídeo, os corantes são clivados para permitir a incorporação da próxima base.
Esse processo de sequenciamento é chamado de “sequenciamento por síntese” (SBS – Sequencing by
Synthesis).
Ao ocorrer a incorporação de um nucleotídeo, a fluorescência é excitada por uma série de lasers , emitindo um
sinal que captado por um dispositivo de leitura. Esse sinal identifica qual tipo de nucleotídeo foi incorporado , e
a intensidade da fluorescência emitida é proporcional ao número de fragmentos dos clusters. O número
elevado de fragmentos nos clusters (mais de 1 milhão) é necessário para produzir intensidade suficiente
que permita detectar com exatidão uma determinada base no sequenciamento. Logo, vários clusters são
sequenciados simultaneamente, o que é uma grande vantagem do método, visto que acelera o processo.
 Cada base é lida à medida que é adicionada à cadeia recém-formada de DNA.

Após a captura das imagens, e após a síntese do primeiro read (fragmento complementar à fita forward), o
read é removido, e inicia-se o próximo ciclo de incorporação. Para isso, a extremidade 3 ’ da fita é
desbloqueada, a fita adquire o formato de ponte novamente com um oligonucleotídeo complementar do tipo 1
aderido no suporte. A polimerase estende uma nova cadeia, formando uma “ponte de dupla fita”. Essa ponte é
então linearizada, e a extremidade 3’ é bloqueada novamente. A fita forward, usada na primeira leitura, é
removida, restando apenas a reverse. O segundo read, então, começa a ser produzido a partir do primer
anelado (na região de “sequencing primer”), e é a partir desse primer que a cadeia complementar será
sintetizada.
Assim como na primeira leitura, os nucleotídeos são incorporados, emitindo um sinal, que é captado por
um dispositivo de leitura. Depois do crescimento do read, o read é removido e o ciclo recomeça. Este
processo se repete até que todas as bases de um determinado fragmento sejam determinadas. O
processo de incorporação de nucleotídeo marcado, excitação e leitura são repetidos para cada
nucleotídeo componente da sequência. Ao final da corrida, prossegue-se com a análise de dados.

 ANÁLISE DE DADOS
Esse processo de sequenciamento gera bilhões de reads, que representam todos os fragmentos do
DNA (fragmentado lá no comecinho). Os fragmentos com regiões similares são agrupados
localmente. Durante o processo, foram formados reads Forward e Reverse, que ao serem pareados,
criam as sequencias contig (lembrando que um genoma inteiro nada mais é do que a união de vários
contigs).
Essas sequências contig são, por fim, alinhadas com base na complementaridade entre suas
extremidades, e de acordo com o genoma de referência. As informações das extremidades de cada
read são importantes para resolver alinhamentos ambíguos.

---------------------
ESQUEMA RESUMIDO: