Buscar

Aulas 13 Bibliotecas de DNA e Sequenciamento

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

D I S C I P L I N A : B I O L O G I A M O L E C U L A R
S E M E ST R E 2 0 1 7 / 2
Bibliotecas de DNA e 
Sequenciamento
Profa. Mariana Dias Moreira
maridias@ufsj.edu.br
Construção e uso de bibliotecas de DNA 
Recombinante
 Vimos como os genes podem ser clonados em vetores com
a utilização de enzimas de restrição e como eles podem ser
transformados ou transferidos para vários tipos celulares.
E quando o DNA de interesse constitui uma fração
pequena do DNA total????
Como podemos selecionar e identificar apenas um
gene????
Construção e uso de bibliotecas de DNA 
Recombinante
Biblioteca Genômica
O objetivo é produzir uma coleção 
de clones grande o suficiente para 
assegurar a existência de pelo menos 
um clone para cada gene do 
organismo.
Purificação do 
DNA total da 
célula
Processo 
parcial de 
restrição
Fragmentos 
que podem ser 
clonados em 
vetor adequado
Biblioteca Genômica
Essa coleção de clones contendo diferentes fragmentos de DNA é 
chamada de biblioteca de genes; 
Cada “livro” é uma linhagem bacteriana ou de fago que contém um 
fragmento do genoma
Essas bibliotecas são essenciais para a manutenção e a recuperação de
clones;
Podem até mesmo ser adquiridas comercialmente.
Biblioteca Genômica
• Tamanho da biblioteca  determinado pelo
tamanho do fragmento clonado e pelo tamanho do
genoma.
o Minimizar o número de clones necessários através da clonagem
de fragmentos de maior tamanho possível.
•Vetores utilizados
•Fago λ
•Cosmídeos: fragmentos maiores; bibliotecas mais difíceis de 
construir e manter
•Cromossomos artificiais de levedura (YACs)
•Cromossomos artificias de bactérias (BACs)
Construção e uso de bibliotecas de DNA 
Recombinante
BIBLIOTECAS GENÔMICAS
• Para bactérias, leveduras e fungos, o número de clones 
necessário para uma biblioteca genômica completa não é 
tão grande que não possa ser manejado.
E para plantas e animais????
BIBLIOTECAS DE cDNA
Construção e uso de bibliotecas de DNA 
Recombinante
Nem todos os genes são expressos no mesmo momento....
• Uma característica da maioria dos organismos multicelulares é a
especialização de células individuais.
• Cada célula contém o mesmo conteúdo de genes, mas, nos
diferentes tipos celulares, grupos distintos de genes são
ativados, enquanto outros são silenciados.
Construção e uso de bibliotecas de DNA 
Recombinante
Apenas poucos genes são 
manifestados em um tipo 
celular
Clonagem do 
RNA 
mensageiro!!!!
O mRNA não pode ser ligado a um vetor 
de clonagem. E agora????
Biblioteca cDNA Isolando mRNAs da célula
Cromatografia
Biblioteca cDNA
Transformação de mRNA em cDNA
mRNA
convertido 
em DNA
DNA 
complementar 
(cDNA)
Transcriptase
reversa
 Clones construídos a partir de DNA complementar  cópia da
mensagem obtida da população de mRNA isolada da célula ou do tecido
de interesse.
 Em comparação com bibliotecas do genoma total essas bibliotecas são
enriquecidas com sequências gênicas.
O cDNA não contém íntrons  permite que cDNAs relativos a células de
eucariotos superiores sejam diretamente transcritos e traduzidos em
bactérias e em outros micro-organismos, permitindo assim a produção
em grande escala de polipeptídeos.
 A ausência de íntrons também facilita a determinação direta da
sequência da mensagem e subsequente dedução da sequência de
aminoácidos da proteína por ela codificada.
Biblioteca cDNA
Preparo dos cDNAs para a ligação 
com o vetor
Escolha do vetor plasmídeo ou fago
Fago λ tem sido o vetor de escolha para a construção de
bibliotecas de cDNA  eficiência  em comparação com
plasmídeos requer 16x menos cDNA por µg do vetor para produzir
número equivalente de clones recombinantes
Preparo dos 
cDNAs para 
a ligação 
com o vetor
Passos envolvidos na 
construção de 
Bibliotecas de cDNA e 
Bibliotecas Genômicas
Biblioteca Metagenômica
Genoma
é o conteúdo total de um 
organismo
Metagenoma
são os genomas coletivos 
de um ambiente
A biblioteca metagenômica
compreende a “garimpagem” de genes 
úteis a partir do ambiente sem o 
cultivo dos organismos que o carreiam
Biblioteca Metagenômica
Etapas da construção de 
biblioteca metagenômica
DNA e RNA (transcriptase 
reversa) são isolados diretamente 
do ambiente
Organismos não cultiváveis
Mortos (DNA)
Genes transcritos (mRNA), 
ativos na amostra ambiental
Clonados em vetores adequados
(BAC)
Detecção e Análise do Clone Recombinante
Como encontrar o clone que contém o gene de interesse na mistura 
de clones que foi criada durante os procedimentos da confecção da 
biblioteca genômica , de cDNA e biblioteca metagenômica ?
Detecção de colônias que produzam pequenas quantidades da
proteína expressa pelo gene de interesse
Detecção de colônias que possuam o gene de interesse sem
qualquer expressão proteica que o caracterize
Detecção e Análise do Clone Recombinante
Resistência a antibióticos
Marcadores metabólicos: 
Linhagens auxotróficas
Presença de inserto no plasmídio
(X-gal)
Seleção por bioluminescência
Anticorpos para detecção de 
proteínas;
Hibridização de colônias;
Detecção e Análise do Clone Recombinante
Quando o gene de interesse é expresso no hospedeiro
Importante
Para que a proteína seja expressa na célula hospedeira a
biblioteca de cDNA terá de ser construída em um VETOR DE
EXPRESSÃO  cDNAs inseridos em promotores que possam ser
regulados.
Detecção e Análise do Clone Recombinante
O Sequenciamento
de moléculas de DNA
>gi|33869444|gb|BC008730.2| Homo sapiens hexokinase 1, mRNA (cDNA clone MGC:1724 
IMAGE:3163058), complete cds 
GGCTGCGGAGGACCGACCGTCCCCACGCCTGCCGCCCCGCGACCCCGACCGCCAGCATGATCGCCGCGCA 
GCTCCTGGCCTATTACTTCACGGAGCTGAAGGATGACCAGGTCAAAAAGATTGACAAGTATCTGTATGCC 
ATGCGGCTCTCCGATGAAACTCTCATAGATATCATGACTCGCTTCAGGAAGGAGATGAAGAATGGCCTCT 
CCCGGGATTTTAATCCAACAGCCACAGTCAAGATGTTGCCAACATTCGTAAGGTCCATTCCTGATGGCTC 
TGAAAAGGGAGATTTCATTGCCCTGGATCTTGGTGGGTCTTCCTTTCGAATTCTGCGGGTGCAAGTGAAT 
CATGAGAAAAACCAGAATGTTCACATGGAGTCCGAGGTTTATGACACCCCAGAGAACATCGTGCACGGCA 
GTGGAAGCCAGCTTTTTGATCATGTTGCTGAGTGCCTGGGAGATTTCATGGAGAAAAGGAAGATCAAGGA 
CAAGAAGTTACCTGTGGGATTCACGTTTTCTTTTCCTTGCCAACAATCCAAAATAGATGAGGCCATCCTG 
ATCACCTGGACAAAGCGATTTAAAGCGAGCGGAGTGGAAGGAGCAGATGTGGTCAAACTGCTTAACAAAG(...)
TGACAGGCCTTCTGGGCCTCCAAAGCCCATCCTTGGGGTTCCCCCTCCCTGTGTGAAATGTATTATCACC
AGCAGACACTGCCGGGCCTCCCTCCCGGGGGCACTGCCTGAAGGCGAGTGTGGGCATAGCATTAGCTGCT 
TCCTCCCCTCCTGGCACCCACTGTGGCCTGGCATCGCATCGTGGTGTGTCAATGCCACAAAATCGTGTGT 
CCGTGGAACCAGTCCTAGCCGCGTGTGACAGTCTTGCATTCTGTTTGTCTCGTGGGGGGAGGTGGACAGT 
CCTGCGGAAATGTGTCTTGTCTCCATTTGGATAAAAGGAACCAACCAACAAACAATGCCATCACTGGAAT 
TTCCCACCGCTTTGTGAGCCGTGTCGTATGACCTAGTAAACTTTGTACCAATTCAAAAAAAAAAAAAAAAAA 
Sequenciamento de DNA
É uma série de métodos bioquímicos 
usados para determinar a ordem das 
bases nitrogenadas da molécula de DNA.
1977
• Frederick Sanger: Síntese de 
DNA in vitro por término 
didesóxi
• Prêmio Nobel em 1977
1986-1995
• Semi-automatizado
• Genoma de bactéria usando 
ddNTPs fluorescentes 
automatizados, robóticas e 
PCR 
1999
• Perkins-Elmer Corp: Comercializado 
o sequenciamento totalmente 
automatizado
HISTÓRICO
Frederick Sanger
Único vivo dentre os 4 indivíduos que já
ganharam dois prêmios Nobel
~1955: publicou a primeira sequência de
aminoácidos da insulina
 Ganhou o Nobel de química em 1958
1964: descobriu que as proteínas de bactéria
iniciavam-se com o aminoácido formil-metionina
1967: desvendou a sequência do RNA ribossomal 5S
1975: inventou o método dideóxi para o
sequenciamento do DNA
1977: sequencia, pela primeira
vez, o genoma inteiro
de um organismo, o bacteriófago phi X 174
 11 genes in 5386 bases sequenciadas “à mão“
 Ganha o segundo Nobel de química em 1980
O método de Sanger, 1975
Polimerização do DNA a ser sequenciado (molde) na presença 
de:
DNA polimerase
primer
Tampão
dNTPs (desóxinucleotídeo)
ddNTPs (didesóxinucleotídeo)
O que faria um nucleotídeo que, 
ao invés da extremidade 3’OH, 
tivesse uma extremidade 3’H?
Como acontece a síntese de 
moléculas de DNA?
http://www.youtube.com/watch?v=Mz 4LSfecM4&feature=related (dideóxi)
Método de Sanger 
(Método de terminação da cadeia)
Utiliza o mecanismo de síntese do DNA pela DNA polimerase, na
presença ddNTP (didesoxirribonucleotídeos).
Método de Sanger
ddNTP interrompe a 
amplificação
O didesóxinucleotídeo não tem a 
extremidade 3’OH livre
(...) 
e, portanto, não permite a 
incorporação de novas bases a 3’
quando é adicionado,
(...)
interrompendo a formação da nova 
cadeia definitivamente
Método de Sanger
 Interrupção controlada da replicação do DNA: utilização de
didesoxinucleotídeos trifosfatados;
 Reação → comprimento dos fragmentos equivalem à posição do
nucleotídeo no DNA.
H
OH
P
P
T
G
H
P
T
PP
OH
H
H
P
P
T
G
H
P
T
PP
OH
?
deoxinucleotídeo
dideoxinucleotídeo
H
OH
PP
P
T
G
H
P
T
PP
OH
H
H
PP
P
T
G
H
P
T
PP
OH
?
deoxinucleotídeo
dideoxinucleotídeo
Método de Sanger
Desoxinucleotídeos
dCTPdATP
dTTP
DNA polimerase
Primer
Radioativo
ou fluorescente
dGTP Primer
forward 
ou
Primer reverse
DNA molde 
(fita simples)
Tampão
Didesoxirribonucleotídeos
ddCTP ddTTP ddGTPddATP
ddATP – terminação em 
posições opostas a T
Terminação nem sempre ocorre 
no primeiro T
Razão dATP/ddATP
Uma fita individual pode ser 
polimerizada por uma extensão 
considerável, antes que um 
ddATP seja incorporado
Resultado: família de fitas 
nova, de comprimentos 
diferentes, cada uma 
terminando em um ddATP
Método de Sanger
• Redução do DNA em quatro grupos
de fragmentos marcados.
•A reação resulta em uma série de
fitas marcadas de diferentes
comprimentos que serão ordenadas
em gel de poliacrilamida.
•A análise da ordem das bandas,
começando pelo final do gel, pode-
se determinar a sequência do DNA
sintetizado.
Método de Sanger
 Eletroforese em gel de poliacrilamida em condições controladas
 Necessário separar as fitas que diferem em extensão por apenas um
nucleotídeo
 Géis desnaturantes (uréia e aquecimento a 60ºC)
 Separar as fitas recém sintetizadas da fita molde
Leitura máxima 
de até 400 
nucleotídeos.
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||
5’3’
ATGCTTC
5’ 3’
A
A
A
A
A
A
A
A
A
A
T
TT T
T T
T
T
T
T
T
G
G
G
G
G
G
G
G
G
C
C
C
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||||
5’3’
ATGCTTC
5’ 3’
A
A
A
A
A
A
A
A
A
A
TTT T
T T
T
T
T
T
T
G
G
G
G
G
G
G
G
G
C
C
C
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
||||||||||
3’
ATGCTTCTG
5’ 3’
A
A
A
A
A A
A
A
A
A
T
T
T
T
T T
T
T
T
T
T
G
G
G
G
G
G
G
G
G
C
C
C
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||||||||||||
5’3’
ATGCTTCTGGCAGATCT
5’ 3’
A
A
A
A
A
A
A
A
A A
T T
T
T
T
T T
T
T
TT G
G
G
G G
G
G
G G
C
C
C
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||||||||||
5’3’
ATGCTTCTGGCAGAT
5’ 3’
A
A
A
A
A
A
A
A
A
A
T
T
T
T
T
T
TT
T
T
T
G
G
G
G
G
G
G
G
G
C
CC
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||||||||||
5’3’
ATGCTTCTGGCAGAT
5’ 3’
A
A
A AA
A
A
A
A
A
T
T
T
T
T
T
TT
T T
T
G
G
G
G
GG
G
G
G
C
C
C
C
C
C
C
C
C
C
C
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA
|||||||||||||||
5’3’
ATGCTTCTGGCAGAT
5’ 3’
A
A
A
A
A
A
A
A
A
A
T
T
T
T
T
T
T
T
T
T
T
G
G
G
G
G
G
G
G
G
C
C
C
C
C
C
C
C
C
C
C
G A T C
• molde
• polimerase
• dNTPs
•ddGTPs •ddATPs •ddTTPs •ddCTPs
ATGCTTCTGGCAGAT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGAT
ATGCTTCTGGCAGATCTGAACAGTGT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATAT
ATGCTTCTGGCAGATCTGAACAGTGTTACT
ATGCTTCTGGCAGATCTGAACAGT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATT
ATGCTTCT
ATGCTTCTGGCAGATCT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT
ATGCTTCTGGCAGATCTGAACAGTGTT
ATGCTTCTG
ATGCTTCTGG
ATGCTTCTGGCAG
ATGCTTCTGGCAGATCTG
ATGCTTCTGGCAGATCTGAACAG
ATGCTTCTGGCAGATCTGAACAGTG
ATGCTTCTGGCAGATCTGAACAGTGTTACTG
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTG
ATGCTTCTGGC
ATGCTTCTGGCAGATC
ATGCTTCTGGCAGATCTGAAC
ATGCTTCTGGCAGATCTGAACAGTGTTAC
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGC
ATGCTTCTGGCA
ATGCTTCTGGCAGA
ATGCTTCTGGCAGATCTGA
ATGCTTCTGGCAGATCTGAA
ATGCTTCTGGCAGATCTGAACA
ATGCTTCTGGCAGATCTGAACAGTGTTA
ATGCTTCTGGCAGATCTGAACAGTGTTACTGA
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATA
G A T C
ATGCTTCTGGCAGAT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGAT
ATGCTTCTGGCAGATCTGAACAGTGT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATAT
ATGCTTCTGGCAGATCTGAACAGTGTTACT
ATGCTTCTGGCAGATCTGAACAGT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATT
ATGCTTCT
ATGCTTCTGGCAGATCT
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTT
ATGCTTCTGGCAGATCTGAACAGTGTT
ATGCTTCTG
ATGCTTCTGG
ATGCTTCTGGCAG
ATGCTTCTGGCAGATCTG
ATGCTTCTGGCAGATCTGAACAG
ATGCTTCTGGCAGATCTGAACAGTG
ATGCTTCTGGCAGATCTGAACAGTGTTACTG
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTG
ATGCTTCTGGC
ATGCTTCTGGCAGATC
ATGCTTCTGGCAGATCTGAAC
ATGCTTCTGGCAGATCTGAACAGTGTTAC
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGC
ATGCTTCTGGCA
ATGCTTCTGGCAGA
ATGCTTCTGGCAGATCTGA
ATGCTTCTGGCAGATCTGAA
ATGCTTCTGGCAGATCTGAACA
ATGCTTCTGGCAGATCTGAACAGTGTTA
ATGCTTCTGGCAGATCTGAACAGTGTTACTGA
ATGCTTCTGGCAGATCTGAACAGTGTTACTGATA
https://www.youtube.com/watch?v=e3UOaIXukeQ
Modelo original
Marcação do primer
4 reações necessárias, 
uma para cada base
Eletroforese separa 
fragmentos de 
diferentes tamanhos
Leitura manual da 
sequência de baixo pra 
cima
Etapa 1
Amplificação
Tipo-PCr
Etapa 2
Eletroforese
Sanger e o fago Phi 174
De fato, esse tipo de 
sequenciamento 
manual continuou 
acontecendo por 
décadas...
Exercício
Dê a sequência de DNA da canaleta apontada
azul = Guanina
amarelo = Timina
vermelha = Adenina
verde = Citosina
http://www.youtube.com/watch?v=dUjMf2ZezIw&feature=related
Montando a sequência...
Modelo moderno
Applied Byosystems, 1986
Marcação fluorescente do ddNTP
1 reação necessária, todas as
bases lidas ao mesmo tempo
Eletroforese separa fragmentos
de diferentes tamanhos
Leitura da automática sequência,
de baixo pra cima, por um laser
http://www.youtube.com/watch?v
=ezAefHhvecM
Leroy Hood, 1938
Sequenciamento automático
Desoxinucleotídeos
dCTPdATP
dTTP
DNA polimerase
Taq polimerase
Primer
dGTP
Primer 
forward 
ou
Primer reverse
DNA molde
Tampão
Didesoxinucleotídeos
ddCTPddATP
ddTTP ddGTP
Kit
 Adaptação da PCR ao método da 
terminação da cadeia
 ddNTPs fluorescentes (fluorocromos)
 Leitura direta: sem uso de radioatividade
 Eletroforese em gel ou em capilar
 Fluorocromos são excitados por um feixe 
laser 
 Sinais fluorescente detectados por 
detectores adequados 
(fotomultiplicadores ou câmaras CCD)
Sequenciamento automático
Cromatograma
As máquinas necessárias para o 
sequenciamento
 Primeira etapa: junta-se os 
reagentes em poços de 
placas e coloca-se na 
máquina de PCR para a reação
de amplificação interrompida
 Diferenças com relação ao PCR
 Utilização de um só primer
 Utilização dos ddNTPs
 Uma vez prontas, as sequências de diferentes tamanhos contendo 
os didesóxi amplificados devem ser enviadas ao sequenciador de 
DNA mais próximo
O que faz um sequenciador 
de DNA?
 Segunda etapa: realiza a eletroforese capilar
 O sequenciador executa a eletroforese em géis capilares ultra-finos
 Um sensor é responsável por emitir um laser e verificar qual o 
comprimento de onda emitido pelo didesóxi 
 Análises computacionais que identificam cada nucleotídeo pelo comprimento de
onda de emissão específico de cada fluorocromo.
 As bases são identificadas de acordo com a forma do pico fluorescente e a
distância entre os picos.
Sequenciamento 
de até 750 
nucleotídeos.
Sequenciamento automático
Sequenciamento automático
Tecnologias de sequenciamento de 
nova geração (NGS)
NGS = Next Generation Sequencing
começaram a ser comercializadas em 2005 e estão evoluindo
rapidamente;
promovem o sequenciamento de DNA em plataformas capazes de gerar
informação sobre milhões de pares de bases em uma única corrida;
grande economia de tempo e custo.
Plataforma 454 FLX da Roche
Solexa da Illumina
SOLiD System da Applied Biosystems, 
http://www.scielo.br/pdf/cr/v40n3/a505cr1820.pdf
Leitura complementar
Sequenciamento de Genomas
Por que sequenciar o genoma de um organismo ?
• É importante conhecer o conteúdo completo de um genoma =
conhecer todos os genes envolvidos em determinado processo =
compreensão completa do processo.
• Acesso a genes importantes = podem fornecer informações sobre
sequências e mapear posições genes que foram identificados mas
nunca clonados. (Versões recombinantes de proteínas importantes)
• Identificação de genes para doenças humanas = estímulo original do 
Projeto Genoma Humano. 
- Identificação de genes responsáveis por doenças genéticas (terapias, 
tratamentos.)
Sequenciamento do genoma humano em 2000 –
$ 2 bilhões Francis Colins e Craig Venter (Celera)
http://profissaobiotec.com.br/bioinformata-o-que-e-isso/
Leitura complementar
Aulas 14: Tecnologia do DNA Recombinante

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais