Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 1
Prof. Benisio Ferreira da Silva Filho
CONVERSA INICIAL
Desde o famoso experimento de Gregor Mendel e suas ervilhas que a Biologia não é mais a
mesma. A cada novo avanço e a cada nova descoberta mais informações sobre genes, genética e
estrutura molecular da célula estão disponíveis. Ao longo das aulas da disciplina iremos abordar
diversas técnicas moleculares de uso rotineiro para biomédicos. Inicialmente, iremos abordar
técnicas de extração, quantificação e análise do material genético e posteriormente técnicas de
purificação e análise de proteínas.
Sabemos que todas as células, eucarióticas e procarióticas, animais e vegetais, possuem a
mesma composição bioquímica: lipídeos, proteínas, carboidratos e ácidos nucléicos. Baseados nesta
informação, de uma composição universal similar entre os mais diversos tipos celulares, é que as
técnicas de biologia molecular ganham destaque, pois podem ser aplicadas aos mais diversos tipos
de seres vivos existentes. Apesar de ser uma área recente, a Biologia Molecular é cada vez mais
estudada e seus avanços são notórios nos últimos anos: descobriu-se desde a estrutura molecular
do DNA, até como sequenciá-lo e curar doenças por meio das terapias gênicas.
TEMA 1 – IMPORTÂNCIA DA BIOLOGIA MOLECULAR NA
BIOTECNOLOGIA
A Biologia Molecular é a ciência que estuda os ácidos nucléicos e seus produtos. Os dois ácidos
nucléicos presentes em uma célula são DNA e RNA e suas estruturas e funções já foram muito bem
descritas em outras disciplinas deste curso. Por meio dos processos de transcrição e tradução, o
DNA comanda a formação de proteínas, num processo denominado expressão gênica. Desta forma, o
foco principal da Biologia Molecular é o estudo do DNA, RNA e das proteínas.
A Biotecnologia é o conjunto de técnicas e análises, construído ao longo das últimas décadas
que nos permite analisar e modificar ácidos nucleicos e proteínas e nos propiciou avanços
tecnológicos importantes em diferentes áreas. Segundo a ONU, “biotecnologia é qualquer aplicação
tecnológica que utilize sistemas biológicos, organismos vivos ou seus derivados, para fabricar ou
modificar produtos ou processos para a utilização específica. Ou seja, a biotecnologia é a ciência a
partir da qual utilizam-se organismos vivos e a manipulação de suas macromoléculas (DNA, RNA e
proteínas) para a produção de produtos que melhorem a forma como vivemos e compreendemos o
mundo.
No ano de 1866, Gregor Mendel publica seus postulados sobre hereditariedade. Ele não possuía
o conhecimento necessário sobre estrutura da célula e genes, chamando naquele momento os genes
de fatores relacionados à hereditariedade. Somente em 1869, Friedrich Miescher descobre a
existência dos ácidos nucleicos e a expressão Biologia Molecular só foi criada em 1939 por Warren
Weaver, com o intuito de designar o trabalho em conjunto da biologia, física e química na busca pelo
conhecimento das moléculas. Com os avanços das técnicas bioquímicas e da microscopia, em 1944
Oswald Avery comprovou que as informações hereditárias estavam armazenadas no DNA. Mas
afinal, nesta época, o que se considerava DNA? Foi apenas em 1953 que James Watson e Francis
Crick demonstraram o que era uma molécula de DNA, qual era sua estrutura química e como a
informação hereditária estava armazenada nesta molécula. Em 1966 Marchal Niremberg e Har
Khorana decifram o código genético humano e 6 anos mais tarde, em 1972, Stanley Cohen e Herbert
Boyer desenvolvem a tecnologia do DNA recombinante. Ainda na década de 70, Frederich Sanger
desenvolveu o primeiro método de sequenciamento de DNA (1977) e no início da década de 80 os
primeiros exemplares de clonagem foram criados por Richard Palmiter e Ralph Brinster. Em 1983,
Kary Mullis cria a técnica de reação em cadeia da polimerase (PCR - Polymerase Chain Reaction) e em
1985 são desenvolvidas as primeiras técnicas de impressão digital por DNA (DNA fingerprint). O
grande marco das ciências moleculares se deu em 1996 com a clonagem da ovelha Dolly por Ian
Wilmut e sua equipe.  Na mesma época se iniciava o projeto genoma humano que foi completado em
2001 com cerca de 99% do genoma humano sequenciado.  Desde o início dos anos 2000 os avanços
nas áreas de Biologia molecular têm sido cada vez mais pronunciados com diversas aplicações
práticas.
Dentre as aplicações práticas mais famosas estão a criação de organismos transgênicos, que
ainda hoje suscitam discussões e polêmicas em meio a comunidade científica. Mas a biotecnologia
não para por aí. Ela evoluiu com o desenvolvimento de testes moleculares para a detecção de
diversos tipos de doenças como tuberculose, HIV e câncer; para a elucidação de crimes com a
genética forense; para o tratamento e cura de doenças hereditárias por meio da terapia gênica; para a
identificação de mutações causadoras de doenças; testes de paternidade e uma infinidade de outras
aplicações demonstrando que a biologia molecular e suas aplicações biotecnológicas estão na
vanguarda dos estudos científicos de ponta.
TEMA 2 –EXTRAÇÃO DE MATERIAL GENÉTICO
Todos os organismos vivos são compostos por células e estas possuem em seu interior o
material genético. No caso dos procariotos o DNA está disperso no citoplasma, já nos eucariotos
este DNA encontra-se compartimentalizado no núcleo. Independentemente de sua localização, para
que se possa estudar o DNA é necessário de alguma forma extraí-lo, ou seja, retirá-lo de dentro da
célula. A retirada do DNA de uma célula é denominada extração e compreende diversas etapas que
serão descritas a seguir.
Existem inúmeros protocolos na literatura e a escolha do mais adequado deve levar em conta
qual material genético se deseja extrair (se DNA ou RNA), o tipo de amostra, o grau de pureza
necessário ao ensaio e os recursos disponíveis em cada laboratório.
2.1 PREPARO DAS AMOSTRAS
Diferentes tipos de amostras podem ter seu DNA/RNA extraídos, incluindo células sanguíneas,
tecidos para biópsia, células de cultivo, bactérias, fungos e plantas. Independente da origem, o
material deve ser preservado adequadamente até que a etapa de extração ocorra. Esta preservação
pode ser feita por meio do congelamento em ultrafreezer (-80o.C), ou em nitrogênio líquido, ou ainda
por meio de kits comerciais que estabilizam estas amostras.
Amostras líquidas como sangue ou urina devem passar por uma etapa de centrifugação a fim de
separar o pellet celular do sobrenadante. Nestes casos o pellet, que é mais denso, se deposita no
fundo do tubo de ensaio, enquanto que o sobrenadante líquido pode ser descartado. Já para tecidos
sólidos como por exemplo tecido hepático para um biópsia, é necessário um protocolo de
dissociação do tecido visando aumentar a superfície de reação para os reagentes da etapa de lise
celular. Esta dissociação pode ser feita picando-se o tecido em pequenos fragmentos com a ajuda de
uma tesoura ou macerando-o com o auxílio de um pistilo.
2.2 LISE CELULAR
Após obtidas e armazenadas adequadamente, as amostras precisam ter suas células lisadas, ou
seja, rompidas. Tal lise é necessária pois libera os componentes citoplasmáticos, dentre eles os
ácidos nucléicos. A lise deve ocorrer em soluções tamponadas contendo um detergente e os
reagentes tris-hidroximetil aminometano (Tris), cloreto de sódio (NaCl) e ácido etileno diamino tetra-
acético (EDTA). O detergente tem função primordial neste procedimento visto que atua solubilizando
os lipídeos de membrana, facilitando a liberação do conteúdo celular. O Tris é uma solução
tamponante que visa manter o pH em torno de 8, evitando desta forma que o DNA sofra a ação de
enzimas DNAses que o degradam. O EDTA é uma agente quelante de íons divalentes Cálcio e
Magnésio, que também atua inibindo a ação das DNAses.  O NaCl promove desnaturação de
proteínas, ruptura de ligações iônicas e aglomeração de moléculas de ácidos nucléicos.
Alguns protocolos adicionam a enzima proteinase K ao tampão de lise com o objetivo demelhorar a digestão da célula e solubilizar mais facilmente o conteúdo intracelular. O beta-mercapto
etanol em geral é adicionado ao tampão de lise para evitar a oxidação de ácidos nucleicos.
2.3 SEPARAÇÃO DOS CONSTITUINTES CELULARES
Após a lise temos uma solução que é uma sopa de constituintes e restos celulares, sendo
necessário separar os ácidos nucleicos de nosso interesse. Na etapa de separação dos constituintes
celulares é adicionado um solvente como fenol e clorofórmio que desnatura e precipita proteínas;
desta forma o DNA permanece solúvel no sobrenadante. A solução então é centrifugada formando
um pellet contendo proteínas, que será descartado, e um sobrenadante com ácidos nucleicos. Este
sobrenadante é coletado e separado para um novo tubo. Quanto mais vezes esta etapa de separação
dos constituintes celulares for repetida, maior será a pureza da amostra.
2.4 PRECIPITAÇÃO DO DNA
O NaCl presente no tampão de lise associado a baixas temperaturas e a adição de solventes
orgânicos como etanol, isopropanol ou acetato de amônio promove a precipitação do DNA. Este DNA
precipitado forma um conglomerado esbranquiçado com aspecto de um algodão em solução. Este
“algodão” pode ser pescado com o auxílio de um bastão de vidro ou a amostra pode ser centrifugada.
Nesta etapa de centrifugação o DNA formará um pellet no fundo do tubo e o sobrenadante será
descartado (diferente do que ocorreu na etapa de lise, na qual o pellet foi descartado e o
sobrenadante utilizado).
2.5 LAVAGEM E RESSUSPENSÃO DO DNA
Para garantir maior pureza e eliminar resíduos de outros reagentes, as amostras provenientes da
etapa anterior devem ser lavadas com etanol 70%. O etanol é eliminado das amostras por simples
evaporação, dada sua elevada volatilidade. Após a evaporação, o pellet de DNA é ressuspenso em
tampão Tris-EDTA ou água ultrapura. A água ultrapura é diferente de água destilada. A água destilada
passa por um processo de destilação simples que remove os sais presentes nela. A água ultrapura,
também chamada de água Mili-Q é uma água livre de qualquer sal, contaminantes e enzimas, ou seja,
é apenas água sem nenhuma outra substância.
TEMA 3 – MÉTODOS DE QUANTIFICAÇÃO DO MATERIAL GENÉTICO
EXTRAÍDO
Após sua extração é necessário ter certeza de que o que foi extraído era realmente DNA. Além
disso, é necessário também saber a quantidade de DNA presente na amostra. Para avaliar a
presença e quantificar o DNA são utilizadas diversas técnicas que serão descritas a seguir.
3.1 ESPECTROFOTOMETRIA
A técnica de espectrofotometria se baseia no uso de um aparelho chamado espectrofotômetro,
que incide uma radiação de determinado comprimento de onda sobre a amostra e mensura quanto
desta radiação foi absorvida pela mesma. Por isso a unidade de medida lida pelo equipamento
denomina-se absorbância, referindo-se à quantidade de luz absorvida pela amostra quando excitada
por determinado comprimento de onda.
Esta técnica relaciona a quantidade de luz absorvida por uma amostra a 260nm (comprimento
de onda) com a quantidade de DNA presente nesta amostra. Quanto maior a absorção de luz, maior a
quantidade de DNA na amostra. Esta técnica possui uma curva padrão que determina que uma
absorbância igual a 1 corresponde a uma concentração de 50 µg de DNA por ml de solução. Desta
forma, fazendo o uso de uma simples regra de três, é possível determinar a quantidade de DNA em
uma amostra. Se houve necessidade de diluição da amostra, esta deve ser levada em conta na hora
do cálculo da contração de DNA, segundo a fórmula abaixo:
Concentração DNA = Absorbância(260 nm) x Diluição x 50.
Além de quantificar, a espectrofotometria também permite avaliar a qualidade das amostras de
DNA. Para isto deve-se medir a absorbância em 260 e 280 nm e fazer uma relação entre estes
valores, ou seja, dividir o valor da absorbância em 260 nm pelo valor da absorbância em 280 nm;
valores entre 1,4 e 2 indicam boa pureza das amostras e valores abaixo de 1,4 indicam presença de
contaminante na amostra. A absorbância a 260 nm reflete a luz absorvida pelas ligações entre as
bases nitrogenadas do DNA; já a leitura a 280 nm reflete a absorbância a 280 nm, comprimento de
onda no qual as ligações peptídicas das proteínas fluorescem. Esta relação só é verdadeira se todo o
fenol for removido da amostra, pois o mesmo fluoresce a 270 nm podendo gerar leituras incorretas.
Embora a espectrofotometria seja a técnica mais utilizada rotineiramente ela possui um limiar
de detecção alto, não sendo indicada quando a quantidade de DNA na amostra é da ordem de
nanogramas. Nestes casos deve-se utilizar a fluorimetria, um método bastante similar mas que
baseia sua leitura em fluorescência e é capaz de detectar DNA na ordem de nanogramas.
3.2 ELETROFORESE EM GEL DE AGAROSE
A eletroforese é a principal técnica utilizada em biologia molecular para a análise de DNA. Ela
permite separar, identificar e purificar os fragmentos de DNA quando não é possível utilizar outras
técnicas, como os gradientes de centrifugação. É uma técnica rápida, que permite excelente
resolução dos fragmentos de DNA. O gel é formado por agarose, um polissacarídeo que ao sofrer
solidificação forma uma malha que retém as moléculas durante a migração. Dependendo da
concentração de agarose, há diferenças no gradiente de separação. Quanto maior a concentração,
mais fechados são os poros da malha do gel e maior retenção de fragmentos de DNA. Para se
analisar amostras com fragmentos maiores deve-se dar preferência para géis de malha menos densa
(ou seja, mais frouxa, com menor concentração de agarose), pois assim os fragmentos grandes terão
facilidade em “correr” a malha do gel. O inverso também é verdadeiro, para fragmentos menores
deve-se dar preferência para géis com poros menores, ou seja, maior concentração de agarose, pois
desta forma os pequenos fragmentos ficarão retidos no gel.
Esta técnica permite a separação de fragmentos de DNA de tamanho diversos por meio da
aplicação de um campo elétrico. Os grupos fosfatos dos ácidos nucléicos possuem cargas negativas
e, portanto, quando submetidos a um campo elétrico, por diferença de potencial, migram em direção
ao polo positivo deste campo. Quanto menor o tamanho do fragmento de DNA, mais rápido ele migra
pela malha de agarose e portanto maior será a distância percorrida no gel. Moléculas com maior
número de pares de base possuem tamanho maior e portanto migram mais lentamente pela malha
do gel, ocupando posições mais superiores no gel. Fragmentos de mesmo tamanho ocupam a
mesma posição no gel, formando as denominadas bandas.
Figura 1 – Na imagem acima, um aparelho de eletroforese com o polo positivo indicado em
vermelho e o negativo em preto. As amostras são adicionadas nos poços do gel e irão migrar ao
longo do gel do polo negativo para o polo positivo. A foto do gel (última imagem à direita)
demonstrando bandas superiores (de maior peso molecular) e bandas inferiores (de menor peso
molecular)
Crédito: Soleil Nordic/Shutterstock.
Figura 2 – Gel de agarose corado com brometo de etídio. Cada coluna corresponde a uma
canaleta do gel na qual foi colocada uma amostra específica de DNA. Acima do gel estão os
fragmentos maiores e abaixo os menores
Crédito: Martinek Jan/Shutterstock.
Para que se possa visualizar o resultado da separação das amostras de DNA em gel de agarose
é necessário que este passe por um procedimento de coloração. Este processo consiste em corar o
DNA com corantes fluorescentes como o brometo de etídio (altamente tóxico e carcinogênico). Este
corante, sob luz ultravioleta, emite uma luz alaranjada formando bandas visíveis no gel. Outros
corantes menos tóxicos como o GelGreen e SybrGreen vem suplantando o brometo de etídio.
Nas extrações podem-se obter grandes moléculas, que incluem cromossomos inteiros ou
cromossomos fragmentados. Amostras de boa qualidade formam bandas íntegras, enquanto
amostras degradadas ou com presença de moléculas de RNA apresentam rastros ao longodo gel. A
quantificação é feita pela comparação entre a intensidade da fluorescência das amostras extraídas
com uma solução de DNA de concentração conhecida, como por exemplo, soluções contendo DNA
do fago lambda.
Após a obtenção de amostras de DNA e de sua avaliação quantitativa e qualitativa, pode ser
realizada a etapa de análise de DNA que serão descritas nos temas 4 e 5 desta aula e na posterior.
As análises dos ácidos nucleicos incluem o uso de enzimas de restrição, técnicas de hibridação
molecular, técnicas de amplificação do DNA (PCR – reação em cadeia da polimerase),
sequenciamento de DNA e outras técnicas de análise de ácidos nucleicos. 
TEMA 4 – USO DE ENZIMAS DE RESTRIÇÃO
Enzimas de restrição são proteínas encontradas em bactérias que as protegem de infecções
virais pois são capazes de clivar o DNA viral, impedindo que este se replique em seu interior. As
enzimas de restrição, também chamadas de endonucleases Tipo II, são enzimas que quebram a dupla
fita de DNA em regiões específicas gerando fragmentos de DNA sempre do mesmo tamanho e
composição. Cada tipo de enzima de restrição é capaz de reconhecer um segmento específico do
DNA, denominado sítio de restrição, realizando a clivagem da molécula de DNA nestes sítios
específicos. Como resultado existirão vários fragmentos de DNA, sendo que todos foram clivados
exatamente na mesma região.
Diversas espécies de bactérias são usadas para a produção e isolamento das enzimas de
restrição. Cada enzima tem seu nome acompanhado de uma inscrição que indica o sítio do DNA no
qual ocorre a clivagem. Por exemplo a enzima Afe I 5´AGC-GCT 3´ / 3´TGC - CGA 5´, foi produzida no
microorganismo Alcaligenes faecalis e cliva o DNA nas sequências especificadas.
A descoberta das enzimas de restrição foi essencial para o surgimento da tecnologia do DNA
recombinante, na qual moléculas de DNA de organismos diferentes podem ser cortadas e
posteriormente unidas por complementaridade das duas fitas de DNA e ação da enzima DNA ligase,
que refaz as ligações fosfodiéster. As enzimas de restrição também são utilizadas no diagnóstico de
doenças genéticas, dado que mutações específicas no DNA podem alterar o sítio de clivagem deste
pelas enzimas, alterando o tamanho dos fragmentos gerados, permitindo a diferenciação entre
moléculas portadoras e não portadoras da mutação com base nos tamanhos dos fragmentos
gerados pela clivagem.
Figura 3 – As enzimas de restrição atuam como tesouras moleculares. Estas enzimas clivam a
fita de DNA em sequências específicas
Crédito: Mopic/Adobe Stock.
Figura 4 – Uso das enzimas de restrição em técnicas de engenharia genética. Neste caso a
enzima de restrição (em vermelho) foi utilizada para clivar duas regiões do DNA, permitindo a
remoção de um gene causador de doenças.
Créditos: designua/Adobe stock.
TEMA 5 – HIBRIDAÇÃO MOLECULAR
Os métodos de hibridização foram um dos primeiros métodos desenvolvidos para analisar o
DNA extraído e fragmentado pelo uso de enzimas de restrição e consiste basicamente na separação
dos fragmentos de DNA de uma amostra por eletroforese em gel de agarose, seguida da
transferência destes fragmentos para uma membrana sólida com a posterior detecção dos mesmos
por métodos enzimáticos, cromogênicos ou luminiferous.
5.1 HIBRIDAÇÃO SOUTHERN
O método batizado em homenagem ao seu criador Edwin Southern, também conhecido como
hibridação southern ou hibridação DNA-DNA, permite o reconhecimento específico de certas
moléculas de DNA. Imagine que você tem uma amostra de um tecido qualquer e realizou a extração
de DNA dessa amostra. Na sequência você tratou essa amostra com enzimas específicas de
restrição a fim de clivar o DNA e isolar um segmento específico do mesmo, ou seja, um gene. Como
saber se o gene de interesse realmente estava presente na amostra e como saber se o
processamento com a enzima de restrição obteve sucesso? É neste ponto que entra a técnica de
hibridização DNA-DNA. Para a realização desta técnica é necessário conhecer a sequência do gene
que se quer analisar (por ex 5´AATTGCGC 3´). Baseado nesta sequência, o pesquisador sintetiza em
laboratório uma sonda de DNA que consiste basicamente em um fragmento de DNA sintético
complementar a sequência do gene de interesse (por ex 3´ TTAACGCG 5´). Esta sonda sintética é
marcada com uma substância que emite fluorescência quando uma sequência complementar se liga
a ela. Ao misturar os fragmentos de DNA da minha amostra, que contém o gene de interesse, com a
sonda sintética, é possível medir a fluorescência emitida e concluir se havia ou não o gene de
interesse na minha amostra. A técnica denomina-se hibridação pois ocorre a formação de um
fragmento de DNA híbrido, sendo uma das fitas composta pelo DNA da minha amostra e a outra pela
sonda sintética. 
A amostra contendo o DNA deve ser separada em um gel de agarose e deste transferida para
uma membrana de nylon ou nitrocelulose, onde as moléculas de DNA ficam estáticas. Antes da
transferência, o gel é tratado com hidróxido de sódio promovendo a abertura das duplas fitas de
DNA. A membrana é uma réplica exata de tudo que existe no gel, porém sobre esta membrana é
possível se realizar uma série de experimentos que não seriam possíveis sobre o gel devido a sua
malha porosa. A sonda é colocada em contato com essa membrana e irá se ligar especificamente
apenas onde houver fragmentos de DNA complementares a ela. Lavagens removem sondas não
ligadas e também sondas que se ligam incorretamente, pois ligações incorretas tem baixa
especificidade se desfazendo facilmente. A sonda é previamente marcada com fosfato radioativo
(32P) e desta forma os DNAs hibridizados quando expostos a determinado comprimento de onda
irão emitir luminosidade/ fluorescência específicos, indicando e simultaneamente quantificando a
hibridização.
Figura 5 – Em 1 as bandas do gel de agarose sendo colocadas em contato com a membrana de
nitrocelulose ou nylon. Em 2 os fragmentos de DNA do gel foram transferidos para a membrana. Em
3 a membrana é colocada em contato com sondas específicas de DNA. Em 4 as sondas se ligam
especificamente ao DNA de interesse. Em 5 as moléculas de DNA que sofrem hibridização são
detectadas
Crédito: Daniele Dietrich Moura Costa.
5.2 HIBRIDAÇÃO NORTHERN
A técnica de northern blot, também conhecida como hibridização DNA-RNA, visa a detecção de
RNAs mensageiros (abreviados como mRNA). Recebeu esse nome devido ao trocadilho com o nome
da técnica Southern. É muito similar a técnica de southern blot, no entanto a sonda desenhada é
complementar ao um mRNA, permitindo a detecção deste tipo de molécula.
Esta técnica é muito utilizada para avaliar a expressão gênica, dados que os mRNA são o
resultado da transcrição dos genes e serão traduzidos em proteínas posteriormente.
NA PRÁTICA
Desde sua descoberta, as enzimas de restrição passaram a ser utilizadas em diversos tipos de
ensaios para avaliar o DNA. Um de seus usos mais frequentes é nos testes de identificação de
pessoas, sejam eles testes de paternidade, testes para identificação de possíveis criminosos ou
vítimas de acidentes. Nestes ensaios, o DNA da pessoa que se quer identificar é extraído,
quantificado e então fragmentado em regiões específicas pelas endonucleases. Após a
fragmentação, o DNA é analisado em um gel de agarose. Relembrando que fragmentos diferentes
migram de forma diferencial pelo gel de agarose, desta forma produzindo uma padrão de bandas
específicas. Cada indivíduo possui seu DNA exclusivo que irá sofrer clivagem em sítios específicos
pelas endonucleases gerando também um padrão específico de bandas no gel. No caso de um crime,
se o padrão de bandas no gel for 100% similar ao padrão de bandas de um acusado, este é
considerado culpado, pois a compatibilidade de bandas entre o indica que se trata da mesma
pessoa. No caso de um teste de paternidade, o DNA do filho deve ter padrão de similaridade de 50%
com DNA do suposto pai, pois o filho contém metade da cargagenética da mãe e metade do pai.
Observe a figura abaixo. Você consegue descobrir quem é o pai da criança?
Figura 6 – Um filho, uma mãe e dois supostos pais. Os retângulos pretos indicam a presença da
banda no gel de agarose e os retângulos brancos indicam a ausência de bandas no gel. Observe a
banda 1: ela está ausente no filho, na mãe e em ambos pais, logo não permite concluir nada em
relação à paternidade da criança. A banda 3 está presente no filho e na mãe, mas ausente em ambos
os pais, indicando que de fato a criança é filho da referida mãe. A banda 7 está presente no filho,
ausente na mãe e no pai 2, mas presente no pai 1. Esta banda é conclusiva em relação ao teste, pois
o filho tem e deve ter herdado de um dos genitores; se a mãe não tem essa banda ela só pode ter
sido herdada do pai
Crédito: Daniele Dietrich Moura Costa.
FINALIZANDO
Trabalhar com ácidos nucléicos não é fácil e requer precisão e treinamentos específicos.
Conforme visualizamos ao longo desta aula, primeiramente é necessário obter uma amostra e
armazená-la corretamente. Na sequência o DNA contido na amostra deve ser extraído. O processo de
extração possui várias etapas que devem ser realizadas sequencialmente: lise celular, separação dos
constituintes celulares, precipitação e ressuspensão do DNA. Esse DNA extraído deve ser
quantificado antes de prosseguir para análises. Esta quantificação pode ser feita dos
espectrofotometria ou por eletroforese em gel de agarose. Verificada a pureza do DNA extraído por
estas duas técnicas, o mesmo pode ser utilizado em diversos experimentos, entre eles:
processamento com enzimas de restrição, ensaios de hibridização, amplificação, clonagem entre
outros.
REFERÊNCIAS
ALBERTS, B. Biologia molecular da célula. 4. ed. São Paulo: Artmed, 2004.
BROWN, T. A. Clonagem gênica e análise de DNA: uma introdução. 4. ed. Porto Alegre: Artmed,
2003.
COX, M. M.; DOUDNA, J. A.; O’DONNELL, M. Biologia molecular: princípios e técnicas. Porto
Alegre: Artmed, 2012.
FARAH, S. B. DNA: segredos e mistérios. 2. ed. São Paulo: Savier, 2000.
KLUG, W. S. et al. Conceitos de genética. 9. ed. Porto Alegre: Artmed, 2010.
KREUZER, H.; MASSEY, A. Engenharia genética e biotecnologia. Porto Alegre: Artmed, 2002.
WATSON, J. D. et al. DNA recombinante: genes e genomas. 3. ed. Porto Alegre: Artmed, 2009.
BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 2
Profª Daniele Dietrich Moura Costa
CONVERSA INICIAL
Na aula anterior, aprendemos como extrair o material genético, seja ele DNA ou RNA, de
diferentes tipos de materiais (tecidos biológicos, sangue, urina, células em cultivo etc.). Uma vez
extraído, esse material precisa ser quantificado para que possa ser utilizado em diversos tipos de
ensaios. Os dois principais métodos de quantificação são a eletroforese em gel de agarose e a
espectrofotometria.
Conhecida a quantidade de DNA ou RNA, estes podem então ser processados e analisados por
diferentes técnicas. Uma das técnicas mais utilizadas é o processamento utilizando enzimas de
restrição. Essas enzimas reconhecem segmentos específicos do DNA, clivando a dupla fita e
gerando fragmentos. Esses fragmentos podem ser então utilizados numa ampla gama de testes
moleculares, entre eles a clonagem de DNA, diferentes tipos de reação de amplificação de DNA por
reação em cadeia da polimerase (PCR – polymerase chain reaction) e sequenciamento de DNA.
Nesta aula, iremos explorar mais algumas técnicas de processamento e análise de DNA
(lembrando que algumas técnicas já foram descritas na aula anterior). Demonstraremos também
aplicações práticas dessas técnicas na rotina do biomédico e por fim, na última aula sobre
biotecnologia, abordaremos técnicas de expressão, purificação e análise de proteínas, encerrando
nosso ciclo de aprendizagem sobre técnicas moleculares de análises de macromoléculas aplicadas
à Biotecnologia.
TEMA 1 – CLONAGEM DO DNA
A primeira técnica de duplicação de moléculas de DNA em laboratório foi a clonagem de DNA.
Nesse procedimento, fragmentos específicos de DNA, obtidos por meios de técnicas utilizando
enzimas de restrição, são inseridos em bactérias (procariotos) ou leveduras (eucariotos). O
procedimento de inserção de fragmentos específicos de DNA (correspondentes a genes específicos)
em organismos é denominado transformação genética e origina organismos modificados
geneticamente ou transgênicos. No caso dos organismos modificados geneticamente, a inserção do
gene é feita entre indivíduos da mesma espécie, ou seja, eu retiro o gene de interesse do indivíduo 1
da espécie A e insiro no indivíduo 2 também da espécie A. No caso dos transgênicos, o gene é
transferido entre espécies distintas; eu retiro o gene 1 da espécie A e insiro o gene 1 na espécie B,
sendo a espécie B a transgênica. Esse processo é chamado transformação por causa das novas
características que podem ser adquiridas pela bactéria com a introdução do novo gene (como a
resistência a determinados antibióticos).
O gene inserido é incorporado ao DNA plasmidial do organismo receptor (bactéria), e quando
este for realizar a replicação do seu material genético, irá replicar também o DNA inserido no
plasmídio. Devemos nos lembrar que procariotos se reproduzem muito rapidamente, dessa forma, a
replicação do gene inserido também é muito rápida, gerando inúmeras cópias ou clones desse gene.
Nessa técnica, o DNA é retirado de um organismo doador por meio de técnicas de extração de
DNA já descritas na última aula. Esse DNA isolado é então digerido por endonucleases de restrição, e
os fragmentos gerados que contêm os genes de interesse são ligados a um vetor de clonagem,
geralmente um plasmídeo. Um vetor de clonagem é uma estrutura de DNA com capacidade de se
introduzir em células bacterianas, um processo conhecido como transfecção.
A união do gene de interesse, extraído da amostra e do plasmídeo (vetor), forma uma molécula
de DNA recombinante. Esse DNA recombinante é inserido na bactéria/levedura por meio da técnica
de transformação. Quando esse organismo se replicar, ele irá replicar também o DNA inserido.
O conjunto dos fragmentos de DNA digeridos pela enzima de restrição e ligados aos vetores, que
foram transferidos e replicados pelo procarioto, constitui uma biblioteca genômica, ou seja, uma
biblioteca de genes. Se, ao invés do DNA, utilizarmos um RNAm nesse procedimento, convertendo-o
em DNA complementar (cDNA) antes de realizar a transformação bacteriana, teremos uma biblioteca
de expressão gênica, que corresponde aos mRNAs que são expressos pela célula doadora.
Observe, na Figura 1, a técnica de clonagem de DNA por meio do uso de DNA recombinante. Em
1, o DNA é extraído da célula doadora e tratado com enzimas de restrição a fim de se isolar os genes
específicos. Simultaneamente (ainda em 1), o plasmídio é extraído da bactéria. Em 2, ocorre a
formação do DNA recombinante, no qual o DNA da célula doadora é unido ao DNA plasmidial. Em 4,
há o processo de transformação, no qual o plasmídio contendo o DNA recombinante é inserido
novamente na bactéria. Em 5, observe o processo de clonagem do DNA, sendo que, ao replicar o seu
próprio material genético (que inclui o plasmídio), a bactéria replica também o DNA da célula
doadora.
Figura 1 – Clonagem do DNA
Créditos: Why Design/Shutterstock.
TEMA 2 – REAÇÃO EM CADEIA DA POLIMERASE
Conhecendo o processo de replicação do DNA e o papel primordial da DNA polimerase (DNApol)
neste processo, em 1983, Karry Mullis desenvolveu a primeira técnica de multiplicação de moléculas
de DNA em laboratório, a PCR (Reação em cadeia da polimerase; do inglês polymerase chain
reaction).
A PCR consiste na síntese enzimática de fragmentos de DNA, em laboratório, sem a necessidade
de uma célula hospedeira como ocorria na clonagem. O DNA é obtido de uma célula doadora,
extraído e tratado com enzimas de restrição. Os fragmentos de DNA gerados pelos endonucleases
são então utilizados na reação de PCR.
2.1 PRINCÍPIOS PCR
A PCR é uma técnica que ocorrenas seguintes etapas sequenciais: desnaturação (separação
das duplas fitas de DNA), anelamento (hibridação de primers) e polimerização (também chamadas
de extensão ou elongação). A desnaturação consiste na separação das duplas fitas dos fragmentos
de DNA parental (obtido da célula doadora) utilizando altas temperaturas (acima de 90 oC). Essas
temperaturas são capazes de romper as ligações de hidrogênio que mantêm as duas fitas unidas. Na
etapa de anelamento, a temperatura é reduzida para cerca de 60 oC (temperatura ideal para que
ocorra o anelamento dos primers) e dois oligonucleotídeos iniciadores são adicionados à reação.
Esses oligonucleotídeos são denominados primers e são complementares a sequências de DNA de
cada uma das fitas parentais, ligando-se a elas por meio da complementaridade de bases.
Em razão da característica antiparalela da dupla fita de DNA, é citado que um primer se liga na
extremidade 3’ da região-alvo (primer direto ou forward), enquanto o outro se liga na extremidade 5’,
na fita oposta (primer reverso ou reverse). Os primers fornecem extremidades 3´OH livres que, na
etapa de polimerização, são utilizadas pelas DNA polimerases para sintetizar novas fitas de DNA,
obedecendo ao princípio da complementaridade de bases. A temperatura é então elevada para cerca
de 72 °C e a DNA polimerase promove a ligação fosfodiéster entre o último nucleotídeo da nova fita e
nucleotídeo trifosfatado a ser adicionado.
Essas três etapas são repetidas por inúmeros ciclos, sendo que a cada ciclo ocorre a duplicação
de uma molécula de DNA, gerando ao final dos ciclos várias cópias da molécula de DNA parental.
O equipamento no qual a PCR é realizada chama-se termociclador, pois ele tem a capacidade de
realizar os ciclos de variação de temperatura necessários para as etapas de desnaturação e
anelamento. Os microtubos contendo os reagentes necessários para que ocorra a reação enzimática
são colocados no termociclador, o qual realiza sozinho o processo de elevação e redução sequencial
da temperatura. Os reagentes utilizados nesse processo são: água ultrapura, moléculas de DNA a
serem duplicadas (DNA molde ou DNA parental), desoxirribonucleotídeos trifosfatos (dNTPs,
necessários para permitir a elongação do DNA), primers, enzima DNA polimerase, solução de cloreto
de magnésio (cofator da enzima DNA polimerase) e solução tampão para a DNA polimerase. A DNA
polimerase usada na reação é isolada da bactéria Thermus aquaticus, e por isso é chamada de Taq
polimerase (em menção às iniciais do nome da espécie a partir da qual foi obtida). Esta é a DNA
polimerase ideal, pois diferentemente das demais, ela não sofre desnaturação em altas
temperaturas.
Obviamente que todo esse processo requer o conhecimento prévio da sequência de DNA que se
quer amplificar, pois é necessário que os primers sejam complementares a tal sequência. Tal
conhecimento é altamente difundido e está presente nas inúmeras bibliotecas genômicas
disponíveis on-line.
Na Figura 2, a seguir, observe a reação em cadeia da polimerase. Em azul, a dupla fita de DNA;
em verde, os primers iniciadores e em amarelo, os nucleotídeos necessários para a síntese e novas
cadeias de DNA. Na etapa de desnaturação, a dupla fita de DNA é aberta por elevação da
temperatura. Na etapa de anelamento, a temperatura é reduzida e os primers pareiam com as fitas
simples de DNA. Na etapa de elongação, a temperatura é elevada a 72 oC, que é a ideal para que a
Taq polimerase sintetize novas cadeias de DNA.
Figura 2 – Reação em cadeia da polimerase
Créditos: WhiteDragon/Shutterstock.
2.2 TIPOS PCR – PCR MULTIPLEX
2.2.1 PCR MULTIPLEX
Neste tipo de PCR, mais de um fragmento de DNA e mais de um par de primers são utilizados
simultaneamente, promovendo a amplificação de vários fragmentos de DNA em um mesmo tubo
numa só reação. No caso de genomas pequenos como os dos vírus e bactérias, essa técnica
apresenta elevada especificidade, permitindo a identificação precisa desses organismos e
eliminando riscos de falsos positivos.
2.2.2 RT-PCR
Este é o tipo de PCR feito a partir de moléculas de RNA mensageiro com o auxílio da enzima
transcriptase reversa (RT – reverse transcriptase). Nesse ensaio, os RNAm totais são extraídos de
uma amostra e convertidos em DNA complementar (cDNA) pela transcriptase reversa. Esse cDNA é
então submetido aos ciclos de amplificação por PCR. Esse tipo de PCR é utilizado para avaliar a
expressão gênica.
Na Figura 3, observe que o mRNA é convertido em cDNA pela enzima transcriptase reversa. Esse
cDNA é então submetido a diversos ciclos de amplificação utilizando o termociclador. Ao final de
vários ciclos, várias cópias do cDNA são obtidas.
Figura 3 – RT-PCR
Créditos: DAntes Design/Shutterstock.
2.2.3 NESTED PCR
Esta técnica, em vez de um par de primers, utiliza dois pares de primers complementares à
sequência-alvo de DNA, aumentando a sensibilidade da técnica. Inicialmente, é realizada a
amplificação com o par mais externo e, posteriormente, o produto dessa PCR é amplificado com um
par interno ao primeiro (aninhado), que utilizará os fragmentos multiplicados na primeira reação
como molde.
Nesta técnica, realizam-se dois ensaios consecutivos de PCR. No primeiro, um fragmento de
DNA é amplificado com um par de primers. Uma alíquota desses DNAs amplificados inicialmente é
então submetida a um novo ciclo de PCRs, utilizando-se um novo par de primers, localizados
internamente em relação à posição do par de primers inicialmente utilizados.
2.2.4 PCR EM TEMPO REAL
Essa reação de PCR é muito similar a uma PCR convencional, porém a ela é adicionado um
primer que sofre anelamento com a parte média do fragmento de DNA a ser amplificado. Esse primer
extra é denominado sonda e contém, em uma extremidade, uma molécula fluorescente (fluoróforo) e,
na outra extremidade, uma molécula inibidora. Na sonda íntegra, a molécula inibidora impede a
emissão de fluorescência. Durante a etapa de elongação da PCR, a sonda hibridiza-se ao DNA-alvo e
sua região inibidora é degradada pela atividade 5’-3’ exonuclease da enzima Taq polimerase, ativando
a sonda e resultando na emissão da fluorescência. A emissão de fluorescência é medida a cada
ciclo, permitindo acompanhar o seu aumento da fluorescência ao longo da reação, geralmente por
um computador acoplado ao termociclador (por isso, a denominação em tempo real).
A quantidade de fluorescência emitida pela reação irá aumentar conforme as moléculas são
sintetizadas, sendo proporcional à quantidade inicial de DNA-alvo, ou seja, quanto mais DNA houver
no começo da reação, maior a fluorescência detectada a cada ciclo. A técnica de PCR em tempo real
permite a quantificação precisa de moléculas de DNA e tem sido utilizada para a quantificação de
patógenos virais e bacterianos em amostras biológicas, na genotipagem de variantes genéticas, na
avaliação dos níveis de expressão gênica e na detecção de produtos transgênicos em alimentos.
Observe, na Figura 4, que o DNA é inicialmente desnaturado por aumento da temperatura (ou
seja, tem suas duplas fitas separadas). Esse DNA desnaturado sofre então o anelamento com os
primers e também se liga à sonda fluorescente. À medida que a Taq polimerase sintetiza a nova
cadeia de DNA, ela degrada a sonda, que então passa a liberar sua fluorescência que pode ser
medida pelo termociclador.
Figura 4 – PCR em tempo real
Créditos: DAntes Design/Shutterstock.
TEMA 3 – SEQUENCIAMENTO DE DNA
O sequenciamento de DNA ou RNA é a técnica por meio da qual a sequência exata de
nucleotídeos dessas moléculas é desvendada. Essa técnica possui diversas aplicações, desde a
identificação de genes de organismos patogênicos até o sequenciamento completo do genoma
humano.
Na década de 1970, Frederick Sanger e colaboradores desenvolveram a técnica que tornou
possível sequenciar fragmentos de DNA. O método consiste na incorporação aleatória de
dideoxinucleotídeos trifosfatos (ddNTPs), em uma fita de DNA, pela enzima DNA polimerase,seguindo os princípios da replicação do DNA. Os ddNTPs, ao contrário dos deoxinucleotídeos
trifosfatados (dNTPs), não possuem em sua estrutura uma hidroxila na posição 3’. Assim, a síntese
da fita de DNA é paralisada sempre que a DNA polimerase incorpora uma ddNTP na nova fita,
produzindo fragmentos de DNA de tamanhos distintos. Dessa forma, a técnica consiste na produção
de fragmentos de DNA que diferem em um nucleotídeo um do outro, utilizando como molde uma fita
simples de DNA. A utilização do primer complementar determina qual a sequência de DNA que será
produzida.
A reação se inicia com a desnaturação de um fragmento de DNA dupla fita de DNA, formando
uma simples fita. A reação requer a presença de uma DNA polimerase, primers iniciadores, altas
concentrações de dNTPs e baixas concentrações de ddNTPs. À medida que a reação ocorre, a DNA
polimerase vai elongando a cadeia de DNA usando os dNTPs que estão em concentração maior; em
um dado momento, um ddNTP é incorporado aleatoriamente à cadeia em elongação e a
polimerização é interrompida. Cada um dos ddNTPs (adenina, citosina, guanina e timina) são
marcados diferencialmente, cada um com uma cor de fluorescência. Os fragmentos truncados são
então separados em gel de poliacrilamida e analisados quanto aos seus tamanhos e composição da
fluorescência.
Essa técnica era inicialmente manual, o que consumia muito tempo, dinheiro e esforços dos
envolvidos. Os equipamentos mais atuais utilizam capilares finos dentro dos quais os fragmentos de
DNA são separados por tamanho, do menor para o maior, sendo então, ao final da eletroforese
capilar, detectados por um feixe de laser. Cada um dos 4 nucleotídeos usados nessa síntese
(Adenina, Timina, Guanina e Citosina) são marcados com fluoróforos distintos, o que permite
identificar qual foi o nucleotídeo adicionado ao final de cada fragmento de DNA. A ordem em que os
diferentes fragmentos passam pelo detector de fluorescência indica a sequência dos nucleotídeos
da cadeia complementar ao DNA molde, determinando assim a sequência original.
TEMA 4 – MARCADORES MOLECULARES
Um marcador molecular é qualquer característica molecular (DNA, RNA ou proteínas), que gere
um dado fenótipo expresso de forma diferencial entre indivíduos da mesma espécie. Os marcadores
moleculares são técnicas baseadas em biologia molecular utilizadas para avaliar variações nas
sequências de DNA, permitindo a identificação de indivíduos, diferenciação de espécies e variantes
de uma mesma espécie e identificação de alterações relacionadas a doenças.
4.1 RFLP
A técnica RFLP (Polimorfismos no comprimento de fragmentos por restrição - Restriction
Fragment Length Polymorphism) refere-se à identificação de polimorfismos no DNA. Apesar de todos
os indivíduos da mesma espécie possuírem o mesmo genoma, eles apresentam variações
individuais denominadas polimorfismos. Os polimorfismos são responsáveis não apenas pelas
características individuais de cada pessoa, mas também pelas características étnicas de populações
e mais recentemente têm sido descritos como promotores ou supressores de doenças.
A presença ou ausência de determinadas sequências de DNA faz com que, ao ser tratado com
uma enzima de restrição, o DNA gere uma gama diferente de fragmentos em cada indivíduo.
Tomemos como exemplo os indivíduos A e B, que serão submetidos à técnica de RFLP para
avaliação de polimorfismos relacionados a genes promotores de câncer de tireoide. Embora ambos
tenham o mesmo genoma, possuem variações individuais. Entre essas variações, está a presença ou
não de alelos relacionados à maior ocorrência de câncer de tireoide. O DNA de ambos indivíduos é
extraído e então tratado com enzimas de restrição que clivam especificamente regiões que contêm
esses promotores tumorais.
Desse modo, como seus DNAs possuem polimorfismos, o tratamento com as enzimas irá
resultar em fragmentos diferentes para cada indivíduo: o indivíduo que tem o promotor possuirá um
fragmento de DNA correspondente a esse promotor; já o indivíduo que não tem o promotor não
possuirá o fragmento de DNA correspondente a esse promotor, dado que a enzima de restrição não
encontrou o sítio específico para sua ação. Esses fragmentos, quando separados por eletroforese,
irão gerar um padrão distinto em cada pessoa, permitindo sua identificação.
Para efetuar a detecção dos marcadores RFLP, os fragmentos separados no gel de agarose pela
eletroforese são transferidos para uma membrana de nylon (ou nitrocelulose) pela técnica de
Southern Blot, descrita na aula anterior. Os fragmentos são então identificados pelo uso de sondas
específicas. Dessa maneira, busca-se reconhecer modificações do DNA que possam estar presentes
dentro da sequência de reconhecimento das enzimas de restrição. Então, um indivíduo que apresente
uma modificação no genoma que impossibilite a clivagem por determinada enzima de restrição pode
ser identificado por meio da comparação com outro da mesma espécie e que não apresente essa
modificação, o que não impossibilita a clivagem do DNA.
4.2 MICROSSATÉLITE
Os microssatélites são também denominados de repetições de sequências simples (do inglês
SSR, simple sequence repeats) ou repetições em tandem. Os microssatélites são pequenos
segmentos do DNA que se repetem continuamente ao longo de uma molécula de DNA e o número de
repetições varia de indivíduo para indivíduo. Baseado nesse conhecimento, surge a técnica do DNA
fingerprint (ou impressão digital do DNA), dado que a análise do número de repetições de cada uma
destas sequências permite identificar uma pessoa.
Inicialmente, deve ser obtida uma amostra biológica (sangue, sêmen, saliva, tecidos, cabelos
com bulbo capilar etc.) e o DNA deve ser extraído dela. Após a extração do DNA, faz-se o uso de
enzimas de restrição para a obtenção de fragmentos específicos e de diferentes tamanhos do DNA.
Esses fragmentos são então submetidos à PCR e posteriormente à eletroforese, conforme descrito
na última aula, e então analisados. O perfil de bandas formadas será específico para cada indivíduo,
dado que os fragmentos formados pelas enzimas de restrição, os microssatélites, têm quantidade
variável de indivíduo para indivíduo.
Apesar de todas as vantagens e aplicabilidades que os marcadores SSR apresentam, a grande
limitação reside na necessidade do isolamento e desenvolvimento de primers específicos para cada
espécie, ou ter disponível primers de espécies relacionadas para testar transferabilidade, problema
que foi resolvido com a criação da técnica RAPD descrita a seguir.
4.3 RAPD (RANDOM AMPLIFIED POLYMORFIC DNA)
Este é um método de análise de polimorfismos baseado na PCR e envolve a amplificação de
vários lócus do genoma utilizando primers de sequência arbitrária. Um primer de sequência arbitrária
é um primer mais curto desenhado de forma aleatória, sem que se conhecesse previamente a
sequência que se desejava amplificar. Lembre-se que para a PCR convencional, era necessário
conhecer a sequência de DNA a ser amplificada para então desenhar um primer específico para essa
sequência. A amplificação ao acaso de sequências de DNA deu nome à técnica, DNA polimórfico
amplificado ao acaso (do inglês Random Amplified Polymorfic DNA). A grande vantagem dessa
técnica é permitir o estudo de espécies que não têm seu genoma disponível em bancos de dados.
Os polimorfismos RAPD resultam da variação da sequência nos locais de anelamento do primer
e/ou variação de comprimento na sequência-alvo situada entre os locais de ligação do primer. O
RAPD é uma técnica não radioativa que requer uma pequena quantidade de DNA (15-25 ng), a maior
vantagem dessa técnica em relação à técnica de RFLP, e pode ser realizado em poucas horas. Seu
grande problema é a baixa taxa de reprodutibilidade interlaboratórios.
TEMA 5 – APLICAÇÕES DA ANÁLISE DO DNA
5.1 EXAME DE DNA: TESTE DE PATERNIDADE E GENÉTICA FORENSE
Os testes de paternidade e a identificação forense de criminosos se baseiam na técnica demicrossatélite. No caso dos testes de paternidade, devemos lembrar que cada indivíduo possui
polimorfismos específicos daquela pessoa, ou seja, o número de repetições das sequências
microssatélite é individual. A denominação impressão digital do DNA (DNA fingerprinting) foi
estabelecida justamente em referência à impressão digital, anteriormente única utilizada na
identificação humana.
Além disso, essas sequências satélite possuem herança mendeliana, fazendo com que a prole
tenha metade das sequências provenientes do pai e a outra metade proveniente da mãe. Ao realizar
um teste de paternidade, metade das sequências do filho deve corresponder às do suposto pai e a
outra metade da mãe. Já no caso de crimes, compara-se a sequência de um suspeito com amostras
encontradas na cena do crime (por exemplo, compara-se o sangue do suspeito com sêmen
encontrado em vítimas de estupro). Para que o suspeito seja considerado culpado, deve haver 100%
de correspondência entre o seu padrão de microssatélites e o padrão encontrado na cena do crime,
indicando se tratar da mesma pessoa.
5.2 DIAGNÓSTICOS DE DOENÇAS GENÉTICAS
Sabemos que as proteínas são essenciais para o correto funcionamento das células e de todo o
organismo. A falta de uma proteína ou a presença de uma proteína defeituosa pode ser a
responsável por inúmeras doenças como, por exemplo, anemia falciforme ou tirosinemia. Mas qual é
a relação do DNA com essas doenças? É que ele, por meio dos processos de transcrição e tradução,
comanda a formação das proteínas. A ausência de um gene específico acarreta a não produção da
proteína ou a mutação desse gene acarreta a produção de uma proteína não funcional.
Tanto o sequenciamento quanto reações baseadas em PCR ou hibridação molecular podem ser
usados para se fazer o diagnóstico de doenças moleculares. No caso do sequenciamento, a
sequência de DNA de um indivíduo portador da doença pode ser comparada com a sequência de
indivíduos normais ou com a sequência de banco de dados. Conhecendo a sequência do gene
causador da doença, é possível também desenvolver primers para a amplificação total ou parcial do
gene por PCR e também a clivagem por enzimas de restrição.
Imagine uma doença X, cuja mutação causadora já seja bem descrita. Nesse caso, é possível
coletar uma amostra de sangue de um paciente e extrair o DNA, processá-lo com enzimas de
restrição e comparar o resultado dos fragmentos em gel de agarose com o de um indivíduo normal.
O indivíduo doente possui uma mutação no sítio de restrição da enzima e, portanto, não sofre
clivagem; já o indivíduo normal não tem essa mutação e a clivagem ocorre normalmente, gerando um
fragmento específico. Ao comparar os géis de agarose de ambos pacientes, o indivíduo normal irá ter
uma banda correspondente ao fragmento gerado, enquanto o indivíduo doente não terá essa banda.
5.3 DIAGNÓSTICO DE DOENÇAS INFECCIOSAS
A maioria das doenças infecciosas, como por exemplo a covid-19 ou a tuberculose, são
causadas por patógenos que já possuem seu genoma bem descrito em bancos de dados.
Conhecendo-se o genoma de uma espécie, é possível selecionar alguns genes de interesse e
desenhar primers específicos para determinados fragmentos de DNA. Quando se suspeita da
infecção por esse patógeno, materiais biológicos adequados devem ser coletados (no caso da covid-
19, são amostras de naso e orofaringe, e no caso da tuberculose, é escarro pulmonar) e a presença
do material genético desses patógenos pode ser avaliada por técnicas baseadas em PCR. Além
disso, a PCR permite identificar variantes desses patógenos, bem como a possível resistência a
antibióticos no caso de bactérias. A PCR em tempo real é o método que mais tem sido utilizado para
a quantificação de diferentes agentes infecciosos, permitindo a obtenção de resultados sensíveis e
precisos.
NA PRÁTICA
Em tempos de pandemia, muito tem se falado sobre os testes para a detecção do coronavírus.
Mas e você, sabe a diferença entre eles? Sabe quando aplicar e quando indicar cada um deles?
Existem dois tipos principais de testes: o sorológico e o PCR. O teste sorológico consiste na
detecção de anticorpos contra o Sars-CoV-2 no sangue dos pacientes. Ou seja, esse teste detecta se
uma pessoa já teve contato com o vírus no passado e, portanto, desenvolveu memória imune. É
indicado para pesquisas epidemiológicas, para saber se a pessoa teve ou não o vírus, mesmo tendo
sido assintomático.
O teste de RT-PCR é feito através de um swab nasal. Nesse caso, coletam-se amostras na naso e
orofaringe que são processadas pela técnica de RT-PCR, já que o coronavírus é um vírus de RNA.
Essa técnica permite a identificação do material genético do vírus, indicando se uma pessoa está ou
não contaminada pelo Sars-CoV-2 naquele exato momento. Por detectar o material genético do vírus,
esse teste é chamado de detecção de antígeno (diferentemente do teste sorológico, que é de
detecção de anticorpo). É indicado quando há suspeita clínica de que os sintomas que um paciente
apresenta sejam devido ao vírus.
FINALIZANDO
O passo essencial para o estudo do DNA/RNA é sua obtenção a partir de amostras biológicas.
Essa obtenção depende de um protocolo de extração, que deve ser adequado ao tipo de material
genético (se DNA ou RNA) e compatível com a realidade de cada laboratório. Uma vez obtido, esse
material serve para uma gama de análises experimentais. Na aula anterior, vimos como extrair esse
DNA e algumas técnicas para processá-lo e analisá-lo, como o processamento por enzimas de
restrição e técnicas de hibridização. Nesta aula, vimos o uso de DNA para sequenciar o genoma de
uma espécie, técnicas de amplificação de fragmentos de DNA obtidos por enzimas de restrição e
técnicas de análises de marcadores moleculares. Por fim, encerramos nosso estudo sobre os ácidos
nucleicos falando de algumas aplicações possíveis de todas essas análises no dia a dia do
biomédico. Na terceira e última aula deste módulo do curso de Biotecnologia e Bioinformática,
abordaremos as técnicas de manipulação e análise de proteínas.
REFERÊNCIAS
ALBERTS, B. et al. Biologia molecular da célula. 4. ed. São Paulo: Artmed, 2004.
AZEVEDO, M. de O. et al. Técnicas básicas em biologia molecular. Brasília: Editora UnB, 2003.
BROWN, T. A. Clonagem gênica e análise de DNA: uma introdução. 4. ed. Porto Alegre: Artmed,
2003.
COX, M. M.; DOUDNA, J. A.; O’DONNELL, M. Biologia molecular: princípios e técnicas. Porto
Alegre: Artmed, 2012.
FARAH, S. B. DNA: segredos e mistérios. 2. ed. São Paulo: Savier, 2000.
HAUSMANN, R. História da biologia molecular. 2. ed. Ribeirão Preto:
Funpec–RP, 2002.
KLUG, W. S. et al. Conceitos de genética. 9. ed. Porto Alegre: Artmed, 2010.
KREUZER, H.; MASSEY, A. Engenharia genética e biotecnologia. Porto Alegre: Artmed, 2002.
MICKLOS, D. A.; FREYER, G. A.; CROTTY, D. A. A ciência do DNA. 2. ed. Porto Alegre: Artmed,
2005.
RUMJANEK, F. D. Introdução à biologia molecular. Rio de Janeiro: Âmbito Cultural, 2001.
ZAHA, A.; FERREIRA, H. B.; PASSAGLIA, L. M. P. Biologia molecular básica. 3. ed. Porto Alegre:
Mercado Aberto, 2003.
BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 3
Profª Daniele Dietrich Moura Costa
CONVERSA INICIAL
Até agora, tínhamos estudado os ácidos nucleicos, como extraí-los e analisá-los. É sabido que o
DNA é um repositório quase que estático de informação genética, exceto pela ocorrência de algumas
mutações. Como então que esse repositório é capaz de comandar diversas funções celulares? A
resposta está no Dogma Central da Biologia Molecular, segundo o qual o DNA é transcrito em RNA e
este é traduzido em proteínas. As proteínas são as grandes efetoras das células; são elas que
catalisam reações, têm funções estruturais, funções imunológicas, conferem características
fenotípicas e uma gama de outras funções já conhecidas por você aluno.
Uma proteína é formada basicamente por uma estrutura linear de aminoácidos ligados entre si
por ligações peptídicas. Esses aminoácidos se organizamno espaço conferindo uma estrutura
tridimensional às proteínas que, em última instância, é essencial para o funcionamento correto das
mesmas. A Biotecnologia, ao trabalhar com proteínas, deve primeiramente ser capaz de removê-las
das células e isolá-las, sendo esses procedimentos conhecidos como lise celular e
purificação/extração proteica respectivamente. Outra meta é descobrir a sequência de aminoácidos e
como essa sequência interfere na conformação espacial da proteína, conhecimento que pode ser
obtido por meio do sequenciamento de aminoácidos e de espectrometria de massa. Além disso,
técnicas como SDS-PAGE (uni ou bidimensional) associadas a Western Blot podem separar e
identificar alvos proteicos com precisão por meio de imunoensaios. Por fim, técnicas como a
cristalografia de raios X e a ressonância magnética nuclear permitem identificar a estrutura
tridimensional dessas moléculas. Ao longo desta aula, descreveremos cada uma dessas técnicas e
suas aplicações para o biomédico.
TEMA 1 – TÉCNICAS DE SEPARAÇÃO E PURIFICAÇÃO DE PROTEÍNAS
1.1 RECONHECIMENTO E EXTRAÇÃO PROTEICA
Cada célula possui em sua composição bioquímica básica ácidos nucleicos, lipídeos,
carboidratos e proteínas. O genoma humano contém mais de 3 milhões de pares de bases e cerca de
40.000 genes descritos. No entanto, a quantidade de proteínas pode ser muito superior à de genes
devido à possibilidade de modificações pós-transcricionais e pós-traducionais. Cada célula é
composta exatamente pelo mesmo DNA, logo o que difere entre um neurônio e um miócito são as
proteínas que esses tipos celulares são capazes de expressar. De fato, uma célula expressa uma
gama enorme de proteínas. Como então reconhecer uma proteína de interesse? Diversos ensaios
bioquímicos permitem reconhecer proteínas específicas por meio de suas propriedades intrínsecas.
Por exemplo, para uma proteína com função enzimática, um ensaio que meça a conversão de
reagentes em substratos pode ser uma boa opção para reconhecer esta proteína.
A partir do momento em que já temos certeza que a proteína de nosso interesse está presente
em uma amostra ou tipo celular, é necessário agora remover essa proteína das células, num
processo conhecido como lise celular. A lise permite que as proteínas sejam liberadas das células
para que então sejam purificadas. Inicialmente, as células podem ser rompidas por homogeneização
mecânica ou por sonicação utilizando-se um tampão adequado. Esse tampão deve conter
detergentes capazes de solubilizar os lipídeos de membrana, inibidores de proteases que impeçam
essas enzimas de degradar as proteínas da amostra e um regulador de pH a fim de manter as
proteínas estáveis em solução. Além disso, a temperatura de manuseio das amostras deve ser
mantida sempre baixa, a fim de se evitar a desnaturação proteica. O homogenato celular corresponde
a uma sopa de proteínas e restos celulares que deve então ser centrifugado. O pellet resultante
contém restos celulares, enquanto o sobrenadante contém as proteínas e deve ser separado para um
novo tubo. Etapas adicionais de centrifugação em diferentes velocidades podem ser realizadas a fim
de se removerem outros componentes como ácidos nucléicos e lipídeos.
1.2 PURIFICAÇÃO PROTEICA
A purificação de uma proteína é o primeiro passo essencial para que se possa estudar sua
estrutura e função. Diversas técnicas podem ser aplicadas para essa finalidade, e as proteínas
podem ser separadas com base na sua solubilidade, carga, tamanho e ligação com outras
moléculas. Em geral, ocorre a associação de técnicas com o intuito de se obter uma amostra mais
pura da proteína de interesse.
1.2.1 Salting out
Salting out faz referência ao fato de a maioria das proteínas serem insolúveis em altas
quantidades de sal. Cada proteína específica sofre precipitação em uma quantidade de sal diferente,
logo é possível usar concentrações salinas específicas para promover a precipitação de proteínas de
interesse.
O sal mais usado é o sulfato de amônio, o qual é adicionado à solução de macromoléculas até
uma concentração bem próxima do ponto de precipitação da proteína de interesse. Após a
centrifugação, as proteínas precipitadas e não desejadas são descartadas e mais sal é adicionado ao
sobrenadante até uma concentração suficiente para precipitar a proteína desejada. Após uma
segunda centrifugação, a proteína é recuperada como precipitado e o sobrenadante é descartado.
Observe, na Figura 1, as etapas da purificação de proteínas por salting out. O primeiro tubo
contém a solução contendo a proteína de interesse (proteína alvo em verde), demais proteínas e sal.
No segundo tubo, as proteínas que não eram alvo da reação sofreram precipitação devido à alta
concentração de sal. No terceiro tubo, a proteína-alvo é precipitada por interações com outras
concentrações salinas.
Figura 1 – Salting out
Crédito: Daniele Dietrich Moura Costa.
1.2.2 Diálise
A diálise é uma técnica que permite separar proteínas de acordo com seus tamanhos. Uma
membrana semipermeável porosa específica, chamada de membrana de diálise (ou saco de diálise),
é utilizada nesse processo. Cada membrana possui uma porosidade de um tamanho específico. As
proteínas são colocadas no interior do saco de diálise; proteínas com diâmetro inferior ao poro irão
atravessar a membrana, enquanto proteínas com diâmetro superior ao poro ficarão retidas dentro do
saco de diálise. Essa técnica é ótima para a remoção de pequenas moléculas contaminantes como
sais ou separar proteínas muito pequenas, mas sozinha não é o ideal para a separação de moléculas
maiores.
Observe, na Figura 2, a purificação por diálise. As proteínas (em verde e amarelo) são colocadas
no interior de um saco de diálise (em vermelho). O poro da membrana permite a passagem apenas
das proteínas em amarelo. Após algum tempo, as proteínas em amarelo podem ser encontradas na
solução, enquanto as proteínas em verde são mantidas dentro do saco de diálise.
Figura 2 – Diálise
Crédito: Daniele Dietrich Moura Costa.
1.2.3 Cromatografia de filtração em gel
As técnicas cromatográficas se baseiam em preencher uma coluna com um polímero, sendo que
as características do polímero irão determinar o tipo de cromatografia e a forma de separação da
proteína. Na maioria dos procedimentos cromatográficos, a mistura de proteínas a ser fracionada é
dissolvida em um líquido (a fase “móvel”), e esse líquido é passado através de uma coluna contendo
uma matriz sólida e porosa (a fase “estacionária” ou polímero). À medida que os solutos fluem pela
coluna, eles interagem com a fase estacionária e sua eluição (liberação da coluna) é retardada. Esse
retardamento depende das propriedades de cada soluto.
A cromatografia de filtração em gel é chamada também de peneiramento molecular ou exclusão
molecular e se baseia na separação de proteínas de acordo com seu tamanho molecular em uma
coluna de polímeros porosos. Primeiramente, a coluna é preenchida por um polímero adequado, e na
sequência, as amostras contendo as proteínas de interesse são colocadas no topo dessa coluna. As
moléculas menores são capazes de entrar dentro dos polímeros, enquanto as grandes ficam na
solução ao redor do polímero. Considerando-se que o procedimento está ocorrendo dentro de um
tubo de vidro que forma uma coluna, as moléculas maiores irão passar mais rápido por entre os
polímeros e sairão primeiramente da coluna de fracionamento, em sua parte inferior; enquanto as
moléculas menores que ficarem presas dentro do polímero irão migrar mais lentamente pela coluna,
demorando mais para sair dela.
Observe, na figura a seguir, um esquema geral de como ocorre a cromatografia em coluna.
Dentro da coluna de vidro, são adicionadas a fase móvel ou líquida, que contém as proteínas
(representadas por azul, vermelho e verde), e a fase sólida que contém os polímeros. A proteína em
verde tem maior massa molecular e, portanto, menor interação com o polímero, sendo liberada da
coluna mais facilmente. Jáa proteína em azul possui pequena massa molecular e interage
fortemente com os poros do polímero, tendo sua migração retardada ao longo da coluna, sendo a
última a ser eluída.
Figura 3 – Cromatografia
Crédito: DariaRen/Shutterstock.
1.2.4 Cromatografia de troca iônica
É um método de separação baseado na carga iônica da proteína. Proteínas com cargas positivas
podem ser purificadas utilizando-se colunas de cromatografia contendo polímeros de cargas
negativas; já proteínas de cargas negativas podem ser purificadas utilizando-se polímeros de cargas
positivas. A solução contendo inúmeras proteínas é colocada em contato com o polímero da coluna.
As proteínas de carga oposta ao polímero irão ficar ligadas a ele, enquanto as de mesma carga serão
lavadas da coluna. Posteriormente, as proteínas ligadas podem ser eluídas (liberadas) do polímero
com o uso de tampões contendo altas concentrações de sais que desfazem a interação proteína-
polímero.
1.2.5 Cromatografia de afinidade
Esta técnica se baseia na alta afinidade que algumas proteínas possuem por grupamentos
químicos ou moléculas específicas. Por exemplo, se eu desejo isolar uma proteína que atua como
um fator de transcrição de um dado gene, basta que eu acople esse gene ao polímero e realize a
reação. O fator de transcrição, por ter afinidade pelo gene, ficará ligado a ele na coluna, enquanto as
demais proteínas passam direto pela coluna sem interagir com o gene e o polímero. Posteriormente
o fator de transcrição é eluído da coluna através do uso de tampões de eluição, contendo altas
concentrações de sais. Ainda é possível utilizar um anticorpo específico para a proteína. Nesse caso,
o anticorpo é ligado ao polímero e ele realiza a captura das proteínas-alvo da solução.
Na Figura 4 a seguir, observe os tipos de cromatografia. Na primeira imagem à esquerda, está
representada uma cromatografia por gel filtração, na qual as proteínas de tamanho compatível ficam
aderidas aos poros do polímero. Na imagem do meio, está representada a cromatografia por
afinidade iônica, na qual proteínas de cargas positivas (em vermelho) ficam aderidas ao polímero de
cargas negativas. Na última imagem à direita, está representada a cromatografia por afinidade, na
qual anticorpos específicos são aderidos ao polímero e realizam a captura da proteína de interesse.
Figura 4 – Tipos de cromatografia
Crédito: Art of Science/Shutterstock.
1.2.6 Cromatografia líquida de alta pressão
Esta técnica, chamada de HPLC (high pressure liquid cromatography), é utilizada para melhorar a
qualidade e o rendimento de todos os tipos de cromatografia descritos anteriormente. Nessa técnica,
os polímeros que compõem a coluna são finamente divididos e há mais pontos de inserção para a
proteína, aumentando o poder de resolução da técnica. Como o material do polímero possui
granulometria mais fina, é necessário a aplicação de altas pressões para se manter o fluxo de
solução através da coluna.
TEMA 2 – SEQUENCIAMENTO DE AMINOÁCIDOS
Após a purificação de uma proteína, sua sequência primária de aminoácidos pode ser
determinada. A chave do sequenciamento é dividir a proteína em pequenos fragmentos menores
para que estes possam ser sequenciados e então unidos com auxílio da bioinformática. As
informações sobre a sequência primária (ou seja, a sequência linear de aminoácidos) de uma
proteína são essenciais para a compreensão de suas propriedades funcionais, para a sua
identificação, assim como para a caracterização de proteínas mutadas que causam doenças.
Conheça, na Figura 5, a estrutura das proteínas. As proteínas possuem uma conformação
primária que corresponde à sua sequência linear de aminoácidos. Essa sequência pode ser
determinada por técnicas como a reação de Edman ou por espectrometria de massa. As proteínas se
enovelam adquirindo uma conformação terciária que é essencial para o funcionamento das
proteínas. Essa conformação terciária pode ser estudada por técnicas como a ressonância
magnética nuclear e a cristalografia de raios X.
Figura 5 – Estrutura das proteínas
Crédito: N.Vinoth Narasingam/Shutterstock.
2.1 REAÇÃO DE EDMAN
O procedimento de degradação de Edman marca e remove apenas o resíduo aminoterminal de
um peptídeo, deixando todas as outras ligações peptídicas intactas. Essa reação consiste em
identificar de forma sequencial o aminoácido amino-terminal de uma cadeia polipeptídica. Nesse
procedimento, Pehr Edman estabeleceu um método de marcação do aminoácido amino-terminal e
clivagem deste sem romper as ligações peptídicas com os demais aminoácidos. Nessa reação,
utiliza-se o isotiocianato de fenila que reage com a amina-terminal neutra desse grupamento
formando o radical feniltiocarbamida. Com isso, libera-se um derivado cíclico do aminoácido amino-
terminal deixando o restante da proteína intacta. Esse derivado cíclico pode ser identificado
cromatograficamente.
O método de Edman pode ser repetido a cada peptídeo encurtado, produzindo um novo derivado
cíclico a cada etapa da reação, permitindo assim a identificação sequencial de todos os aminoácidos
que compõem a proteína. Um ciclo de degradação de Edman é composto pela clivagem de um
aminoácido e sua posterior identificação e demora cerca de 1 hora. As degradações repetidas
permitem a identificação da sequência de aminoácidos de uma proteína.
Em teoria, qualquer proteína poderia ser sequenciada por essa técnica, o que na prática não se
demonstrou verdadeiro, pois a etapa de liberação do composto cíclico não tem eficiência de 100% e
nem sempre o aminoácido amino-terminal libera o composto cíclico. Além disso, o tempo gasto em
cada etapa da reação tornaria o sequenciamento de proteínas muito grandes extremamente
demorado.
A técnica de degradação de Edman tem interesse, basicamente, histórico. A espectrometria de
massas costuma ser mais empregada atualmente para a obtenção simultânea da massa molecular e
da sequência dos polipeptídios. Ambas as técnicas podem ser aplicadas diretamente às proteínas ou
aos peptídeos recuperados da SDS-PAGE ou da eletroforese bidimensional em gel (IEF + SDS-PAGE).
2.2 SEQUENCIAMENTO USANDO ESPECTROMETRIA DE MASSA
Inicialmente a proteína de interesse, que já foi previamente purificada, deve ser digerida em
fragmentos menores com o uso de uma protease, em geral a tripsina. Lembrando que uma protease
é uma enzima capaz de clivar as ligações peptídicas, logo irá clivar a proteína (que é um
polipeptídeo) em fragmentos menores (pequenos peptídeos). A tripsina cliva especificamente a
cadeia de peptídeos na região carboxílica ao lado de lisinas e argininas. Antes de sua digestão, as
proteínas são tratadas com agentes desnaturantes (por exemplo o iodoacetato) que promovem a
redução das pontes dissulfeto. Os fragmentos peptídicos são separados por cromatografia e cada
fração do eluato é submetida separadamente à espectrometria de massa, que permitirá identificar
quais são os aminoácidos constituintes daquele fragmento.
Mas ainda resta uma dúvida: como ordenar os fragmentos peptídicos para obter a estrutura
primária da proteína original? Isso é feito utilizando-se a técnica da superposição de peptídeos.
Nessa técnica, a proteína purificada é tratada com uma outra protease, por exemplo a quimiotripsina,
que cliva os peptídeos ao lado de aminoácidos de cadeia lateral cíclica. Os peptídeos originados pela
quimiotripsina se superpõem aos peptídeos gerados pela tripsina, permitindo que sejam sobrepostos
com o auxílio de um computador, permitindo o ordenamento destes.
Figura 6 – Sobreposição e ordenamento de sequências peptídicas identificadas por espectrometria
de massa
Crédito: Daniele Dietrich Moura Costa.
TEMA 3 – SDS-PAGE E WESTERN BLOT
3.1 SDS-PAGE
A eletroforese em gel de poliacrilamida contendo dodecil sulfato de sódio (do inglês Sodium
Dodecyl Sulfate Poliacrylamide Gel Electroforesis) é uma técnica que permite a separação de
proteínas de acordo com sua massa molecular. Nessa técnica, as proteínas são preparadasem um
tampão contendo SDS (dodecyl sulfato de sódio), um reagente que confere cargas negativas às
proteínas. A separação eletroforética é executada em um gel que serve de peneira molecular,
acentuando a separação. Quando submetidas a um campo elétrico, essas proteínas carregadas
negativamente irão migrar em direção ao polo positivo. A migração acontece através da malha
porosa de um gel de poliacrilamida (um polímero de acrilamida e bisacrilamida). As proteínas
menores migram mais facilmente por esse gel, ocupando posições inferiores neste ao final da
corrida eletroforética. Já as proteínas maiores têm maior dificuldade em passar pelos poros da
malha do gel, ocupando posições superiores no gel ao final da corrida eletroforética. Moléculas de
tamanho e carga semelhantes movem-se como uma banda única no gel.
Além do SDS, as proteínas são tratadas também com um agente tiolíco, o beta mercaptoetanol,
que desnatura as pontes dissulfeto das proteínas, conferindo uma conformação linear a elas. A
conformação linear é essencial para que moléculas de mesma carga e massa molecular migrem
igualmente, sem “entalar” nos poros do gel.
Após a eletroforese, as bandas separadas podem ser visualizadas por uma técnica apropriada,
como mergulhar o gel em uma solução de um corante que se liga fortemente às proteínas, sendo os
mais utilizados o Comassie Blue e a prata. A prata é mais indicada para a detecção de proteínas
presentes em menores concentrações na amostra (cerca de 0,02 µg), enquanto o Comassie Blue
detecta proteína na ordem de 0,1 µg. A técnica de eletroforese seguida de coloração é tão precisa
que permite que proteínas com diferenças em torno de 10 aminoácidos (o que corresponde a 40
KDa) possam ser distinguidas após uma corrida eletroforética.
Observe, na Figura 7, o aparato de eletroforese ligado a uma fonte elétrica que cria um campo
elétrico com um polo negativo acima e um positivo abaixo.
Figura 7 – Aparato de eletroforese
Crédito: WhiteDragon/Shutterstock.
Na figura a seguir, a imagem à esquerda demonstra a aplicação das amostras nos poços do gel
com o auxílio de uma micropipeta. À direita o resultado final da corrida eletroforética, com as
proteínas menores ocupando posições inferiores e as maiores ocupando posições superiores.
Figura 8 – Corrida eletroforética
Crédito: Tali Lavy/Shutterstock.
3.2 WESTERN BLOT
As diferentes técnicas de imunoensaios se baseiam no uso de anticorpos que reconhecem
especificamente uma proteína de interesse (proteína-alvo). Esse tipo de ensaio é fundamental para
identificar alvos moleculares, como por exemplo proteínas relacionadas ao câncer, bem como para
entender as funções de uma proteína em seu contexto fisiológico.
Se um anticorpo para uma proteína específica estiver à disposição, ele poderá ser usado para
detectar de forma precisa a proteína separada anteriormente por SDS-PAGE na presença de muitas
outras proteínas, em processo conhecido como immunoblot ou Western Blot. Nessa técnica,
inicialmente as proteínas do gel devem ser transferidas para uma membrana de nitrocelulose. Isso
porque o gel é poroso e não permite que as reações com anticorpos sejam realizadas sobre ele. Uma
vez na membrana, utiliza-se um anticorpo específico para se ligar à proteína de interesse; esse
anticorpo é denominado de primário. Como podem ocorrer ligações inespecíficas mais fracas, a
membrana deve ser lavada com tampão, para que os anticorpos ligados inespecificamente se
desliguem. Ao final das lavagens, apenas os anticorpos primários ligados especificamente às
proteínas de interesse permanecem ligados. Para que a reação seja evidenciada, é necessária a
utilização de um anticorpo secundário. Esse segundo anticorpo possui duas características
essenciais: ele reconhece especificamente o anticorpo primário (mas não reconhece a proteína-alvo)
e possui em sua região FC uma enzima capaz de emitir luminosidade quando fornecido o substrato
adequado. O anticorpo secundário se liga ao primário e, ao se fornecer o substrato específico, todos
os secundários irão emitir uma luminosidade que pode ser captada por meio de filmes fotográficos.
A luminosidade será emitida especificamente para onde os anticorpos primários reconheceram e se
ligaram à proteína de interesse, evidenciando a presença da mesma na amostra.
Observe, na Figura 9, a reação de Western Blot (ou immunoblot). Em 1, as proteínas de interesse
(em laranja) ligadas à membrana de nitrocelulose. Em 2, anticorpos primários específicos (em azul
claro) reconhecem a proteína-alvo. Em 3, anticorpos secundários (em roxo) reconhecem os
anticorpos primários. Observe que os anticorpos secundários possuem uma enzima (em verde)
acoplada a sua região FC. Em 4, o substrato enzimático é fornecido e a reação emite um sinal que
pode ser detectado.
Figura 9 – Western Blot
Crédito: Soleil Nordic/Shutterstock.
TEMA 4 – ELETROFORESE BIDIMENSIONAL E ESPECTROMETRIA DE
MASSA
4.1 ELETROFORESE BIDIMENSIONAL
A eletroforese bidimensional consiste em uma etapa de focalização isoelétrica seguida de uma
etapa de SDS-PAGE convencional. A combinação dessas duas técnicas permite separar com maior
precisão as proteínas de uma amostra. A focalização isoelétrica consiste na separação das proteínas
de uma amostra baseadas no seu conteúdo de radicais ácidos e básicos. O ponto isoelétrico (pI) de
uma proteína é o pH no qual o balanço de cargas positivas e negativas é nulo. Uma dada proteína
migra ao longo de um gradiente de pH até atingir seu pI. A focalização isoelétrica permite separar
proteínas com diferenças em seus pIs de 0,01, ou seja, proteínas com apenas uma carga de
diferença podem ser distinguidas por essa técnica. A focalização ocorre sobre uma fita contendo um
gradiente de pH. Posteriormente à focalização, a fita de pH contendo as amostras focalizadas é
colocada no topo de um gel de poliacrilamida. Nessa segunda etapa, as proteínas (que foram
primeiramente separadas de acordo com seus pontos isoelétricos) serão separadas de acordo com
suas massas moleculares. Esta técnica é denominada de bidimensional, pois as proteínas são
separadas em duas dimensões perpendiculares entre si: a do ponto isoelétrico (horizontal) e a das
massas moleculares (vertical). Isso permite altíssima precisão, dado que duas proteínas não
possuem a mesma massa molecular e o mesmo ponto isoelétrico simultaneamente.
Observe na Figura 10, a seguir, à esquerda, a fita contendo um gradiente de pH sobre o qual
ocorre a focalização isoelétrica. Após a focalização, a fita de pH contendo as amostras de proteínas
focalizadas em seus devidos pIs é colocada em contato com o gel de poliacrilamida (à direita). Ao
final da corrida eletroforética, cada spot (mancha) representa uma proteína diferente.
Figura 10 – Eletroforese bidimensional
Crédito: Art of Science/Shutterstock.
4.2 ESPECTROMETRIA DE MASSA
A eletroforese em gel bidimensional é uma valiosa ferramenta para o estudo do proteoma, que é
definido como o conjunto completo de proteínas produzidas por um genoma em particular, sendo
que seu campo de estudo envolve a catalogação de todas as proteínas expressas em uma célula,
com ênfase em sua quantificação, localização, modificações, interações e atividades. As proteínas
são extraídas e submetidas à eletroforese bidimensional em gel de poliacrilamida (2D-PAGE)
formando spots proteicos nos quais cada proteína foi separada conforme sua massa molecular e
seu ponto isoelétrico. Cada spot proteico selecionado é identificado por coloração, e a proteína
correspondente a esse spot é então extraída do gel com o auxílio de um bisturi e digerida com
proteases, gerando inúmeros peptídeos. Os pequenos peptídeos oriundos da digestão são
sequenciados por meio da espectrometria de massas, o que possibilita a identificação da proteína.
A espectrometria de massa é uma técnica capaz de detectar com precisão a massa de
substâncias voláteis, mas como sabemos, as proteínas não são voláteis. Esse problema foi resolvido
com odesenvolvimento da tecnologia MALDI (matrix-assisted laser desorption-ionization) e da
tecnologia Electrospray ionization (ESI), ambas associadas a TOF (time of flight). No MALDI, as
proteínas são ligadas a uma matriz que, ao ser estimulada eletricamente (por um laser), se torna
ionizada e, portanto, volátil. Já no ESI, a solução contendo os peptídeos é aspergida a partir de um
tubo capilar com alta voltagem formando finas gotículas carregadas que volatilizam rapidamente.
Em ambas as técnicas, ao volatilizar, as proteínas entram num tubo de voo (por isso time of flight,
“tempo de voo”) e são aceleradas por um campo elétrico; as mais leves chegam primeiro ao detector,
e as mais pesadas demoram mais para chegar. O detector mede o tempo de voo das partículas em
seu interior e correlaciona com padrões de massa pré-estabelecidos. Ao final do processo, o
computador registra o espectro das massas detectadas (por isso a técnica se chama
espectrometria).
Figura 11 – Esquema representativo da espectrometria de massa do tipo MALDI-TOF
Crédito: Daniele Dietrich Moura Costa.
TEMA 5 – DETERMINAÇÃO DA ESTRUTURA TRIDIMENSIONAL DE
PROTEÍNAS
A função de uma proteína depende não apenas da sua sequência primária de aminoácidos, mas
em última instância, da conformação tridimensional que esses aminoácidos adquirem no espaço. É
essa conformação, por exemplo, que cria sítios catalíticos nas enzimas ou que conferem
conformação específica aos anticorpos. As duas técnicas mais usadas para determinar a
conformação tridimensional de uma proteína são a cristalografia por raios X e a espectroscopia por
ressonância magnética.
5.1 CRISTALOGRAFIA DE RAIOS X
A cristalografia de raios X, também conhecida como difração de raios X, consiste na difração de
raios X pelos átomos que constituem uma amostra quando na sua forma cristalizada. Quando
cristalizados, cada átomo da proteína apresenta a mesma conformação específica e a mesma
orientação no espaço, formando uma malha tridimensional. Quando essa malha é submetida a um
feixe de elétron, alguns atravessam a malha e outros são difratados. Um filme fotográfico é utilizado
para detectar os elétrons difratados pelos cristais da amostra, formando uma imagem tridimensional
da proteína.
O cristal contendo a proteína é colocado entre uma fonte de raios X e uma anteparo (que é o
detector). Um feixe de raios X incide sobre o cristal e um conjunto de pontos, chamados de reflexões,
é gerado. Os pontos são gerados pela difração do feixe de raios X, e cada átomo da molécula faz
uma contribuição para cada ponto. Um mapa de densidade eletrônica da proteína é reconstruído a
partir do padrão total de difração, por uma técnica matemática chamada de transformada de Fourier.
Esse mapa é gerado por um computador que analisa a imagem formada por cada ponto,
transformando-a em um número plausível de análise.
5.2 ESPECTROSCOPIA POR RESSONÂNCIA MAGNÉTICA NUCLEAR
Diferentemente da cristalografia, que requer que as amostras estejam cristalizadas, a
espectroscopia por ressonância magnética nuclear (RMN) permite avaliar a estrutura de uma
proteína em solução. Essa técnica se baseia no fato de que o núcleo de alguns átomos apresenta
uma característica chamada spin, que é uma propriedade mecânico-quântica que gera um sinal
detectável pela RMN. Quando os núcleos desses átomos são excitados por uma fonte de energia,
eles mudam o estado rotacional de seus spins; ao retornar para o estado energético inicial, esses
núcleos emitem um tipo de energia que pode ser detectada por RMN. O conjunto de todas as
energias detectadas forma um espectro de RMN que permite estimar computacionalmente a
estrutura tridimensional da proteína, em um processo extremamente trabalhoso que requer muitos
conhecimentos técnicos-científicos.
NA PRÁTICA
A uma primeira vista, pode parecer que essas técnicas estão todas muito longe do dia a dia do
biomédico, o que não é verdadeiro. Uma das técnicas mais utilizadas pela Patologia Médica é a
identificação de proteínas marcadoras de tumores. Um exemplo clássico é a alfafetoproteína (AFP).
Essa proteína está presente no recém-nascido e nas mulheres grávidas de forma fisiológica, mas
está ausente nos adultos saudáveis. A presença de AFP em adultos é marcador de hepatocarcinoma,
um tipo de câncer hepático. Quando se suspeita desse tipo de carcinoma, uma amostra de sangue
do paciente é colhida e o plasma é processado para um ensaio de SDS-PAGE seguido de Western
Blot. Anticorpos específicos para a AFP estão disponíveis comercialmente e são usados para
detectar a presença desta proteína no plasma de pacientes suspeitos de hepatocarcinoma. É um
teste pouco invasivo quando comparado a uma biópsia, que possui boa precisão e que pode ser
realizado rapidamente (cerca de 24h para a realização de um SDS-PAGE seguido de Western),
permitindo um diagnóstico precoce.
FINALIZANDO
Nesta aula, aprendemos como o DNA direciona a síntese de proteínas e como podemos
proceder para analisar essas moléculas. Primeiramente, devemos ser capazes de extraí-las das
células e purificá-las, sendo que diferentes técnicas de purificação podem ser aplicadas de acordo
com a experiência do pesquisador e a disponibilidade de reagentes em seu laboratório.
Uma vez extraídas e/ou purificadas, essas proteínas podem ser usadas em uma gama de
ensaios. O sequenciamento permite identificar a estrutura primária das proteínas. Já a cristalografia
de raios X e a espectroscopia por RMN permitem reconstruir a estrutura terciária das proteínas. O
SDS-PAGE permite determinar a massa de uma proteína específica em meio a várias outras proteínas
de uma amostra. O Western Blot é um imunoensaio que permite detectar uma proteína específica
que tenha sido previamente separada por eletroforese. Já a eletroforese bidimensional permite isolar
proteínas de acordo com seu ponto isoelétrico e sua massa molecular, permitindo uma isolamento e
identificação muito mais precisos quando comparados ao SDS-PAGE. Com todo o conhecimento
obtido nesta aula, associado ao conhecimento adquirido nas aulas anteriores sobre Biotecnologia,
você está pronto para desbravar o universo da pesquisa científica que envolve os ácidos nucléicos e
as proteínas. Mãos à obra e boa sorte!
REFERÊNCIAS
ALBERTS, B. et al. Fundamentos de Biologia Celular. 6. ed. Porto Alegre: Ed. ArtMed, 2017.
ALBERTS, B. et al. Biologia Molecular da Célula. 6. ed. Ed. Porto Alegre: ArtMed, 2017.
LODISH, H. et al. Fundamentos da Biologia Celular. 7. ed. Porto Alegre: Editora Artmed, 2015.
MARSHALL, W. J.; LAPSLEY, M. Bioquímica Clínica: Aspectos Clínicos e Metabólicos. Rio de
Janeiro: GEN Guanabara Koogan, 2016.
SMITH, C.; MARKS, A. D.; LIEBERMAN, M. Bioquímica Médica Básica de Marks. Porto Alegre:
Artmed, 2007.
BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 4
Prof. Benisio Ferreira da Silva Filho
CONVERSA INICIAL
ERA DAS CIÊNCIAS ÔMICAS PÓS ACÚMULO DE CONHECIMENTO
COMO FOI A EVOLUÇÃO DO CONHECIMENTO EM BIOTECNOLOGIA
Hoje nós temos conhecimento sobre nossa informação genética, sobre a genética de
microrganismos e manipulamos essas informações. Para que isso fosse possível, muitas pesquisas
foram realizadas previamente, muitos dados gerados foram validados, compreendidos até serem
aplicados no desenvolvimento de técnicas e equipamentos que permitiram avanços na área da
saúde, agronegócios e farmacológicos.
Vamos conversar sobre esse histórico da Biotecnologia de forma simples e leve, fazendo você
entender definitivamente que o que sabemos e fazemos hoje é fruto do acúmulo de conhecimento
secular. Hoje, uma técnica como a PCR ou o monitoramento genético parece óbvio, mas você irá
compreender como chegamos até aqui, até a era pós-genômica.
TEMA 1 – BIOTECNOLOGIA EXISTE HÁ SÉCULOS
O real conceito de Biotecnologia é o uso de elementos biológicos como ferramentas. Logo,
produzir algo por meio do uso de microrganismos e enzimas é um trabalho biotecnológico. Produzir
pão por meio de fermentação, produzir queijos e bebidasé um trabalho biotecnológico. Entendo que
a imagem que vem à sua cabeça é aquele laboratório “hi-tech”, mas o conceito é simples e te ajuda a
entender.
Há alguns autores que tentam explicar que o manejo e domesticação de animais, bem como
técnicas de agricultura também é biotecnologia, porém, pessoalmente não acredito ser algo a se
relacionar. Além de atrapalhar no entendimento do futuro biotecnólogo moderno. Melhor ficar com o
conceito de usar elementos biológicos como ferramentas. No lugar de tesouras para produzir cortes,
colas, parafusos e lâmpadas, podemos usar enzimas, ácidos nucléicos e moléculas que brilham para
realizar trabalhos e produzir coisas, produtos.
Um trabalho de engenharia a nível molecular. Por exemplo, preciso cortar um elemento A. Vou
usar o elemento B dividindo A em dois pedaços. Se o elemento A for um DNA e o elemento B uma
proteína com função de enzima específica para ácidos nucléicos (Nuclease) vou cortar esse DNA em
dois pedaços. Isso pode ser útil de alguma forma, por exemplo para genotipagem por RFLP.
Tivemos avanços na produção de medicamentos, metodologias de pesquisa científica,
compreensão de doenças, aumento da produção de alimentos, melhores formas de diagnósticos e
por fim, maior conhecimento sobre nós humanos e sobre organismos de interesse médico. A
Biotecnologia representa uma área do futuro, pois o que ela faz só é possível após dois séculos de
conhecimento e abriu portas para uma imensa quantidade de dados que com certeza levarão mais
um século para serem analisados, compreendidos e dominados, gerando assim mais produtos.
1.1 CONHECIMENTO IDENTIFICANDO AS FERRAMENTAS DE BIOTECNOLOGIA
Tudo que aprendemos em química, biologia celular, matemática e física permitiu que
identificássemos elementos e criássemos meios de análise e investigação e produção culminando
em mais avanços a humanidade. Os primeiros trabalhos de Mendel não falavam de DNA, muito
menos de genes, mas mostraram que era possível identificar a existência de fatores transmitidos
através das gerações de forma organizada, o que permitida que análise estatística predissesse o que
poderia ocorrer após o cruzamento de dois indivíduos nas próximas gerações. Além disso Mendel
mostrou que era possível entender também a possibilidade de duas características se misturarem
dando origem a um terceiro fenótipo.
Figura 1 – Gregor Mendel e sua experiência com plantas de ervilha. Um monge austríaco e um
cientista que lançou as bases da genética
Crédito: Yeti Crab/Shutterstock.
Vários cientistas realizaram trabalhos importantes para o acúmulo de conhecimento e uso deste
nos avanços. Merece destaque aqui neste texto também Charles Darwin, que com seu trabalho de
observação mostrou a adaptação dos organismos em diferentes regiões de acordo com a
necessidade de cada um. O organismo sofrendo mudanças para sobreviver ao meio em que vive.
Seria também um trabalho daqueles fatores transformadores que Mendel havia descrito?
Figura 2 – O naturalista e geólogo Charles Darwin com a teoria da evolução
Crédito: Yeti Crab/Shutterstock.
Merecem destaque aqui também, dentre centenas de cientistas, os que desenvolveram e
apresentaram informações sobre física, química e biologia. Os dados gerados por tantos cientistas
apontaram a direção para o progresso. Muito importante para Biotecnologia, o conhecimento em
microbiologia gerado por Frederick Griffith, cujo experimento mostrou que bactérias são capazes de
transferir informação genética, transformando e alterando o fenótipo de bactérias (primeiro exemplo
de transferência de DNA, transformando organismos), permitiu aumentar o desejo pelo controle
dessa poderosa informação. Conhecer, entender e manipular o DNA poderia então ser a chave para
cura de doenças, melhorias da saúde humana e de forma muito ambiciosa, naquela época, alguns
cientistas falavam em prolongar a vida.
Sendo assim, todas as áreas de conhecimento iam realizando seus trabalhos, dessa forma
contribuindo com avanços. É muito importante mostrar para você aluno de Biomedicina que os
avanços discutidos aqui não dependem exclusivamente do conhecimento em Biologia, Biologia
Molecular e Genética, pelo contrário, dependem muito do que aprendemos em física, química e
matemática. Sequenciar DNA por exemplo, só é possível devido ao novo conhecimento em física,
química, matemática e biologia celular e genética. União de conhecimento é o que promove avanços.
Continuando a informação sobre essa busca pelo entendimento e domínio do DNA, o bioquímico
austríaco Erwin Chargaff através de seus estudos mostrou que a “nucleína”, o ácido nucléico, tinha
uma composição química bem específica. Ele mostrou que havia uma proporcionalidade entre cada
um dos tipos de bases nitrogenadas. Seus dados mostraram que havia uma clara relação entre
Adenina e Timina, podendo haver diferença entre a quantidade em diferentes organismos, porém a
proporção entre Adenina e Timina de cada organismo era sempre a mesma e a proporção mesmo
em diferentes quantidades encontradas em outros organismos também se mantinha a mesma.
Ex: No organismo A – quantidade de Adenina detectada corresponde a 22,5%, é observado que a
quantidade de Timina também é de 22,5%. Consequentemente a quantidade de Citosina é de 27,5% e
de Guanina de 27,5%. No organismo B – Adenina 26,3% - Timina 26,3% / Citosina 23,7% - Guanina
23,7%. Há uma clara relação entre Adenina e Timina e entre Citosina e Guanina.
Figura 3 – Regra de Chargaff: Ligação entre Adenina e Timina e entre Citosina e Guanina em
todos os organismos
Crédito: Art Of Science/Shutterstock.
Hoje nós sabemos, mas lá nos anos 1940 essa informação foi muito importante e ajudou a
explicar o que foi observado por meio de experimentos com difração de raios X realizados por
Rosalind Franklin. Ela fotografou a organização dos elementos que compõem o DNA e a imagens
geradas por ela foram decisivas para que Watson e Crick, juntando todas as informações disponíveis
à época, estabelecessem o que seria a estrutura tridimensional do DNA, trabalho este publicado em
1953.
Figura 4 – Química Inglesa Rosalind Franklin que por meio de seus trabalhos por cristalografia e
difração de raios-X, produziu imagens decisivas para elucidação da estrutura tridimensional do DNA
pelos pesquisadores Watson e Crick
Crédito: Yeti Crab/Shutterstock.
No início dos anos 1950, logo após a publicação do trabalho de Watson e Crick e com todo o
conhecimento da época mostrando que aqueles fatores de Mendel, as descobertas de Darwin,
Griffith, Chargaff e tantos outros mostrando que a informação do que define o organismo é o DNA,
iniciou a corrida para os trabalhos de manipulação e domínio dessas informações. O próprio Francis
Crick logo após o trabalho sobre a estrutura do DNA deu continuidade aos seus estudos e em 1957
junto com seus pesquisadores do clube do RNA escreveram o Dogma Central da Biologia Molecular,
publicando essa informação em 1958. Sendo assim, naquela época, tudo estava preparado havia
bastante conhecimento, sabiam da estrutura do DNA e existia as explicações biológicas que
somadas ao Dogma de Crick mostravam que a informação de todos os organismos estava no DNA e
quem dominasse essa informação dominaria os organismos. Começa a corrida para melhor
entendimento dos genomas.
Figura 5 – Dogma Central da Biologia Molecular: A informação contida no DNA é transcrita em
RNA e traduzida em Proteína. Os organismos funcionam porque produzem proteínas, sendo a
construção destas proteínas, dependente do que está escrito no DNA
Crédito: Fancy Tapis/Shutterstock.
TEMA 2 – OS AVANÇOS E AS PRINCIPAIS TÉCNICAS
O que faz um organismo funcionar é a interação entre suas proteínas/enzimas com diversos
elementos químicos, ocorrendo assim eventos bioquímicos dentro e fora das células. De uma célula
procarionte (bactérias e algas unicelulares) a eucariotos, a informação contida no DNA determina se
ela vai funcionar bem ou não, se será alguma vantagem ou desvantagem, sehá uma doença genética
ou não. Logo, conhecer como se organiza e o que expressa a informação genética dos organismos e
do homem é (de acordo com o pensamento da época) ter domínio sobre o organismo. Muito se
falava a época sobre a cura de todas as doenças.
2.1 SEQUENCIAMENTO DE PROTEÍNA E DNA POR FREDERICK SANGER: 2 NOBEL
Obviamente, existem diversas técnicas. Por exemplo, em 1961, Marmur e Doty descobriram a
renaturação do DNA, estabelecendo de vez a especificidade e viabilidade de reações de hibridização
de ácidos nucleicos; em 1962, Arber e seus colaboradores apresentaram ao mundo a existência das
enzimas de restrição e a possibilidade de seu uso para caracterizar diferentes DNAs de diferentes
organismos (princípio da genotipagem); em 1966, Niremberg, Ochoa e Khorana elucidaram o código
genético (importante na compreensão final do dogma central da Biologia molecular); em 1967,
Gellert e seus colaboradores descobriram a DNA Ligase, a enzima que liga fragmentos de DNA; em
1972, técnicas de clonagem e de recombinação de DNAs são apresentadas por Boyer, Cohen e Berg.
São só algumas das ferramentas de Biotecnologia que foram estudadas e desenvolvidas antes dos
anos 1980.
Mas ganha destaque mesmo, neste momento, apresentar Frederick Sanger, bioquímico inglês
que ganhou dois prêmios Nobel. O primeiro, quando descreveu a metodologia para sequenciar uma
proteína e determinar a sequência de aminoácidos da insulina, o que nunca havia sido feito antes,
porém foi apresentado por ele em 1955. Usando química e cromatografia e misturando técnicas
padrão com novas, ele desenvolveu um método para ler a sequência de aminoácidos da insulina e
descobriu que essa proteína é na verdade composta de duas cadeias de aminoácidos unidas por
ligações dissulfeto. Ele usou uma metodologia de hidrólise ácida da proteína de forma controlada,
observando os aminoácidos que eram separados por cromatografia. Ganhou o primeiro Nobel em
1958.
Figura 6 – A estrutura básica das proteínas é essa organização linear dos aminoácidos
conhecida como estrutura primária. O trabalho de Sanger mostrou como separar os aminoácidos e
entender a ordem na proteína insulina. Metodologia importantíssima, que impulsionou a
Biotecnologia moderna
Crédito: TATLE/Shutterstock.
O segundo feito importantíssimo para Biotecnologia realizado por Sanger foi a metodologia de
sequenciamento do DNA. Sanger desenvolveu o processo de incorporação seletiva de
“didesoxinucleotídeos” (dNTP) pela DNA polimerase durante a replicação in vitro do DNA. Esses
didesoxinucleotídeos são nucleotídeos modificados quimicamente que não possuem a hidroxila no
carbono 3 da pentose e recebem um fluoróforo como marcação. À medida que os nucleotídeos estão
sendo incorporados pela DNA polimerase, no momento que um didesoxinucleotídeo é incorporado,
outros não serão, produzindo então vários fragmentos com tamanhos diferentes com um dNTP no
final dos fragmentos, sendo então todos esses separados por eletroforese.
Figura 7 – Antes do surgimento dos sequenciadores de DNA por eletroforese capilar, esse era o
modo de análise dos DNAs sequenciados. Sequenciamento de até 5.000 pares de base, com
destaque para o DNA mitocondrial Humano
Crédito: Gopixa/Shutterstock.
TEMA 3 – ERA PRÉ-GENÔMICA E PÓS-GENÔMICA NA VISÃO DA
SAÚDE
A Biotecnologia é muito mais que discutirmos aqui os trabalhos com ácidos nucléicos. Ela
mudou para melhor a indústria e os agronegócios, mas nosso foco aqui, para futuros biomédicos, é a
parte do impacto para ciências da saúde: a era pré e pós-genômica.
Após diversas informações, dados e desenvolvimento de técnicas para análise e melhor
compreensão da informação e formação fenotípica dos organismos, iniciou-se obviamente uma
corrida para de alguma forma ter vantagens comerciais. Sim, infelizmente o que move a ciência não é
necessariamente a curiosidade natural do cientista, e sim, a economia, o poder militar e uma
necessidade pós-catástrofe. No caso do período pré e pós‑genômico havia sim uma ambição em
ganhar muito com meios supostamente fáceis de curar doenças e produzir medicamentos mais
eficientes e personalizados.
Após o conhecimento obtido pelo Dogma Central da Biologia Molecular, a confirmação do poder
transformante do DNA, e que, quando transferido, transformava o organismo que o recebia, além das
técnicas de manipulação do DNA, fragmentando-o e colando esses pedaços, deixando-o funcional
em outro organismo (Boyer, Cohen e Berg em 1972, com a técnica de clonagem), foram elaboradas
estratégias para sequenciar o genoma de organismos.
TEMA 4 – ERA PRÉ-GENÔMICA
Vamos organizar essa apresentação das ciências ômicas em dois momentos: era pré-genômica,
até o momento da publicação do Genoma do Haemophilus influenzae em 1995, e era pós-genômica
de 1995 até os dias atuais.
4.1 O CAMINHO ATÉ O PRIMEIRO GENOMA COMPLETAMENTE SEQUENCIADO
O objetivo agora, após o acúmulo de conhecimento já citado, era sequenciar o genoma humano.
Nos anos 1970 muita coisa importante aconteceu, e iniciou-se o desenvolvimento e aplicação desse
conhecimento. Por exemplo, já haviam sido realizadas as primeiras expressões heterólogas
culminando no surgimento da primeira empresa de Biotecnologia a Genetech, inc. em 1976. Em
1982, após aprovação pelo FDA, começou a comercializar o produto Humulin (primeira insulina
humana geneticamente modificada). Muitos outros produtos biotecnológicos foram produzidos.
A década de 1970 mostrou que era possível manipular o DNA, fazê-lo ser expresso em outro
organismo e até mesmo sequenciar o DNA, lendo a ordem de seus nucleotídeos. Começou então o
sequenciamento de pequenas informações genéticas, de microrganismos, até que começaram a
ousar mais: começaram a almejar o genoma humano. A primeira parte do genoma humano a ser
sequenciado foi o DNA mitocondrial, devido ao seu pequeno tamanho (16.569 pares de base);
esforços foram realizados até que em 1981 foi publicado o fim do sequenciamento do DNA
mitocondrial.
Nos anos 1980, houve mais descobertas (destaque para desenvolvimento da técnica de PCR) e
o surgimento do NCBI (National Center for Biotechnology Information), organizando e tornando
pública informações sobre o desenvolvimento da Biotecnologia. Porém, o mais importante foram
todas as negociações para que o maior de todos os projetos fosse inicializado, o Projeto Genoma
Humano (PGH). Pensado e planejado ao longo dos anos 1980, confirmado em 1988, foi iniciado após
o financiamento do departamento de energia dos Estados Unidos. Inicialmente, imaginava-se que
duraria 15 anos até a conclusão do sequenciamento e organização da informação.
Todos esses trabalhos exigiram que fossem desenvolvidos equipamentos para fins
biotecnológicos, como por exemplo, termocicladores, os primeiros sequenciadores de DNA e
também, acompanhando todo esse desenvolvimento, os avanços naturais da informática eram
naturalmente incorporados. Chegou a um ponto em que perceberam que a quantidade de dados e de
informação era tão grande que, se não houvesse um sistema computadorizado para analisar e guiar
os cientistas na análise e montagem das sequências, o trabalho ficaria tão difícil que os 15 anos
previstos poderiam facilmente se tornar (devido à tecnologia à época) 50 anos.
Figura 8 – Projetos genoma são ricos em informação. Hoje nós sabemos que sem o uso de
computadores o trabalho seria impossível
Crédito: Majcot/Shutterstock.
Por necessidade, surgiram melhores equipamentos, um uso mais eficiente do sistema de
informática, softwares específicos para análise das sequencias (BLAST, principal software de
Bioinformática, criado e publicado em 1990 por Stephen Altschul). Iniciado o trabalho de
sequenciamento, havia a dificuldade de entender o tamanho do volume de informação contida ali.
Eram centenas de milhares de GCTA (guanina, citosina, timina e adenina). Para organizar, era
necessário elaborar uma estratégia de montagem das informações do DNA sequenciado e isso
exigia mais poder de processamentodos computadores, mais armazenamento de dados e um
genoma menor para testar essa nova metodologia de sequenciar genomas.
A ideia era fragmentar o genoma, pegar esses pedacinhos de DNA e cloná‑los em bactérias
(técnica de 1970), criando assim uma biblioteca, sequenciar os pedacinhos e por meio de programas
especiais de computador ir montado o genoma como se fosse um quebra-cabeça. Essa metodologia
recebeu o nome de “Shotgun”: o DNA era extraído, fragmentado por sonicação (fragmentar através de
ondas sonoras), organizada a biblioteca genômica por clonagem em bactérias e sequenciamento
dos fragmentos clonados. Como ponto de partida escolheram pela simplicidade e escolheram a
bactéria Haemophilus influenzae. A união dessas estratégias biotecnológicas, mais o poder de
processamento dos computadores à época permitiu concluir o sequenciamento inteiro do genoma
desta bactéria. O mundo conhecia em 1995 o primeiro genoma completamente sequenciado pelo
homem. A partir desse ponto, entenderam a importância da análise de dados genômicos por
computador e nascia oficialmente a Bioinformática. Além disso, houve a necessidade de mais
avanços nos equipamentos utilizados. Inicia-se uma era em que o mundo sabe sequenciar genomas,
inicia-se então a era pós-genômica.
TEMA 5 – ERA PÓS-GENÔMICA
Em 1995, o mundo aprendeu por meio da publicação do genoma do Haemophilus influenza a
sequenciar um genoma completo. Imagine o potencial de tudo isso: ter a informação genética a
serviço da saúde, da indústria farmacêutica, melhorando alimentos. Com tamanho potencial a partir
de 1995 explodiram os projetos genoma e paralelamente, à medida que os avanços iam
acontecendo, o projeto genoma humano. Nosso genoma é gigantesco e complexo, e fomos
descobrindo isso à medida que ia sendo sequenciado. E aí veio um detalhe importante: Como saber
que o que estava sendo sequenciado estava realmente certo?
Bioquimicamente, sabemos que proteínas com estrutura e sequência de aminoácidos similar,
muito similar entre si, indicam que possuem mesma função bioquímica. Por exemplo: a insulina
bovina, suína, canina e a humana possuem uma estrutura tridimensional e a sequência de
aminoácidos tão parecida, mas tão parecida, que sabemos que elas possuem a mesma função. A
insulina humana, tem a mesma função biológica da insulina do cão, a mesma função da insulina do
porco e do boi por exemplo. Se elas possuem mesma função devido a essa similaridade é porque a
informação genética para construir essa proteína em diferentes organismos deve ser a mesma. O
conhecimento que temos de que a informação contida no DNA expressa uma RNA que é traduzida
em proteína vale para todos os organismos. Então os cientistas pensaram: “Se nós conseguirmos
sequenciar organismos mais simples, e começarmos a identificar esses genes, podemos ir
avançando no sequenciamento de organismos mais complexos, validando a identificação desses
genes por comparação em Bioinformática até termos informação suficiente para identificarmos com
segurança, genes humanos”. E assim foi feito, vários e vários organismos foram sequenciados na
segunda metade dos anos 1990.
5.1 NASCE A GENÔMICA COMPARATIVA
A quantidade de organismos sequenciados foi enorme. A quantidade de projetos genoma nos
cinco continentes (O Brasil participou do consórcio internacional de sequenciamento do Genoma
Humano e também possuía seus próprios projetos, sendo o maior e mais importante o
sequenciamento da Xylella fastidiosa) foi gigantesca se comparada com os dias atuais. Na época
houve uma corrida pela obtenção dessa informação com intenções econômicas (claro) e com
intenções de melhorias na saúde e nos agronegócios.
A comparação entre diferentes genomas ajudou muito na identificação de genes. Nós humanos
temos informações genéticas encontradas em outros organismos. Sequenciando outros organismos,
ficou fácil confirmar que o que sequenciamos em nosso DNA estava certo. Isso também ajuda a
explicar por que podemos e devemos usar organismos modelos em diferentes tipos de experimentos
relacionados a pesquisa em ciências da saúde, sendo esses organismos, desde de uma simples
mosca das frutas (Drosophila melanogaster) até o cão (Canis lupus familiaris).
Com tanta informação, final dos anos 1990 (por volta de 1998) os primeiros sequenciadores de
DNA com vários capilares (o que acelera o processo de sequenciamento) impulsionou melhorias e a
obtenção de mais dados. Por conta das melhorias, mais informações, avanços tecnológicos da
informática e “concorrência” (na metade dos anos 1990, o PGH ganhou um concorrente o Craig
Venter Institute) o que estava previsto no início, finalizar o genoma humano em 15 anos, diminuiu
para 13 anos. Em 14 de abril de 2003 foi anunciado a conclusão do Projeto Genoma Humano.
Figura 9 – Com a conclusão do projeto genoma humano e de tantos outros, começaram as
pesquisas para o uso dessas informações
Crédito: Eetu Mustonen/Shutterstock.
Os impactos foram imensos. Melhoria nos diagnósticos de patógenos, testes e diagnósticos de
inúmeras doenças genéticas, começo da farmacogenômica e estabelecimento definitivo das
ciências ômicas. Genômica, transcriptômica e proteômica, cada uma dessas estudando uma parte
específica do Dogma Central da Biologia Molecular. Houve uma expansão e mais estudos que
levaram à interatômica, metabolômica e farmacogenômica, entre outras.
De fato, com o conhecimento que temos hoje, sabemos que o que se imaginava nos anos 1980
não é tão fácil, não é tão simples. Ter a informação genômica não é suficiente; entender quando uma
informação é expressa, com quem interage, qual a ação em outras células é muito importante. Saber
como realmente funcionam as células, os tecidos e o organismo.
Figura 10 – Temos muito trabalho pela frente. O Projeto Genoma Humano foi apenas o início.
Tem muito a ser estudado ainda para real compreensão do funcionamento bioquímico da vida
Crédito: Meletios Verras/Shutterstock.
NA PRÁTICA
A melhor compreensão de tanta revolução é você perceber como a medicina mudou tanto,
principalmente na área genética ou em áreas que se relacionam com a Genética. Tente listar quantos
exames genéticos estão disponíveis no laboratório mais próximo da sua casa.
FINALIZANDO
Esse pequeno histórico mostra como o acúmulo de conhecimento é importante para o
desenvolvimento de tudo que usamos hoje.
BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 5
Prof. Benisio Ferreira da Silva Filho
CONVERSA INICIAL
CIÊNCIAS ÔMICAS – APENAS SEQUENCIAR DNA NÃO É SUFICIENTE. SABER
COMO FUNCIONA A VIDA É O OBJETIVO
Com tanta informação disponível, o que fazer? Surgiram novas áreas de estudo, todas elas com
um volume de informação tão grande que, mesmo que você esteja discutindo dados biológicos,
precisará de um recurso computacional que permita analisar de forma organizada tudo isso. Sem
computadores não há biotecnologia moderna, nem chegaríamos ao fim do Genoma Humano. Antes
de apresentar a Bioinformática, vamos estabelecer a definição das diferentes áreas de estudo que
compõem as ciências ômicas, que só existem devido ao desenvolvimento da Bioinformática.
TEMA 1 – DOGMA CENTRAL DA BIOLOGIA MOLECULAR IN SILICO
O Dogma Central da Biologia Molecular é analisado em ambiente virtual, seus dados sendo
analisados por computadores. Essa análise por computadores, simulações biológicas em ambiente
virtual, é a definição de análises in silico. Temos os testes in vivo (realizados em organismos modelo),
in vitro (simulações em ambiente controlado, em laboratório, com metodologias controladas em
escalas menores) e agora as simulações por meio de softwares, experimentos virtuais, modelagem
computacional; isto, é o trabalho in silico.
Figura 1 – Fluxo da informação de todo organismo. A informação do DNA, contida nos genes, é
expressa em RNA mensageiro que é traduzida em Proteína. E o DNA é replicado para duplicar células
Cada uma das partes é estudada e uma complementa a outra. Vamos apresentar de forma
organizada.
1.1 GENÔMICAFigura 2 – Informação do Genoma do organismo. Sequenciamento de todos os cromossomos, ou do
único DNA (ou RNA no caso de alguns vírus)
A genômica estuda o genoma, faz identificação e localização das ORFs (Open Read Frames –
sequências de DNA que possuem estrutura de genes, mas não são consideradas genes até ficar
provado que é), procura confirmar genes por comparação com outros já bem conhecidos, inferindo
assim possíveis funções.
Genômica Comparativa: tem por objetivo comparar todo conteúdo do DNA com outros já
conhecidos e, assim identificar diferenças, que podem ser responsáveis por propriedades fenotípicas
ou evolutivas, como patogenicidade, reações a condições ambientais...
Porque é importante comparar com outros organismos, DNA sendo comparado com DNA?
Porque se uma sequência A é muito parecida com B e eu sei a função de A, devido à similaridade eu
posso inferir que B tem a mesma função de A. Revise o que você aprendeu em genética sobre a
sequência dos genes e o código genético.
Figura 3 – O primeiro e mais simples nível dos estudos das ômicas
Crédito: Ktsdesign/Shutterstock.
1.2 TRANSCRIPTÔMICA
Figura 4 – Análise do que é expresso, sequenciamento dos RNA mensageiros
Também chamada de “genômica funcional”. É o estudo de todo RNA mensageiro. Informação
em constante mudança, não é fixa e pode ser rapidamente reestruturada pela mudança no nível de
síntese de RNAm específicos. Porém, é a parte que apresenta para diferentes células em diferentes
situações expressões de diferentes genes.
É uma forma de entender como uma célula responde a estímulos, aumentando a expressão de
genes, diminuindo a expressão ou mantendo a expressão. Logo, quando uma célula é de qualquer
forma estimulada, seja por exposição a algo ou estímulo físico, sabe-se como a célula muda a
expressão de genes. Essa informação é muito importante. Doenças apresentam mudanças de
expressão gênica, doenças genéticas. Células neoplásicas possuem mudanças significativas de
expressão de genes.
Figura 5 – A fita simples do RNA mensageiro fala muito sobre o funcionamento de uma célula,
consequentemente de um organismo
Crédito: Soleil Nordic/Shutterstock.
1.3 PROTEÔMICA
Figura 6 – O que faz um organismo funcionar é a interação e trabalho de suas proteínas com outras
proteínas e com outros compostos presentes no meio. Saber a origem e como elas são constituídas
é importantíssimo
Investigação do que torna um organismo funcional. A proteômica tenta descrever o conjunto
completo de proteínas, fornecendo informações importantes para complementar os estudos de
transcriptômica e principalmente da metabolômica.
Se as proteínas são sintetizadas no ribossomo de acordo com a informação que chega pelo
RNA mensageiro, a confirmação delas é importante para identificar também os pseudogenes. Uma
sequência de DNA transcreve um RNA e esse RNa pode dar origem a uma proteína? Então é um
gene. Uma sequência de DNA parece um gene (tem uma sequência parecida com outro gene) mas
não transcreve um RNA funcional ou nem transcreve nada? Não é um gene, devido à similaridade
com outra sequência que é um gene, ele é chamado de pseudogene.
Figura 7 – A forma de uma proteína e sua função dependem da sequência de aminoácidos, que
depende da sequência de nucleotídeos do RNAm, que vem do DNA
Crédito: Designua/Shutterstock.
TEMA 2 – A EXPANSÃO DAS CIÊNCIAS ÔMICAS
Saber quantos são os genes, onde eles estão, identificar os RNAs mensageiros e identificar as
proteínas não é suficiente para compreender como funcionam os organismos. Existem centenas de
interações entre as proteínas e isso precisa ser identificado e compreendido. Das informações das
interações entre as proteínas e suas consequências, surgiu primeiro a interatômica, que quando
comparada com a metabolômica é vista como algo mais simples.
Na interatômica você analisa de forma pontual uma ou duas interações, a quantidade de
interações é muito menor quando comparada a metabolômica, que constrói mapas metabólicos com
todas as interações possíveis de um determinado tipo celular em diferentes situações (investigando
a resposta celular em diferentes situações).
Figura 8 – Interação e resultado de proteínas, uma pequena parte de vias metabóticas ou mesmo a
interação de proteínas receptoras com proteína sinalizadora. Essa é a interatômica
A produção de dados e descrição dos eventos em larga escala de interações proteicas é um
desafio. Mesmo que o projeto Genoma Humano tenha sido finalizado, ainda há muito para
estudarmos. A quantidade de informação é tão grande que a metabolômica será a área das próximas
décadas. É, por conta de seus dados que estão sendo gerados algumas subáreas como a
farmacogenômica surgem. Uma vez que há a possibilidade de entender e obter dados da
transcriptômica e proteômica, direcionar o tratamento de forma específica é uma realidade. A dose
de um medicamento pode ser ajustada de acordo com a resposta específica e pessoal ao
medicamento. A dose de 100 mg pode ser eficiente para uma pessoa, enquanto que apenas 80 mg
seria igualmente eficiente para outra. Essa precisão pode ser obtida por meio do estudo e
desenvolvimento da interatômica, metabolômica culminando na especificidade de aplicação dos
dados na farmacogenômica.
A possibilidade de usar a evolução genômica para a identificação de novos genes que são
regulados por drogas é o próximo passo.
Figura 8 – Obtenção da informação de todo o mecanismo de funcionamento celular
Figura 9 – Futuro próximo, em breve, nossos medicamentos serão personalizados, serão produzidos
de acordo com nossas informações genéticas
Crédito: Gorodenkoff/Shutterstock.
TEMA 3 – ALÉM DA SAÚDE, A MANIPULAÇÃO GENÉTICA
Mais um ponto a ser discutido aqui. Começando nos anos 1970, a clonagem, a produção de
“DNA recombinante” e com os devidos avanços das técnicas permitindo que o gene do organismo A,
foi adicionado ao genoma do organismo B e foi expresso. Essa recombinação de DNA é uma
metodologia importantíssima e utilizada de diferentes formas.
Para que isso ocorra, a forma mais simples é estabelecer qual o seu gene (que é uma sequência
de DNA) e onde ele será inserido. O DNA recombinante é justamente esse DNA montado.
Quimicamente não há diferença; tanto faz para célula: se ela for estimulada e esse estímulo acionar a
maquinaria nuclear para expressar o gene que foi inserido, ele será transcrito em RNA mensageiro e
em seguida traduzido em proteína. Veja bem, a célula que recebeu esse “DNA recombinado” não
sabe que ele é recombinado, então vai expressar sempre que houver estímulo.
3.1 MONTANDO O DNA RECOMBINANTE
A forma mais simples de realizar esse tipo de procedimento é usando um dos DNA mais
simples, o plasmídeo. O plasmídeo é um DNA circular, pequeno (com poucos pares de base),
encontrado em bactérias e de fácil extração e manipulação. Ele é um DNA extra, separado do DNA
cromossomal da bactéria.
Figura 10 – Estrutura de uma bactéria. Observe que além do DNA cromossomal, há ali em amarelo
um DNA circular extra – aquele é o plasmídeo
Crédito: Mallymoya/Shutterstock.
Os plasmídeos possuem um pequeno número de genes, e boa parte destes está associada à
resistência a antibióticos, além de serem compartilhados entre as bactérias (isso mesmo, as
bactérias trocam informações entre si, passando plasmídeos de uma para outra). Existe também um
mecanismo que faz o plasmídeo ser duplicado de forma independente, fazendo com que uma
bactéria multiplique esse plasmídeo dentro dela, podendo compartilhar e ficando com alguns.
Por conta dessa simplicidade e possibilidade de compartilhamento, o plasmídeo foi utilizado
como um vetor para receber um fragmento de DNA contendo um gene (gene de outro organismo, não
o da bactéria) e ser expresso pela bactéria. Imagine o seguinte: um gene humano sendo
recombinado com um plasmídeo bacteriano e logo em seguida sendo inserido na bactéria. A bactéria
com o plasmídeo recombinado vai expressar o gene humano, produzindo então uma proteína
humana.Usa-se os plasmídeos como ferramentas para clonar, transferir e manipular genes. Os
plasmídeos usados experimentalmente para esses fins são chamados de vetores. Os pesquisadores
podem inserir fragmentos de DNA ou genes em um vetor de plasmídeo, criando o chamado
plasmídeo recombinante. Esse plasmídeo pode ser introduzido em uma bactéria por meio do
processo denominado transformação. Então, como as bactérias se dividem rapidamente, elas podem
ser usadas como fábricas para copiar fragmentos de DNA em grandes quantidades.
Figura 11 – Processo de fissão bacteriana, consequentemente multiplicação do plasmídeo também
Crédito: Aldona Griskeviciene/Shutterstock.
Explicando melhor, pequenos pedaços de DNA, como o DNA humano, podem ser anexados a
plasmídeos. Cada célula bacteriana normalmente produz muitas cópias de um plasmídeo, em
contraste com a produção de apenas uma cópia de seu próprio cromossomo. O fato de os
plasmídeos serem menores e em maior número do que o cromossomo hospedeiro torna mais fácil
isolar os plasmídeos na forma pura, motivo pelo qual os pesquisadores costumam usá‑los para
estudar DNA em laboratório. Os plasmídeos são, portanto, uma ferramenta fundamental da
tecnologia do DNA recombinante. Veja abaixo o passo a passo de como realizar a recombinação.
Figura 12 – Tecnologia do DNA Recombinante. 1 – O DNA carregando os genes desejados é isolado
com um plasmídeo bacteriano; 2 – Corte do plasmídeo bacteriano com enzima de restrição gênica
(endonuclease); 3 – O DNA recombinante é obtido pela colagem do gene cortado com a enzima
ligase e o DNA do plasmídeo; 4 – O DNA do plasmídeo recombinante é transferido para a célula
bacteriana; 5 – As bactérias são multiplicadas. As bactérias que proliferam produzem a proteína de
interesse
Crédito: Why Design/Shutterstock.
Os plasmídeos bacterianos não são os únicos vetores para expressão de DNA recombinante.
Existem outros. Os plasmídeos apresentam uma limitação e recebem um fragmento de até 15kpb
(15 mil pares de base). Para inserir fragmentos maiores, usa-se outros vetores, como o DNA do
bacteriófago lambda (recebe entre 10,4 a 20 kbp), BAC Bacterial Artificial Chromosomes (300 kbp),
YAC Yeast Artificial Chromosomes (600kb), e de acordo com os avanços, vetores para inserções
maiores como o HACs (Human Artificial Chromosomes), que recebem inserções maiores.
A tecnologia de DNA recombinante foi muito útil para saúde, e nos anos 1980 começou a
produção de Insulina Humana, por exemplo. Isso mesmo, insulina humana produzida por bactérias. A
síntese em grande escala de insulina útil para uso médico e terapia trouxe conforto para muito
diabéticos insulinodependentes. Essa tecnologia, que se desenvolveu a partir de décadas de
pesquisa básica sobre a natureza do DNA, ofereceu os meios para sintetizar virtualmente qualquer
proteína, como a insulina, e fornece uma ferramenta vital para estudar a atividade de genes em
laboratório.
Figura 13 – Estrutura da Insulina. O que importa é a função biológica da insulina, não a origem. Sua
sequência de aminoácidos determina sua forma tridimensional, e consequentemente sua função.
Não importa onde ela foi sintetizada, se foi numa célula eucarionte ou numa célula procarionte. O
que importa é sua função bioquímica
Crédito: Juan Gaertner/Shutterstock.
Células de mamíferos e bactérias sintetizam proteínas de formas semelhantes. DNA é transcrito
por um polimerase complexa em RNA (RNA Polimerase). Esse princípio permite a realização dos
trabalhos de produção dos transgênicos, afinal, como já dito anteriormente, pouco importa como foi
feito o DNA recombinado, importa se ele será expresso ou não.
TEMA 4 – ORGANISMOS MODELO: USO COM SABEDORIA
Ao longo dos anos 1990, muitos outros genomas foram sendo finalizados para auxiliar o
sequenciamento do genoma humano. Isso trouxe uma riqueza de informações de diversos
organismos, possibilitando um aumento significativo do uso de organismos modelo de forma mais
precisa, sem sacrifícios desnecessários, com razão e justificativa. Toda genômica, transcriptômica e
proteômica desses outros organismos também foi sendo conhecida, logo, estudos in vivo, que
exigem avaliações com organismos modelo, passaram a ganhar mais relevância.
O que são esses organismos modelo? Quais foram sequenciados? Quando você discute os
experimentos de Mendel, você está discutindo o uso de ervilhas e flores como organismos modelo
na compreensão da transmissão de características ao longo das gerações. Você deve saber que o
Mus musculus (digite no Google e descubra que animal é esse) é muito utilizado. Outros organismos
também possuem seu genoma completamente sequenciado e disponível para análise da
comunidade científica gratuitamente. Alguns deles abaixo:
Escherichia coli
Saccharomyces cerevisae
l bacteriophage T4
Danio rerio
Bos taurus
Pan troglodytes
Pan paniscus
Oryctolagus cuniculus
Macaca mulata
Canis lupus familiaris
Arabidopsis thaliana
Drosophila melanogaster
Periplaneta americana
Felis silvestres catus
Estes aqui apresentados são só alguns exemplos. Muitos outros possuem seu genoma
sequenciado e são utilizados devido a suas similaridades bioquímicas e fisiológicas com nós
humanos (sim, temos similaridades genéticas, consequentemente, bioquímicas e funcionais com
plantas e insetos também). Pense bem, não iremos agir como nazistas, realizando todo e qualquer
tipo de experimento com humanos. Usamos organismos modelos nas fases iniciais das pesquisas
para encontrar valores e forma seguras de expor humanos a pesquisas científicas.
Existem regras muito rígidas para o uso de organismos modelo. Você não pode pegar qualquer
animal, nem determinar aleatoriamente a quantidade de animais que você deseja para realizar
pesquisas científicas. Existem milhares de comitês de ética em pesquisa que controlam e
determinam como poderá ser utilizado o animal e até mesmo determina (quando necessário) o
sacrifício correto do animal. Sem sadismo e irresponsabilidade, existem normas, existe treinamento
para manipular e usar os animais.
Figura 14 – Este na foto é um camundongo C57BL, muito utilizado em pesquisas, assim como outros
organismos-modelo. Todos possuem seu genoma sequenciado
Crédito: Anyaivanova/Shutterstock.
Essa similaridade genética, e consequentemente bioquímica é o que justifica o uso desses
organismos modelo. Existem alternativas? Podemos substituir animais na pesquisa científica, já que
muitos discutem ter sentimentos e se incomodam com o uso de animais? A resposta é “ainda não”.
Não conseguimos substituir o que é observado in vivo por testes in vitro e in silico. Algumas coisas
podem ser utilizadas e raros são os testes que não necessitam mais do uso de organismos modelo.
Vamos discutir o futuro.
TEMA 5 – BIOTECNOLOGIA E A EVOLUÇÃO DA PESQUISA EM
CIÊNCIAS DA SAÚDE
Usar um organismo modelo é uma ferramenta de observação. Você usa um fármaco, realiza
exposição a um composto químico, muda a dieta, cria situações para observar como o organismo
desses animais vai reagir. Baseado nisso, você pode substituir o uso de animais por algo que
biologicamente te traga a mesma segurança na observação.
Atualmente, foi abolido o teste em animais de produtor cosméticos, fármacos dermatológicos e
produtor que podem ser desenvolvidos sem o uso de animais, substituindo-os por cultivo celular.
Figura 14 – Um biomédico olhando seu cultivo celular em microscópio invertido
Crédito: Anamaria Mejia/Shutterstock.
Alguns experimentos podem ser realizados diretamente em cultivo celular para observação da
resposta celular e estudos de viabilidade que avaliam se a célula sofreu alguma consequência que
caracterize uma citotoxicidade, diminuição das condições de manutenção do cultivo celular e
problemas na proliferação, dentre outros.
É possível até com o conhecimento e tecnologia que temos hoje criar in vitro cultivos celulares
com duas ou três linhagens celulares diferentes e observar a interação e a resposta após o estímulo,
exposiçãoetc. Temos também hoje em dia um comércio que permite que o grupo de pesquisa
compre diferentes tipos de células para realização de seu trabalho, realizando a manutenção dessas
células. São centenas de linhagens diferentes, sendo comercializadas no mundo. No Brasil, temos o
maior banco de células da América do Sul, o BCRJ, Banco de Células do Rio de Janeiro
(http://bcrj.org.br/).
Figura 15 – Células endoteliais do cérebro humano (células hCMEC / D3) foram capturadas por
microscópio de luz (40x)
Crédito: Waruto_Sama Studio/Shutterstock.
Figura 16 – Células são cultivadas nessas garrafas e o meio nutritivo é adicionado para manter as
células vivas. Esse meio contém tudo que a vida precisa: água, aminoácidos, carboidratos, gorduras,
vitaminas e minerais
Créditos: Jens Goepfert/Shutterstock; Unol/Shutterstock.
Acreditamos que no futuro o uso de animais será substituído por técnicas de cultivo celular e
órgãos artificiais, no momento nossa tecnologia não consegue simular um organismo, não
conseguimos reproduzir o que acontece entre células. Ainda precisamos observar in vivo e in vitro (de
forma limitada, ainda se restringe a avaliações epidérmicas).
NA PRÁTICA
Ainda há muito a se discutir sobre biotecnologia. Já conversou com seus professores sobre
transgênicos? Já parou para pensar que muito da sua vida confortável se deve pelo desenvolvimento
e avanços da biotecnologia? Faça uma busca e veja quantas coisas na sua casa são fruto dos
avanços biotecnológicos.
FINALIZANDO
Faça uma pesquisa sobre como eram os tratamentos e a vida dos diabéticos
insulinodependentes antes do desenvolvimento da insulina humana produzida pela biotecnologia.
Pesquise também sobre outros produtos humanos produzidos por biotecnologia.
BIOTECNOLOGIA E
BIOINFORMÁTICA
AULA 6
Prof. Benisio Ferreira da Silva Filho
CONVERSA INICIAL
Em 1969 o homem pisou na lua. Para esse grande passo da humanidade foram necessários
desenvolvimentos de equipamentos, modos de navegação, compostos químicos para uso em
equipamentos e inúmeras inovações incluindo os computadores que precisaram ser otimizados para
auxiliar em inúmeros cálculos. Mas você sabia que os computadores utilizados na Apollo 11 que
chegou à Lua tinham menos capacidade de processamento que o celular que está no seu bolso
agora?
Se os computadores daquela época fossem utilizados para auxiliar nos projetos genoma, ainda
estaríamos analisando vários genomas e o humano ainda não teria terminado. Falar da era pós-
genômica (após a divulgação do genoma completo do Haemophilus influenzae em 1995), sem falar
que definitivamente o termo “Bioinformática” começou a ser usado e tratado como mais uma área
das ciências biológicas é grave. Não existe a evolução pós-genômica sem a Bioinformática. Vamos
falar do seu surgimento, sua importância, como funciona e seu principal objetivo, que é a busca por
comparações. Existem outras atividades hoje em dia na Bioinformática, além da comparação entre
sequências, que serão citadas, mas vamos exercitar a principal delas.
TEMA 1 – EVOLUÇÃO E ACÚMULO DE CONHECIMENTO TAMBÉM NA
INFORMÁTICA
Na década de 1940 surgiram os primeiros computadores, com destaque para o “pequenino” (sim
isso é uma ironia do professor) ENIAC (Eletronic Numerical Integrator and Computer). Esse
computador digital e eletrônico não deve ser comparado aos atuais. Deve ser visto como o início e
aprendam a exercitar a visão científica desta forma, foi a partir dele que os computadores ganharam
importância e desde então começaram a ganhar poder de processamento e diminuir de tamanho.
Para um grande volume de dados, mais processamento significa mais velocidade de análise e
obtenção de respostas. Quanto mais rápido, melhor para repetir e solucionar problemas sempre que
possível, logo, faça o seguinte exercício mental. Qual o genoma mais fácil de ser sequenciado? De
um vírus ou do chimpanzé?
Figura 1 – O computador ENIAC foi o primeiro computador digital eletrônico de uso geral. “Integrador
Numérico Eletrônico e Computador” tinha 150 pés de largura com 20 bancos de luzes piscando foto
de 1946
Créditos: Collection/Shutterstock.
1.1 BIOINFORMÁTICA
Com o passar dos anos a computação foi evoluindo (assim como já discutimos aqui, houve
evolução e avanços na área biológica também, tanto em técnicas quanto em conhecimento). Os
computadores foram ficando mais rápidos (maior poder de processamento), armazenavam cada vez
mais informações, estavam ficando menores até o ponto da possibilidade de serem portáteis, pois
antes computadores como o ENIAC ficavam em uma sala só deles e pesavam literalmente toneladas
de equipamentos (toneladas para apenas 1 único computador).
Os computadores e a internet mudaram de forma rápida toda a situação da pesquisa e aplicação
do conhecimento biológico. Antes dos projetos genoma a “biologia computacional” era algo que
estava sendo descoberto como parte importante do processo de desenvolvimento. Antes as
pesquisas costumavam ser iniciadas exclusivamente no laboratório com o in vitro e o in vivo, mas,
hoje, em dia elas podem começar com o in silico por meio de pesquisas em bancos de dados para
elaborar e sugerir novas hipóteses.
A Bioinformática é o uso dos recursos computacionais para gerenciar, armazenar e analisar
dados biológicos. A análise de dados oriundos de sequenciamento do DNA, RNA e Proteína realizado
por meio de softwares específicos com objetivos de compreensão biológica de um organismo, via
metabólica específica, transgenia, comparação entre organismos é o que define a Bioinformática.
Esse tipo de estudo e análise de grande quantidade de dados que só é possível devido a informática
e faz da Bioinformática uma ferramenta para o nosso desenvolvimento.
Figura 2 – Mesmo conhecendo a organização do DNA, do RNA e da proteína o volume de informação
é tão grande que só com recursos computacionais para organizar e analisar tudo isso
Créditos: unoL/Shutterstock.
1.2 EM ÁREA DO CONHECIMENTO ESTÁ A BIOINFORMÁTICA?
O mapeamento físico de uma ampla variedade de genomas ocorreu com uma incrível rapidez. Já
existe uma ampla variedade de meios de manipulação e análise juntamente com periódicos
especializados e uma linguagem específica. É muito difícil você, futuro Biomédico, futura Biomédica,
que está entrando na área de biologia molecular ou genética e não ter contato com a Bioinformática.
Hoje em dia isso é impossível. A Bioinformática é uma parte do conhecimento em biotecnologia, que
exige conhecimentos em genética, bioquímica, biologia molecular, matemática, física e química. É de
fato a união de conhecimentos consolidado na era pós-genômica.
TEMA 2 – DO ORGANISMO PARA OS BANCOS DE DADOS
O caminho para que as informações genéticas de um organismo seja ele qual for é: extração do
DNA, purificação do DNA extraído, metodologia de fragmentação e organização, finalizando esta
primeira parte no sequenciamento. Um sequenciador de DNA está inevitavelmente conectado a um
computador, portanto a leitura que ele realiza envia para o sistema a sequência de nucleotídeos. Essa
é a passagem do biológico para o virtual. A partir desse momento as informações biológicas são
analisadas em ambiente virtual. A quantidade de informação é muito grande como já foi dito, surge
então a necessidade de armazenar e analisar aos poucos. Como armazenar tanta informação?
Obviamente você deve ter pensado em armazenamento comum, em hard discs (HD), mas o
necessário é algo com maior poder de armazenamento. Existem hoje em dia locais com poder de
armazenamento físico, os chamados bancos de dados. É muita informação e o mundo envia seus
dados (grande volume de dados) pela internet. Os grupos que sequenciam amostras de DNA
submetem via internet essas informações para os bancos de dados biológicos. O principal deles é o
GenBank que pertence ao NCBI (National Center for Biotechnology Information).
O GenBank é um banco de dados que armazena principalmente sequência de nucleotídeos (DNA
ou RNA), tambémpossui informações sobre sequências peptídicas (informações proteicas) e
representa hoje o principal repositório de informações genéticas e moleculares do mundo. Os
trabalhos e esforços internacionais por exemplo de monitoramento genético de microorganismos
envolvem os serviços do GenBank. Por exemplo, durante a Pandemia (2020-2021) o mundo inteiro
submeteu sequências do novo coronavírus SARS-CoV-2 diariamente para o NCBI para que fossem
realizados alinhamentos na busca de encontrar mutações. Esse serviço de monitoramento genético
internacional não aconteceu pela primeira vez na pandemia do coronavírus, aconteceu também na
época do H1N1 e de outros vírus.
Figura 3 – O trabalho do sequenciamento além de muito importante representa a passagem das
informações biológicas para ambiente virtual onde elas poderão ser melhor analisadas
Créditos: BlurryMe/Shutterstock.
2.1 ARMAZENAMENTO DOS DADOS E A INTERNET
Auxiliando no surgimento da Bioinformática e sua importância, uma peça-chave para que
tenhamos hoje em dia, um grande fluxo de informações sendo depositadas em bancos de dados, a
transmissão de dados a distância, a internet. Bioinformática sem internet existe, mas é algo local.
Entenda, um grupo realiza o sequenciamento e localmente analisa os dados, armazena os dados
também localmente. A disseminação da informação e das descobertas ficam limitadas, o mundo só
saberá quando esse grupo divulgar por meio de publicações.
Agora imagine se os grupos realizam tudo isso e divulgam, compartilham todas essas
informações com o mundo. Aumenta a possibilidade de que algum grupo realize uma abordagem de
análise diferente e descubra algo a mais. O compartilhamento é possível devido à internet. Ela
permite que os dados sejam compartilhados e, melhor, organizados a distância em grandes bancos
de dados. Temos vários espalhados pelo mundo, mas merecem destaque aqui os três maiores e
mais importantes, todos públicos em com acesso facilitado a todos pela internet, formando então a
Colaboração Internacional de Análise de dados de Sequências Nucleotídicas, do inglês (INSDC –
International Nucleotide Sequence Database Collaboration, informações que podem ser acessadas
em http://www.insdc.org/). Fazem parte do INSDC temos os três principais bancos de dados: O NCBI,
onde encontra-se o GenBank entre outros bancos mais específicos, o DDBJ (DNA Data Bank of Japan
– Banco de dados de DNA do Japão) e o EMBL-EBI que faz parte do ENA (Arquivos de Nucleotídeos
Europeu do inglês – European Nucleotide Archive data discovery and retrieval). Esses três
repositórios de informações compartilham informações entre si e disponibilizam gratuitamente tudo,
possibilitando o crescimento do conhecimento em Biotecnologia, permitindo avanços rápidos em
todas as áreas incluindo a saúde humana.
TEMA 3 – CONTEÚDO DOS BANCOS DE DADOS
Antigamente, bem no início da Bioinformática e consolidação dos bancos de dados, era possível
definir que existiam três tipos de bancos de dados biológicos:
Bancos primários – com sequências de nucleotídeos (DNA e RNA).
Bancos secundários – com sequências de aminoácidos (proteínas).
Bancos terciários – com informações de interações, informações de vias metabólicas.
Houve obviamente uma expansão devido a quantidade de informações e especificidade,
portanto, hoje em dia, você encontra todo tipo de banco de dados com informações ômicas, por
exemplo, banco específico para determinado tipo de organismo, bancos específicos para genomas
completos, bancos com informações metabólicas, estruturas proteicas entre outros.
Dentro dos bancos você encontrará informações sobre a sequência (seja ela de nucleotídeos ou
aminoácidos), informando seu tamanho (em pares de bases ou quantidade de aminoácidos), grupo
que realizou o sequenciamento, qual o projeto de pesquisa ou iniciativa que justificou a realização,
qual o organismo em questão, regiões importantes da sequência caso exista (o posicionamento da
área de um gene, por exemplo) e, por fim, a sequência em questão. Então, que fique claro, quando
você acessa essas informações você não verá só a sequência, você terá todo acesso a informações
que auxiliam na compreensão da informação biológica e permite que sejam realizadas outras
análises com esses dados biológicos.
3.1 OUTRAS INFORMAÇÕES E FERRAMENTAS ENCONTRADAS NOS BANCOS DE
DADOS
Existem muitas outras informações que serão exploradas ao longo das aulas com o professor.
Hoje no NCBI (onde encontra-se o GenBank), que é o principal banco e o que estudaremos mais, você
encontra outras informações logo após você digitar no campo de busca o nome científico do
organismo que você deseja estudar, você será apresentado a diferentes bancos de informações (veja
que neste momento falo “informações). Bancos de literatura, bancos relacionados exclusivamente
com informações gênicas, com informações proteicas, banco com informações nucleotídicas,
informações sobre a relação com a saúde humana e um banco com informações sobre a química.
Com tantas informações disponíveis, diversas ferramentas também são encontradas para
facilitar a análise dos dados. Por exemplo, comparando as sequências você pode, por meio de
algoritmos, estabelecer uma relação entre elas, estabelecendo uma relação evolutiva entre elas
(análise filogenética), algoritmos para desenhos de primers (elemento fundamental na PCR,
consequentemente para diagnóstico molecular) e também recursos para visualização de estruturas
proteicas 3D. Como dissemos, a quantidade de informação é tão grande e as ferramentas e
programas de Bioinformática tão diversificados, que tornam possível, em um curtíssimo espaço de
tempo, identificar um patógeno, por exemplo, sequenciar seu material genético. E, a partir daí,
começar a realizar diagnóstico molecular para confirmação do patógeno em amostra biológica. A
Bioinformática acelerou esse processo que poderia durar 2 ou 3 anos para semanas. Veja como foi
rápido no caso do SARS-CoV-2. Em pouquíssimo tempo sabíamos como era seu material genético e
em semanas já tínhamos meios de detectar seu material genético em amostras coletadas com
Swab.
Figura 4 – Coleta com Swab de amostra orofaríngea, material levado para o laboratório par ao teste
de RT-PCR. Por que conseguimos detectar a presença do vírus? Porque conhecemos o seu material
genético e desenvolvemos primers para teste de reação em cadeia da polimerase
Créditos: okan celik; Ks Ks/Shutterstock.
A principal ferramenta de Bioinformática (sim existem outras) é o algoritmo de comparação
entre sequências BLAST. A comparação entre sequências é um procedimento muito utilizado e útil
para compreensão do que está sendo estudado. Vamos detalhar mais sobre o BLAST.
TEMA 4 – BLAST
Grave essa simples explicação antes dos detalhes.
Dadas duas ou mais sequências, nós inicialmente pretendemos:
Medir as suas similaridades.
Determinar as correspondências entre pares de resíduos (nucleotídeos ou aminoácidos).
Observar, por meio dessas comparações, padrões de conservação e variabilidade.
Inferir relações evolucionárias ou possíveis funções biológicas.
O BLAST (Basic Local Alignment Search Tool – Ferramenta de Procura e Alinhamento Local
Básica) é o algoritmo desenvolvido e publicado em 1990, por Stephen F. Altschul e colaboradores,
cuja função é comparar uma sequência com outra e baseado nessa comparação ele vai estabelecer
por meio de valores o quão “similar” é uma sequência em relação a outra.
Ele é importante pois, se você possui informação genética ou proteica conhecida, pode usar as
que são conhecidas como referência. No momento que você compara outras que apresentam alta
similaridade com as suas que você conhece, você estabelece uma relação entre elas.
Bioquimicamente essa similaridade é importantíssima.
O alinhamento de sequências é a ação mais importante de toda a bioinformática (biologia
computacional), dado o número e diversidade de sequências existentes e dada a frequência com que
ele precisa ser resolvido diariamentepelo mundo a fora. Em outras palavras: se “a” é muito parecido
com “b” e se sei a função de “b”, então com grande probabilidade “a” terá a mesma função. Em
sequências de DNA, RNA e proteínas alta similaridade implica em alta similaridade estrutural e
consequentemente funcional.
Não podemos confundir e misturar similaridade com homologia. O alinhamento entre
sequências indica o grau de similaridade entre elas, isto é, a quantidade de nucleotídeos iguais na
mesma posição em ambas as sequências (ou mais de uma) ou entre sequências de aminoácidos.
Homologia é uma hipótese de cunho evolutivo e não possui gradação.
O algoritmo BLAST é extremamente simples e se baseia no conceito de “par de segmentos”.
Dada duas sequências, um par de segmentos é definido como um par de subsequências de mesmo
comprimento que forma um alinhamento sem gap. A ideia é analisar se essa comparação identifica
se elas são muito parecidas e dessa comparação, receberemos um resultado que significa o quão
similar elas são.
Figura 5 – Uma comparação simples entre 3 sequências. A é nossa sequência de referência, nós
sabemos sua função biológica, o que ela irá expressar. Quando compramos ela com a sequência B,
observamos 2 mudanças de nucleotídeos, logo elas não são iguais, mas, muito parecidas.
Comparando com a comparação entre A e B, a comparação entre A e C mostra uma diferença maior
entre as sequências. Por conta dessa simples comparação eu posso inferir o seguinte: B é tão similar
a A que ele possui mesmo função biológica que a de A. C é tão diferente de A que não possui a
mesma função biológica
Fonte: Silva, 2020.
4.1 ALINHAMENTO DE SEQUÊNCIAS – MODALIDADES DE ALINHAMENTO
A comparação entre duas sequências pode ser entre toda sua extensão (uma sequência inteira
contra toda extensão de outra) ou apenas um trecho de uma contra outra sequência. Temos então o
alinhamento global e o alinhamento local.
Alinhamento global: similaridade considerada ao longo de toda extensão da sequência.
Alinhamento local: as regiões de similaridade consistem em uma fração da extensão da
sequência.
Figura 6 – Modalidades de alinhamento e análise entre sequências
Fonte: Silva, 2020.
É possível, por meio do BLAST, realizar um alinhamento entre duas sequências ou um
alinhamento múltiplo. É possível também realizar um alinhamento entre sequências de aminoácidos.
Com os conhecimentos do Dogma Central da Biologia Molecular, é possível também realizar uma
comparação entre sequências de DNA e obter informações de comparação baseadas no que seria
uma expressão gênica, ou seja, o algoritmo entende que é uma sequência de nucleotídeo, organiza
em códons e cada códon traduzido em um aminoácido a resposta final seria qual a sequência de
aminoácido mais próxima da sequência de DNA que você apresentou ao BLAST. Tudo isso será
explicado pelo professor em sua prática de Bioinformática.
Figura 7 – O fluxo de informação do DNA até a proteína pode ser analisado pela bioinformática
Crédito: udaix/Shutterstock
TEMA 5 – AINDA HÁ MUITO O QUE FAZER E A BIOINFORMÁTICA
ESTARÁ LÁ AJUDANDO
Temos a informação do genoma humano, sua organização, posição dos genes, mas conhecer o
gene e sua expressão é apenas uma parte da informação, é preciso entender o funcionamento da
informação. Há maneiras de regular a expressão dos genes, quando metilados, por exemplo, há uma
interrupção da expressão e isso acontece sem alterar a sequência de nucleotídeos. Logo, é
importante entender o processo de metilação concorda?
Outros projetos surgiram ao final do PGH com o intuito de compreender o funcionamento do uso
de informações genéticas pelas células, dando origem a diferentes funções e tecidos.
O ENCODE (Encyclopedia of DNA Elements – Enciclopedia de Elementos do DNA) tem como
objetivo estudar e catalogar toda informação funcional do genoma. O que está sendo transcrito,
quando e onde, informações essas importantíssimas para medicina. É uma versão mais robusta da
ideia geral do projeto transcriptoma, mais detalhado.
O Projeto Epigenoma Humano (PEH) objetiva estudar o funcionamento dos processos
epigenéticos que regulam a expressão dos genes. Padrões de metilação implicam por exemplo, na
idade de início de uma doença e até seu nível de gravidade de sintomas como por exemplo nas
síndromes de Angelman e Prader-Willi (imprinting genômico). Esses padrões são herdáveis, além do
fato de que o processo de metilação das sequências impede que os fatores de transmissão se
liguem a região reguladora. A síntese de micro RNAs (miRNA) também é uma forma pós-
transcricional de regulação e conhecer as formas de regulação gênica é de extrema importância, não
é só a sequência do gene.
O Projeto HapMap (Mapa de Haplótipos) tem uma importância especial, como parte dos
estudos de doenças multifatoriais. Nesse projeto são estudados SNPs (single nucleotide
polymorphism) para genética de populações, mas ganhou destaque após os esforços do WTCCC
(wellcome trust case control consortium) que comparou padrões de SNP de 14 mil pacientes com
sete tipos de doenças multifatoriais e comparou com 3 mil indivíduos controle. Como resultado,
alguns desses SNPs apresentaram, estatisticamente, relação com determinadas doenças, mas por
encontrarmos alguns SNPs estatisticamente relacionados em regiões intergênicas e até em íntrons,
torna-se difícil validá-los com testes biológicos. Essa iniciativa continua e o objetivo é ao final ter
respostas como temos para doenças monogênicas.
Um outro projeto que merece nossa atenção é o projeto Microbioma Humano, que visa a
identificação dos microrganismos e a relação exata deles conosco. Informações obtidas até o
momento mostram que esse microbioma residente faz parte da nossa fisiologia e mudanças
implicam em respostas do nosso organismo podendo facilmente relacionar essas mudanças com
doenças e condições desfavoráveis. Esse estudo envolve também a análise entre as diferenças do
microbioma encontrado em adultos e crianças.
Figura 8 – Microbioma humano, material genético de todos os micróbios que vivem no corpo
humano e dentro dele
Crédito: Design_Cells/Shutterstock
Figura 9 – Microbioma do recém-nascido, o microbioma intestinal infantil, material genético de todos
os micróbios sendo analisado por bioinformática. Estudo para melhor compreensão da saúde e
desenvolvimento humano
Crédito: Design_Cells/Shutterstock
A Farmacogenômica outra área que surgiu com esses avanços é o estudo da interação de
moléculas/fármacos com proteínas de uma dada via metabólica, bem como com possíveis
isoformas. De forma mais específica veio a Toxicogenômica.
Todos esses avanços abriram espaço para o crescimento de novas terapias, como a terapia
gênica e a interferência por RNA (RNAi). Essas pesquisas têm como objetivo recuperar determinado
fenótipo ou interromper a expressão de um gene. Existem resultados positivos nesse momento e
muitos outros que ainda estão sob análise.
Inevitavelmente novas questões éticas surgiram. Com tantas promessas iniciais, os avanços
tecnológicos que acompanharam tal esforço surgiram as dúvidas e preocupações. Como essas
informações biológicas serão utilizadas? Poderia ocorrer uma separação de etnias? Quanto a última
pergunta o próprio projeto genoma já nos respondeu que somos 99,9% similares, esse 0,1% de
diferença explica nossas diferenças fenotípicas que hoje sabemos ocorrem devido a adaptações ao
meio.
No início do PGH parte do financiamento foi direcionado ao HUGO (Human Genome
Organization) para criar um grupo que cuidasse das questões éticas do programa e assim surgiu o
ELSI (Ethical, Legal and Social Implications – Implicações Éticas, Legais e Sociais). A finalidade era
analisar as possibilidades de uso dessas informações sem interferir na ética e legalidade. O ELSI
trabalhou com professores e alunos universitários na época (anos 1990) gerando conhecimento
sobre as possíveis aplicações, visando sempre a manutenção de ações éticas quanto ao uso dessas
informações. Baseado nessasrecomendações do ELSI vários países incluindo o Brasil criaram
legislações ou atualizaram suas leis para esta nova realidade, temos agora informações genéticas
humana, mas nunca iremos usá-la contra a humanidade nem para distorcer o que define o Homo
sapiens. Em 2008, por exemplo, um médico chinês realizou alterações genômicas em 2 bebês que
nasceram imunes ao vírus HIV. Modificações genéticas não são permitidas e o governo chinês
prendeu o médico e ainda exigiu pagamento de multa. Casos similares não serão tolerados.
Outro detalhe ético discutido é o uso de tais informações genéticas do indivíduo por parte de
seguros ou planos de saúde, tornando-se uma preocupação. Pessoas tem culpa de possuírem
informações genéticas que do ponto de vista de mercado são desfavoráveis? Uma pessoa que
nasceu com alterações genéticas que a predispõe a uma ou duas doenças já merecem receber um
valor mais alto de planos de saúde ou pelos serviços de saúde? Isso é uma forma de discriminação?
Essa preocupação também impulsionou cuidados com o uso das informações dos projetos genoma.
NA PRÁTICA
Sem dúvidas os avanços da informática e a união com o conhecimento em ciências biológicas, a
química e a física permitiram os projetos genoma e todos os avanços biotecnológicos vistos hoje em
dia. Toda informação genética é de interesse dos profissionais de saúde, pois alterações, sejam elas
estruturais ou pontuais, implicam a gênese de doenças. Tais informações, hoje, são conhecidas e
mais estudos estão sendo realizados com o uso das tecnologias desenvolvidas durante a era pós-
genômica.
FINALIZANDO
A melhor forma de fixar todo esse conhecimento é praticando, visite agora mesmo o portal do
NCBI ( <https://www.ncbi.nlm.nih.gov/>) e faça os exercícios que o professor realizou com você.
Faça uma expansão desse conhecimento realizando buscas do que mais te interessa no curso, área,
microrganismo, doença ou gene na página e veja as informações apresentadas. São informações
oficiais e reais, o maior laboratório biotecnológico virtual do mundo.
REFERÊNCIAS
ALBERTS, B., et al. Biologia molecular da célula. 6. ed. Porto Alegre: Artmed, 2017.
LEHNINGER, A. L.; NELSON, D. D.; COX M. M. Lehninger Princípios de Bioquímica. 7. ed. São
Paulo: Sarvier, 2019.
LESK, A. M. Introdução à Bioinformática. Tradução Ardala Elisa Breda Andrade, et al. Oxford:
Oxford University Press, 2008.
https://www.ncbi.nlm.nih.gov/
https://www.ncbi.nlm.nih.gov/
https://www.ncbi.nlm.nih.gov/
https://www.ncbi.nlm.nih.gov/

Mais conteúdos dessa disciplina