Buscar

Introdução t1

Prévia do material em texto

Introdução à Bioinformática
Prof. Eldio Gonçalves dos Santos
Descrição
Histórico, relação com a biologia molecular, áreas do conhecimento envolvidas e aplicações da bioinformática.
Propósito
Compreender os conceitos de biologia molecular, o histórico e as aplicações da bioinformática é importante
para iniciar os estudos nessa nova área do conhecimento, que gera grandes descobertas e avanços
especialmente no âmbito biomédico.
Objetivos
Módulo 1
A biologia molecular e a bioinformática
Descrever os conceitos de biologia molecular e das proteínas importantes para a bioinformática.
Módulo 2
Aplicações da bioinformática
Aplicações da bioinformática
Reconhecer o histórico e algumas aplicações da bioinformática no mundo atual.
A biologia molecular é responsável por estudar as moléculas que realizam a manutenção da vida —
DNA, RNA e proteínas —, que têm como função principal, considerando o dogma central da Biologia,
armazenar informações, enviá-las para a síntese das proteínas e realizar as funções celulares,
respectivamente.
Diversos dos avanços que tivemos até hoje se deram devido à elaboração de técnicas que nos
proporcionaram novas formas de estudar o DNA e o RNA, que estão em constante evolução.
Recentemente, a informática tornou-se uma importante aliada, criando uma ciência, a Bioinformática.
Assim, essa nova ciência atua em parceria com a Ciência da Computação, Estatística, Matemática e as
Engenharias para analisar, interpretar e processar dados biológicos.
A bioinformática hoje está presente, mesmo que de forma indireta, na vida de todos os pesquisadores e
em praticamente todos os laboratórios do mundo. Neste conteúdo, vamos entender conceitos sobre
biologia molecular, para melhor compreender a bioinformática e descobrir afinal o que ela é, para que
serve, como surgiu e conhecer algumas de suas metodologias. Vamos juntos?
Introdução
1 - A biologia molecular e a bioinformática
Ao �nal deste módulo, você será capaz de descrever os conceitos de biologia molecular e das
proteínas importantes para a bioinformática.
Conceitos de biologia molecular
importantes para a bioinformática
Todos os seres vivos do planeta, para continuar existindo, precisam se reproduzir, ou serão extintos. Há
diversas formas de reprodução, mas todas envolvem a cópia de uma biomolécula bem característica, formada
pela união de um grupamento fosfato, uma pentose e uma base nitrogenada, chamada de ácido
desoxirribonucleico (ADN) — mais conhecida como DNA. Na imagem a seguir conseguimos relembrar a
estrutura do DNA.
Estrutura de uma molécula de DNA.
Como já sabemos, existem quatro diferentes nucleotídeos presentes no DNA: Adenina (A), Timina (T), Guanina
(G) e Citosina (C). Esses são formados por três diferentes elementos: uma base nitrogenada, que vai de fato
dar o nome para o nucleotídeo (A, T, C, G); uma pentose, que será ribose no RNA ou desoxirribose no DNA; e um
grupamento fosfato, que interage com a pentose fazendo uma ligação fosfodiéster. A adenina se liga a uma
timina por uma ligação dupla de hidrogênio e a guanina se liga com a citosina por uma ligação tripla de
hidrogênio, conforme observamos na imagem a seguir:
Ligação fosfodiéster
Une dois nucleotídeos pela ligação entre fosfatos no quinto carbono de uma desoxirribose ou ribose com a
hidroxila presente no terceiro carbono da desoxirribose ou ribose de um outro nucleotídeo.
Bases nitrogenadas presentes no DNA.
O DNA tem como função principal armazenar uma série de sequências e padrões que serão lidos por um
sistema bastante complexo. Ao ter sua expressão feita de forma correta, resulta na formação de determinado
ser vivo. Essa molécula, por ser estável, é capaz de carregar todas as informações genéticas de um indivíduo e
ser copiada para gerar outros indivíduos idênticos.
Mas como ocorre o fluxo de informação nos organismos vivos?
Replicação
Primeiramente, ocorre a cópia completa de toda a sequência de DNA contida em cada célula
individual, em um processo chamado de replicação. No entanto, para que as informações
contidas no DNA sejam convertidas em proteínas, elas precisam ser transformadas em uma
molécula intermediária — o RNA (ácido ribonucleico), que é constituído por uma pentose e um
fosfato e tem como bases nitrogenadas a adenina, a guanina, a citosina e a uracila.
Transcrição
Aminoácido
É a menor unidade funcional de uma proteína. É uma molécula pequena formada por um grupamento R, um
grupamento amina e um grupamento ácido carboxílico.
Cadeia peptídica
A cadeia peptídica que irá se tornar uma proteína precisa ser moldada tridimensionalmente para adquirir sua
característica terciária e quaternária. Tal processo é feito por proteínas chamadas chaperonas.
Nos seres vivos existe uma enorme variação de proteínas com diferentes funções essenciais à vida. Elas
coordenam quase todos os processos vitais, como o metabolismo celular e bioquímico, o apoio na divisão do
DNA, a síntese de moléculas importantes para a manutenção da célula etc.
Esse fluxo de informação genética dentro de uma célula ou em um organismo recebe o nome de dogma
central da biologia molecular. Na imagem abaixo vemos um esquema que retrata esse dogma tão importante
para a biologia molecular.
Transcrição
Para isso, o DNA deve ser reconhecido pela proteína RNA polimerase, para gerar uma molécula
de RNA mensageiro (RNAm), no processo chamado de transcrição. O RNAm carrega as
informações contidas no DNA e é lido pelo ribossomo, de três em três bases nitrogenadas. A
cada conjunto desse damos o nome de códon.
Tradução
Cada códon indica que um aminoácido será inserido pelo ribossomo em uma cadeia maior. A
união de diferentes aminoácidos forma uma cadeia peptídica, que, ao se organizar, gera uma
proteína. Esse processo é chamado de tradução, e ocorre quando um RNAm é traduzido em
proteínas, que são as unidades funcionais do nosso corpo.
Esquema do dogma central da biologia molecular.
O dogma central da biologia foi criado em 1958, por Francis Crick, e afirma que é preciso uma determinada
sequência de eventos para que a informação genética seja traduzida.
Francis Crick.
Saiba mais
Há alguns organismos, como vírus, capazes de reverter o dogma central da biologia a partir da proteína
transcriptase reversa. São exemplos o vírus da imunodeficiência adquirida e o SARS-CoV-2.
Replicação, transcrição e tradução do DNA
Veja agora os processos que envolvem as etapas de replicação, transcrição e tradução, que compõem o
dogma central. Vamos lá!
É um pouco difícil tentar imaginar como o DNA armazena tanta informação em um espaço tão pequeno, mas
vamos comparar com um computador tradicional.
Imagine que o hard disk (HD) do seu computador consiga guardar informações de 500 gigabytes ou 1 terabyte.

Ou seja, uma unidade de conversão na qual 1 gigabyte equivale a 109 bytes, 1 terabyte equivale a 1012 bytes, e
um byte equivale a 8 bits. O computador funciona com uma base binária de 0 e 1, e cada sinal desse (0 ou 1)
equivale a um bit, sendo que a cada 8 bits temos um byte.
O nosso DNA funciona como um programa de computador (de verdade, a semelhança é impressionante!).
Vejamos alguns exemplos disso: os computadores, como já dissemos, utilizam um sistema binário (0 e 1). Já
o DNA possui um sistema quaternário com as variáveis A, T, C, G, na qual cada códon seria equivalente a 1 byte
(equivale a 8 bits), e cada letra de DNA, 1 bit. Além disso, alguns vírus são capazes de modificar as sequências
do DNA, assim como nos softwares.
Curiosidade
Se convertêssemos para uma unidade em bytes, cada célula humana teria cerca de 1,5 gigabytes!
Existe ainda um código que comanda a construção das proteínas, o código genético, e esse código é universal,
válido para todos os seres vivos, demonstrando que todos eles possuem uma origem única e é determinado
pelos códons.
Comentário
A universalidade do código genético indica que Darwin tinha razão em sua teoria de evolução, pois segundo
essa teoria, todas as espécies que mudamao longo do tempo, dão origem a novas espécies e compartilham
um ancestral comum.
Na tabela a seguir vemos o código genético, ou seja, a relação entre os códons (sequência de 3 bases
nitrogenadas) e os aminoácidos correspondentes.
Quadro contendo todo o código genético.
Ao observar a tabela, percebemos que um aminoácido pode ser representando por mais de um códon.
Dizemos que o código genético é degenerado/redundante. Isso é importante, pois
modificações em uma das bases nitrogenadas podem não alterar o tipo de
aminoácido encontrado.
Por exemplo, a mudança da base uracila (GUU) para uma das outras três bases nitrogenadas (GUC, GUA ou
GUG) não altera o aminoácido que será integrado na sequência de peptídeos, que em todos os códons será a
valina. No exemplo anterior, assim como em toda a tabela do código genético, conseguimos perceber que as
alterações nos códons para esse código genético ser degenerado se encontram na terceira base nitrogenada
do códon. Isso quer dizer que o código genético apresenta especificidade para a 1ª e 2ª bases e tolera
oscilações na 3ª base no códon.
Por outro lado, observamos que cada códon não especifica mais de um aminoácido. Sendo assim, dizemos
que o código genético não é ambíguo, ou seja, o códon GUU vai sempre indicar a inclusão de uma valina na
sequência de aminoácidos e CCU de uma prolina.
Saiba mais
Alguns códons são bem importantes na construção da cadeia peptídica. Entre eles, podemos destacar o start
códon e o stop códon, que são responsáveis por iniciar e parar a síntese da cadeia, respectivamente. O start
códon é dado por AUG, e o stop códon pelas sequências UAA, UAG e UGA.
Evolução genética
Algum HD seu já deu defeito? Já perdeu algum arquivo importante, como uma foto ou um texto em que você
estava trabalhando, devido a um problema de umidade ou pancada no computador? Ou simplesmente
aconteceu uma falha no sistema? É normal. Os HDs irão dar defeito. Os técnicos de informática dizem: “Você
já perdeu seus arquivos, só não sabe quando.”
Com o DNA acontece algo relativamente semelhante: a informação armazenada pode sofrer diversos
processos que alteram a informação contida, e a essas alterações damos o nome de mutação.
As mutações são alterações permanentes na sequência de bases nitrogenadas do material genético de um
organismo, causadas por uma série de fatores, como radiação, erros de replicação, envelhecimento, falhas na
maquinaria de reparo do DNA, atuação de agentes mutagênicos etc., que podem ocasionar diferentes
alterações na estrutura do DNA. São elas:
Susbtituição de uma base por outra
Este processo pode ocorrer nas seguintes formas:
Pode acontecer de forma silenciosa, ou seja, sem perda de informação original.
Mutação de substituição silenciosa.
A mutação de substituição pode alterar a sequência de aminoácidos que será traduzida.
A substituição pode alterar o aminoácido.
Silenciosa 
Mutação de sentido trocado 
Mutação sem sentido 
A substituição de uma base nitrogenada leva à interrupção da tradução.
A mutação de substituição pode interromper a tradução.
A inserção de base nitrogenada desloca o restante da sequência para a direita, alterando a sequência
de RNAm e os códons que serão traduzidos.
A inserção de uma base nitrogenada altera os códons que serão traduzidos.
A deleção de base nitrogenada desloca o restante da sequência para a esquerda, alterando a sequência
de RNAm e os códons que serão traduzidos.
Mutação sem sentido 
Inserção 
Deleção 
A deleção de uma base nitrogenada altera os códons que serão traduzidos.
O nosso organismo tem maneiras de reparar esse tipo de mutação, mas, quando não há o reparo, acontece o
que chamamos de frameshift, que em inglês significa “mudança de quadro”, ou seja, toda a forma com que os
códons são lidos daquele trecho em diante ficará alterada, o que pode gerar uma leitura completamente errada
de toda a sequência após a mutação ou uma interrupção da leitura, caso apareça um stop códon.
Esquema ilustrando um exemplo de frameshift gerando alteração na proteína final.
As mutações podem ocasionar doenças genéticas. Artrite reumatoide, doença de Crohn, doença de Alzheimer
e fibrose cística, por exemplo, são causadas por mutações do tipo SNPs, do inglês Single Nucleotide
Polymorphisms (polimorfismo de nucleotídeo único), em que a alteração de um único nucleotídeo é capaz de
desencadear uma doença.
Exemplo de alteração SNP no DNA.
Além das SNPs, há outras mutações que podem conferir alguma quebra na homeostasia do corpo.
O projeto Genoma Humano possibilitou o mapeamento genético humano e permitiu identificar nos genes quais
são as regiões cruciais que desencadeiam determinadas doenças, ou ainda prever possíveis outras apenas
pelo sequenciamento genético. Fique tranquilo, iremos voltar ao Projeto Genoma em um outro momento.
O caso mais famoso desse tipo de abordagem aconteceu com a atriz Angelina Jolie. Após um
sequenciamento genético, foi detectada uma mutação no gene BRCA1, um gene responsável pela produção de
proteínas supressoras de tumores, ou seja, proteínas que reparam o DNA danificado e, assim, desempenham
um papel na garantia da estabilidade do material genético de cada célula.
Uma mutação ou alteração nesse gene leva à síntese de proteínas não funcionais, permitindo que danos no
DNA da célula não sejam reparados e aumentando a possibilidade de desenvolvimento de câncer de mama.
Assim, quando a atriz descobriu a mutação, ela decidiu remover o tecido, o que causou muita polêmica na
época.
Mas nem sempre as mutações geram malefícios. As mutações foram cruciais no decorrer da história,
considerando um longo prazo (milhões de anos) para que a vida na Terra seja como ela é hoje. As mudanças
que ocorreram no DNA dos seres vivos fizeram com que algumas proteínas se comportassem de forma
diferente, tanto para melhor, sendo mais eficientes, quanto para pior, causando problemas graves para o
organismo.
Se pensarmos a curto prazo (alguns anos), seres que tiveram mutações que de alguma forma os faziam mal
morreram e foram esquecidos, e tais mutações não foram consolidadas.
No entanto, imagine diversas e diversas perpetuações de mutações benéficas ao longo de milhares de anos.
Isso causaria uma diferenciação significativa em determinadas populações, gerando uma evolução por
seleção natural de toda uma espécie. Alguns organismos mutaram tanto a ponto de iniciar novas espécies e,
assim, por diante.
A filogenética é a ciência que estuda a história da evolução das espécies para mapear
todas essas alterações genéticas e avançarmos na montagem desse enorme quebra-
cabeça evolutivo.
A imagem abaixo retrata um mapa filogenético. Verifique a nossa posição no mapa.
Árvore filogenética universal simplificada.
A popularização da informática no final da década de 90 possibilitou construirmos enormes bibliotecas
gênicas, a ponto de ser possível concluir o projeto Genoma Humano.
Durante essa pesquisa, após observada a função de vários genes, foi descoberto que nós, seres humanos,
tínhamos genes muito semelhantes a outras espécies (até mesmo bactérias).
Genes
Segmento de DNA que possui informação para que ocorra a síntese de um RNA mensageiro.
Exemplo
Genes relacionados a vias metabólicas, estruturais, de regulação de ciclo celular etc.
O mapa filogenético nos indica que existem ancestrais comuns. Assim é possível pontuar a história evolutiva e
estudar como se deu a evolução dos genes. Dividimos as características do histórico evolutivo em genes
homólogos e análogos.
Homologia é o compartilhamento de uma característica derivada de um mesmo ancestral, ou seja, que
foi compartilhada durante a história evolutiva. Órgãos homólogos são aqueles que apresentam
características similares em diferentes espécies, por exemplo, a pata do cavalo, a pata do leão, as
nadadeiras das baleias e o braço do ser humano que são homólogos entre si.
Mas você sabe o que é Homologia? 
Exemplo de órgãos homólogos.
Os genes homólogos, por sua vez,também indicam que determinado gene apresenta uma ancestralidade em
comum. Porém, é importante relatar que esses genes não são iguais.
Os genes homólogos podem ser genes ortólogos ou parálogos.
Genes ortólogos
São genes presentes em espécies diferentes que surgem de um ancestral comum por meio de especiação, ou
seja, por meio do processo evolutivo pelo qual novas espécies surgem. Nesse caso, a função tende a ser
conservada e cada descendente tem uma cópia.
Genes parálogos
Estão presentes na mesma espécie em estudo por duplicação. Nesse caso, a função tende a mudar e estão
presentes em mais de uma cópia.
Mas e os genes análogos?
Antes, precisamos entender que, nesse caso, a analogia traz a ideia de que tais genes têm características
semelhantes, mas não pertencem a um ancestral comum.
Os exemplos mais clássicos são asas de uma ave, de um morcego e de um inseto. Elas estão muito distantes
na árvore evolutiva e mesmo assim possuem a mesma função.
As asas de um morcego, de um inseto e de uma ave têm características análogas.
Os genes análogos são sequências de nucleotídeos diferentes, mas que traduzem proteínas com a mesma
função. Confuso? Calma, a seguir vemos a imagem de uma árvore filogenética resumindo todos esses
conceitos.
Genes homólogos e análogos entre o homem, o chimpanzé e a bactéria Escherichia coli.
Na imagem, note o gene das histonas presente no chimpanzé e nos homens e o gene da proteína HNS
Escherichia coli. As histonas são proteínas responsáveis pelo processo de compactação/descompactação do
DNA, possibilitando assim a regulação gênica e a interação com RNA polimerase. Há cinco tipos de histonas
que diferem no peso molecular e na função. Na imagem ilustrada, demonstramos dois deles.
Proteína HNS
É uma proteína semelhante à histona e representa um componente estrutural na bactéria que influencia muitos
processos celulares, incluindo recombinação, transcrição e transposição.
Expressão gênica
Todas as informações do nosso corpo ficam no DNA e todas as nossas células possuem o mesmo DNA,
compactadas o máximo possível para caber dentro do núcleo. As células do intestino e do cabelo possuem o
mesmo DNA, mas como isso é possível, uma vez que elas são tão diferentes em praticamente todos os
aspectos?
Para responder a essa pergunta devemos olhar para o passado e entender como as primeiras bactérias foram
evoluindo para melhor se adaptarem ao meio em que viviam.
Como vimos, a evolução se dá por mutações perpetuadas ao longo de gerações. Vejamos a situação
apresentada abaixo:
Atividade discursiva
magine duas bactérias de colônias diferentes, a bactéria X e Z, em um ambiente com pouca oferta de nutrientes.
bactéria X continua a todo vapor sua produção de proteínas, com o metabolismo e o consumo de nutrientes
uncionando normalmente. Já a bactéria Z, quando tem uma resposta de escassez nutricional mediada por
atores intracelulares, começa a frear seu metabolismo e passa a usar outra fonte de nutrição.
ual das duas bactérias você acredita que terá mais chances de sobreviver, a X ou a Z?
Digite sua resposta aqui
Exibir Solução
Nas bactérias, a regulação via operon Lac acontece de forma muito parecida. Mas vamos entender melhor?
O operon Lac é um conjunto de genes relacionados ao metabolismo da lactose, um açúcar que pode ser usado
para a nutrição de diversas bactérias. Na falta de lactose, não há motivos para a bactéria gastar energia na
produção de proteínas que quebram a lactose, então ocorre uma inibição da região que promove a expressão
dessas proteínas, alterando o metabolismo daquele indivíduo para algo que faça mais sentido para o meio em
que ele vive.
Esquema de regulação do operon Lac mediado por lactose.
O mecanismo no qual uma bactéria tem de controlar seu metabolismo chama-se regulação da expressão
gênica. Em resumo, são uma série de estímulos que determinam o padrão da expressão dos genes, esse
padrão fará com que o produto final, ou seja o RNA e a síntese de proteínas mude de acordo com o que está
acontecendo naquele momento.
Existem ainda as proteínas reguladoras transcricionais, que podem de alguma forma ativar ou reprimir a
transcrição, de acordo com a necessidade do organismo.
Exemplo
A ausência de lactose pode ativar a proteína reguladora repressora e as sequências regulatórias, que são os
trechos em que as proteínas reguladoras se acoplam para exercer sua função.
Os organismos procariotos possuem o DNA disperso no citoplasma, já os eucariotos possuem o DNA envolto
por uma membrana nuclear e também mecanismos próprios de expressão gênica.
Existem inúmeros processos de controle de expressão, entretanto todos eles dependem do quão compactado
está o DNA, uma vez que quando compactado fica impossibilitado de transcrever, logo não há como aquele
gene ser expresso. Já um DNA mais relaxado permite que as proteínas responsáveis pela transcrição atuem e
pode ser expresso.
Nos eucariotos damos o nome de heterocromatina à região onde o DNA está compactado e inacessível, e
eucromatina quando ele está na forma descompactada. Essa regulação é feita através das histonas, que como
já sabemos controlam o grau de compactação do DNA. O mecanismo pelo qual as histonas realizam a
compactação/descompactação do DNA ocorre por um processo químico, quando estão acetiladas (na
presença de um grupamento acetil) ocorre um relaxamento do DNA e quando estão metiladas (na presença de
um grupamento metil) ocorre a compactação do DNA.
Heterocromatina (esquerda) e Eucromatina (direita).
Outra forma de controlar a expressão em eucariotos é controlar como o transcrito de RNA será submetido ao
splicing alternativo.
Mas o que é o splicing?
O DNA apresenta sequências codificadoras (éxons) intercaladas com sequências não codificadoras (íntrons),
para esse trancrito ser funcional devemos descartar os íntrons e ter um transcrito composto apenas por éxons.
Para isso são realizados cortes em regiões específicas chamadas de sítio de splicing. Para entender melhor,
observe a imagem a seguir:
Esquema mostrando o splicing, processamento do DNA semelhante a um “corte” e “cola”.
No entanto, a ligação entre os éxons pode ser realizada de diferentes maneiras durante o processamento do
RNA, a isso chamamos de splicing alternativo. Pode haver mais de uma combinação desses diferentes trechos
chamadas de isoformas do transcrito, gerando diferentes proteínas a partir de um mesmo gene. O splicing,
desse modo, permite uma diversificação da expressão gênica e assim uma enorme variabilidade celular.
Diferentes isoformas do RNAm.
Existem ainda diversas outras formas de controle de expressão, como os fatores transcricionais, que são
moléculas ou proteínas que atuam ativando ou inibindo a transcrição de determinados trechos, e a epigenética,
que é uma ciência que tem como objetivo estudar como fatores externos ao organismo influenciam na
expressão dos genes, entre outros.
O mais importante é compreendermos que há diversos mecanismos que influenciam a expressão genética,
para assim responder ao nosso questionamento do começo do tópico:
“As células do seu intestino e do seu cabelo possuem o mesmo DNA, mas como isso é
possível, uma vez que elas são tão diferentes em praticamente todos os aspectos?”
Resposta
Apesar dessas células terem o mesmo DNA, seu padrão de expressão genético não é o mesmo. As regiões de
hetero e de eucromatina são arranjadas de formas distintas, ou seja, o padrão de splicing é diferente. Dessa
forma, temos a síntese de diversas proteínas que são responsáveis pela função específica de um órgão
específico.
Proteínas
As proteínas são biomoléculas construídas a partir de ligações peptídicas formadas no ribossomo, com a sua
sequência dada pela ordem dos códons de RNAm, que foram transcritos do DNA. Além de serem responsáveis
por manter o funcionamento celular, elas possuem funções diversas, como:
Formar a estrutura celular (actina);
Catalisar reações químicas no metabolismo de nutrientes (desidrogenases);
Servir de transportede pequenas moléculas (canais iônicos);
Movimentação celular (cinesina);
Sinalização (proteína G);
Defesa celular (anticorpos) etc.
As proteínas são classificadas quanto à sua estrutura em quatro diferentes níveis:
Esta estrutura constitui as ligações peptídicas entre os aminoácidos.
Estrutura primária 
E t t dá i
É a forma como a proteína se organiza — cujos três tipos gerais de estrutura são as α-hélices, as
folhas-β e as regiões de loop que conectam as duas anteriores.
Representada pelo conjunto das α-hélices, folhas-β e loops, que dá origem a uma estrutura maior e
organizada, chamada de subunidade.
É o conjunto das estruturas terciárias, que se dá quando existe mais de uma subunidade proteica para
formar a proteína final.
Estrutura secundária 
Estrutura terciária 
Estrutura quaternária 
A forma como as proteínas se consolidam depende dos resíduos de aminoácidos que as compõem. Dentre os
aminoácidos, há três classes: com carga (positivo ou negativo), polares (sem carga) e apolares. Esses resíduos
podem interagir entre si por ligações de hidrogênio, formando α-hélices ou dobrando sua estrutura. Além disso,
também pode acontecer o oposto: a repulsão entre resíduos gerar um afastamento de trechos da proteína.
Sendo assim, há diversas formas que uma proteína pode assumir.
No esquema a seguir podemos ver os diferentes tipos de aminoácidos e suas cargas.
Com carga na cadeia lateral.
Polares não carregados.
Apolares.
O conjunto total das interações entre os resíduos forma a conformação final da proteína (basicamente a forma
tridimensional que ela assume) e é fundamental para sua função. Por exemplo, algumas proteínas têm, na
ligação das subunidades, um canal no centro. A partir desse canal, moléculas podem ser transportadas,
conforme observamos na imagem ao lado.
Vista lateral e superior de um canal iônico.
Outras têm uma pequena cavidade, onde alguma molécula pode entrar e realizar uma reação química mediada
por um cofator e ser liberada depois para seguir a sua via metabólica.
Cavidade e sítio ativo de uma proteína.
Agora imagine que um resíduo fundamental, como uma lisina (LYS – com carga positiva), seja a peça-chave
para interagir com a molécula da sua via metabólica, uma molécula que tenha carga negativa. Assim
percebemos que a lisina é um resíduo extremamente importante para o funcionamento da proteína, pois é
necessária para a interação da carga positiva do resíduo com a carga negativa da molécula.
Vem que eu te explico!
Os vídeos a seguir abordam os assuntos mais relevantes do conteúdo que você acabou de estudar.

Módulo 1 - Vem que eu te explico!
Estrutura do DNA
Módulo 1 - Vem que eu te explico!
O código genético
Módulo 1 - Vem que eu te explico!
A evolução gênica
Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?
Questão 1
O mapa filogenético nos indica que há ancestrais comuns. Assim é possível pontuar a história evolutiva e
estudar como se deu a evolução dos genes. Um gene de uma bactéria A com sequência de nucleotídeos
ACGTAGGTCGTTACCAGG codifica uma proteína Y capaz de realizar a quebra de glicose. De forma semelhante,
os pássaros apresentam a sequência de nucleotídeos GTACTAATCATGGGCAATTTC, que codifica uma proteína
Z que é capaz de quebrar glicose. Como você classifica esses dois genes?
A Homólogos
B Ortólogos
C Parálogos
D Análogos
E Universais
Parabéns! A alternativa D está correta.
Os genes análogos são aqueles que apresentam uma sequência de nucleotídeos muito diferentes,
como os encontrados em algumas bactérias e nos pássaros, mas codificam proteínas semelhantes.
Na questão, ambos os genes codificam proteínas que quebram glicose.
Questão 2
Vimos que os organismos procariotos realizam o controle da expressão por meio de operons. Um deles é o
operon Lac, conhecido por operar o metabolismo de lactose e presente em muitos organismos. Sobre esse
mecanismo assinale a alternativa correta:
A
A presença da regulação gênica ajudou, ao longo do processo evolutivo, na mutação das
espécies.
B
A presença da regulação gênica ajudou, ao longo do processo evolutivo, na preservação da
vida por meio de um controle refinado do metabolismo dos organismos.
C O operon Lac é responsável por controlar todo o metabolismo dos procariotos.
D O operon Lac é responsável por encontrar e corrigir mutações, fazendo a regulação gênica.
2 - Aplicações da bioinformática
Ao �nal deste módulo, você será capaz de reconhecer o histórico e algumas aplicações da
bioinformática no mundo atual.
Histórico da bioinformática
E O operon Lac também pode ser encontrado em eucariotos.
Parabéns! A alternativa B está correta.
O operon Lac é um dos operons que participa da regulação gênica dos organismos procariotos. Ele
modula a expressão de enzimas responsáveis pela metabolização de lactose e, com isso, pode
aumentar ou diminuir a expressão, evitando gasto energético desnecessário, o que foi crucial para a
manutenção da vida desses organismos ao longo do tempo.

Histórico da bioinformática
Em todas as áreas do conhecimento existe certa interdisciplinaridade. Para saber como um objeto se move é
necessário conhecer a física e a matemática. Para entender um texto histórico, temos que saber a linguagem
escrita, o contexto em que aquele texto foi escrito e a forma como a sociedade era organizada. Há diferentes
partes que, quando juntas, formam a chave para a compreensão de qualquer conhecimento.
Na bioinformática não é diferente, pois não se trata apenas da união da biologia (bio) com a informática, e sim
de uma série de outros fatores que serão citados ao longo do nosso estudo.
Podemos dizer que essa nova área do conhecimento surgiu a partir da necessidade de armazenar dados e
realizar contas matemáticas por meio de algoritmos que auxiliariam o dia a dia dos pesquisadores.
Algoritmos
É uma “receita” para executar uma tarefa ou resolver algum problema. Pode ser, por exemplo, uma fórmula
matemática.
Para conhecermos o histórico da bioinformática, precisamos conhecer o histórico da informática. Foi na
década de 60 que surgiram os primeiros computadores para uso comercial, como o IBM 7094, que ocupavam
um espaço gigantesco e não eram nada simples de operar.
IBM 7094, um dos primeiros computadores criados para uso comercial.
Ainda assim a físico-química americana Margaret Dayhoff conseguiu criar o primeiro programa de
bioinformática da história, o COMPROTEIN, com o objetivo de determinar a estrutura proteica de uma série de
sequências de peptídeos.
O uso de computadores para auxiliar na rotina de laboratório foi uma verdadeira revolução, pelo fato de eles
serem mais ágeis e confiáveis que anotações em cadernos. Entretanto, o maior problema era a dificuldade de
operar os programas, pois todos os comandos eram dados por linhas de código e — acredite — não era nada
fácil executá-los.
Com o passar do tempo, os computadores foram ficando cada vez mais potentes, com maior capacidade de
processamento e memória, facilitando a construção de programas mais elaborados.
Exemplo de aplicação do algoritmo de Needleman-Wunsch.
Em 1970, Needleman e Wunsch criaram um algoritmo capaz de realizar o alinhamento entre duas sequências
de proteínas. Nesse algoritmo, como demostrado na figura ao lado, são comparadas duas sequências de
nucleotídeos (GATTACA e GCATGCG). Para isso, as sequências são inseridas nos eixos X e Y e o programa
realiza uma comparação entre elas. A partir dessa comparação, se as letras combinam (match), é dado um
valor, e se elas não combinam (mismatch) ou se tem um espaço entre elas (gap), é dado outro valor. O
computador, então, calcula o melhor caminho possível e, a partir deste, as duas sequências são alinhadas.
Na década de 90, houve uma comoção de pesquisadores de 18 países, incluindo o Brasil, para desvendar por
completo o DNA do ser humano: o trabalho conhecido como projeto Genoma Humano.
O trabalho durou ao todo 13 anos para conseguir entregar, em sua conclusão, 99% donosso código genético
com 99,9% de precisão. Para isso, a bioinformática mais uma vez foi essencial, pois, a partir de programas de
computador específicos, os pequenos trechos sequenciados eram adicionados a um grande banco de dados e
encaixados no seu devido lugar. Dessa forma, foi criado um único arquivo editável que todos os participantes
do trabalho poderiam alterar conforme o progresso era feito, incluindo anotações, descrições e comparações.
Imagine como seria fazer toda essa organização sem o auxílio de programas, no bom e velho caderno. Seria
muito mais difícil e inviável.
Robert Waterston, do Centro de Sequenciamento do Genoma da Universidade de Washington, fala sobre publicações que descrevem as análises
iniciais da sequência do genoma humano.
Os benefícios e aplicações desse estudo são muito relevantes até os dias de hoje, pois a partir dele foram
desenvolvidos diversos softwares de bancos de dados que foram preenchidos com genomas de diversas
espécies. Além disso, representa um marco na tecnologia de sequenciamento com o desenvolvimento de
técnicas de montagens de sequências genômicas (reconstrução das sequências), elucidação de funções e
mutações genéticas etc. Todos esses avanços foram essenciais para o entendimento da genética atual.
Abaixo, apresentamos uma linha do tempo com importantes marcos do projeto Genoma Humano.
Esses e alguns outros eventos marcaram o início do uso da informática associada à Biologia. Entretanto, ainda
era uma área muito restrita, pois precisava que os programas fossem mais amigáveis. A tecnologia avançou
junto com a necessidade e tornou os computadores menores e mais baratos.
No início dos anos 2000, apesar de ainda um pouco caro, já era possível, com algum esforço, uma pessoa de
classe média-baixa comprar seu primeiro computador e usar as ferramentas do Windows ou a Internet em sua
fase inicial. Utilizar um computador era relativamente simples: bastava ler o que estava na tela e ir clicando
conforme as opções e botões surgiam. Parece trivial, certo? Errado!
Um dos principais motivos de toda nossa história ter funcionado foi uma interface gráfica do usuário chamada
de Graphical User Interface (GUI).
A GUI é a forma como nos conectamos com o computador, não mais por linhas de texto ou programação, mas
hoje em dia a partir de botões e animações. Assim, ficou muito mais fácil de usar o computador. E esse foi o
grande ponto de virada da bioinformática.
1990
O Projeto Genoma Humano
(HGP) é lançado nos Estados
Unidos.
1991
Estabelecidos os primeiros
centros de genoma dos EUA.
1992
Mapa genético humano de
segunda geração desenvolvido.
Atualmente, usamos botões e atalhos onde antes eram usadas linhas de texto, tornando mais fácil o uso dos computadores.
Os laboratórios de Biologia, Química, Física e outras ciências, mesmo que com pouca verba, poderiam comprar
seus computadores e, com a ajuda de programadores e matemáticos, criar seus programas para usar
diariamente.
A tecnologia não parou de avançar, e os computadores ganharam mais uma peça: a placa de vídeo Graphics
Processing Unit (GPU). Ela era capaz de realizar contas mais complexas envolvendo objetos animados. Isso
tornou possível desenhar e visualizar proteínas em três dimensões, cadeias de DNA, polímeros e,
recentemente, até mesmo simular o comportamento de uma proteína em um ambiente bem próximo do real
por um curto período de tempo.
Conseguimos perceber que a bioinformática surgiu da união de áreas como programação, estatística, física,
química e biologia, para desenvolver programas computacionais que permitam reconhecer sequências de
genes, prever a configuração tridimensional de proteínas, organizar e relacionar informação biológica, agrupar
proteínas homólogas, estabelecer árvores filogenéticas, analisar a expressão gênica de forma rápida etc.
Comentário
Um profissional que se interesse pela área, mesmo com os programas cada vez mais amigáveis, precisa ter
noções de todos os pontos envolvidos, o que torna o aprendizado um processo árduo, mas com certeza muito
recompensador.
Bioinformática e suas aplicações no mundo
atual
atual
Atualmente, seria bastante difícil manter a nossa sociedade sem a ajuda de computadores. Sem eles, não
teríamos mais internet, bancos on-line e nem mesmo o programa que uso para construir este texto e o que
vocês usam para ler este conteúdo. Na pesquisa científica e em praticamente todas as áreas das ciências
biológicas não é diferente. Além disso, com o desenvolvimento da bioinformática, os processos ficaram mais
rápidos e com menor custo.
O maior exemplo que pode ser dado é a vacina contra a covid-19. Claro, existem muitos fatores, mas tivemos
uma vacina eficiente para essa nova doença em menos de um ano e parte disso deve-se à bioinformática.
Ilustração 3D da proteína S.
A partir da bioinformática foi possível o mapeamento dos possíveis sítios para a criação das vacinas, a
elucidação da proteína S do vírus (uma proteína da espícula viral que possibilita a entrada e infecção das
células humanas), entender o mecanismo de entrada e ação viral, compreender a ligação com a célula humana
e, assim, estudar melhor as maneiras de combate ao vírus.
A imagem ao lado ilustra a reconstrução do complexo que contém a proteína S a partir de um programa de
modelagem molecular.
Atualmente, a bioinformática é composta por diferentes técnicas com diferentes aplicabilidades. A partir de
agora vamos conhecê-las:
Alinhamento e modelagem molecular
Como já sabemos, o sequenciamento genético realizado no projeto Genoma Humano foi um divisor de águas
na forma como víamos as sequências genéticas. Ele permitiu que pudéssemos ler (literalmente) os genes e
entender as associações existentes entre diferentes espécies, já que uma grande parte dos genes foi
sequenciada e está disponível em bancos de dados digitais que possuem inclusive os genes de diversas
espécies de animais. Usamos esses bancos de dados para obter os códigos dos resíduos de aminoácidos de
proteínas de diferentes espécies e, a partir deles, fazer a técnica de alinhamento.
O alinhamento possui grande importância nos estudos de filogenética, possibilitando o reconhecimento de
ancestrais comuns, baseado em trechos de DNA conservados entre diferentes espécies, definidas assim como
sequências homólogas. Em alguns casos, o alinhamento também será capaz de prever características
estruturais e funcionais das proteínas a partir dos genes de origem, baseado na atuação desse no trecho
homólogo.
O alinhamento pode ser realizado entre duas ou mais sequências e obedece a um algoritmo, como o algoritmo
de Needleman & Wunsch, do qual já falamos.
Mas como este processo funciona?
Vamos imaginar que queremos verificar o alinhamento entre as sequências de aminoácidos de uma proteína
P2X7 entre o urso panda e o homem. Para isso, o algoritmo calcula e verifica o melhor alinhamento possível.
Na imagem a seguir, observe os trechos em vermelho, que são os trechos alinhados dos códigos de resíduos
de aminoácidos que geram a proteína P2X7 no ser humano e no urso panda.
Exemplo prático de alinhamento entre duas sequências da proteína P2X7.
E como o alinhamento pode ser utilizado?
Resposta
O alinhamento pode resolver problemas recorrentes, por exemplo, quando um trecho do genoma de
determinado organismo é sequenciado, sendo preciso saber qual proteína é codificada nesse trecho.
Para isso, podemos então realizar uma busca em um banco de dados (NCBI/BLAST), que faz uma série de
cruzamentos de informações para ver qual seria o gene que melhor se alinha com esse trecho, e a partir daí é
gerado uma pontuação e uma identidade (que é a porcentagem de pares perfeitos entre as duas sequências),
caso a pontuação seja alta pode ser atribuído uma função semelhante ao meu gene de estudo.
Há diferentes formas de exibição dentro dos programas de visualização de estruturas proteicas para facilitar a
visualização das proteínas. O que contribui para que, mesmo para uma pessoaleiga, compreenda como a
função da proteína pode ser relacionada à sua estrutura. Vejamos alguns exemplos de formas de exibição de
estruturas proteicas:
Com o alinhamento realizado e uma identidade acima de 25%, podemos realizar uma técnica chamada de
modelagem por homologia e gerar um modelo tridimensional da sequência proteica alvo. A partir de uma
sequência alvo, identificamos em um banco de dados uma sequência molde com estrutura resolvida e, em
seguida, é feito o alinhamento e a modelagem, gerando um modelo final, ou seja, um modelo tridimensional de
uma proteína com estrutura não conhecida.
Modelagem proteica por homologia.
A modelagem molecular de proteínas pode também ser feita por métodos não comparativos, chamados de ab
initio e threading.
Método ab initio
Nesse método, a construção é feita somente a partir de cálculos matemáticos em que a sequência de
aminoácidos é levada em consideração para tentar prever a estrutura secundária das proteínas.
Método por threading
Cartoon Palitos Bolas e palitos
étodo po t ead g
É baseado na estrutura secundária de modelos com identidade baixa ou por inteligência artificial, que analisa
bancos de dados e cruza informações para tentar obter um modelo confiável.
Ancoramento Molecular
O ancoramento molecular é também chamando de docagem molecular ou molecular docking. A técnica
consiste em utilizar um modelo tridimensional (no nosso caso uma proteína), definir uma área de busca — que
seria, basicamente, informar ao programa a área da proteína em que se deseja ancorar uma molécula — e
depois testar a possibilidade de ligação da molécula na região da proteína delimitada. O ligante irá se encaixar
no local mais energeticamente favorável, e essa interação vai gerar uma pontuação. O programa constrói
diferentes conformações da ligação ligante-proteína e cada uma delas recebe o nome de pose. A melhor pose
é aquela que obtém a maior pontuação dada pelo algoritmo do programa de ancoramento.
Esquema do ancoramento de uma pequena molécula ligante (verde) a uma proteína alvo (preta) formando um complexo proteína-ligante.
O ancoramento molecular pode ser utilizado para determinar qual ligante irá interagir melhor com uma
proteína, definir a pose de interação, encontrar sítios ativos e ajudar a determinar se mutações de resíduos de
aminoácidos serão relevantes para essa interação.
Podemos citar, por exemplo, a variante B.117 do SARS-CoV-2, um vírus mais infeccioso por causa de uma
mutação N501Y na proteína S (Spike-ACE2). Sendo assim, na posição 501 da proteína em questão, um resíduo
asparagina mutou para dar lugar a um resíduo tirosina. Essa mutação resultou em um maior número de
interações com o sítio ativo, tornando a ligação do vírus com o seu receptor mais forte. Logo, uma menor
carga viral se tornou suficiente para causar a doença.
Ancoramento molecular com a proteína S da covid-19 (N501, SARS-CoV-2).
Ancoramento molecular com a proteína S da variante B.117 (Y501, SARS-CoV-2).
Comentário
Realizar essa ligação em um ambiente virtual simulando a energia de interação é muito importante. Mas nas
poses, como são imagens estáticas, não existem a influência do tempo e outros fatores na interação entre as
proteínas.
Dinâmica molecular
A dinâmica molecular tem como objetivo analisar interações e movimentações em diversos sistemas não
apenas por um único instante, mas ao longo de uma trajetória em determinado espaço-tempo. A sua
aplicabilidade no dia a dia é muito ampla, podendo ser usada para entender mecanismos de ação de proteínas,
interações entre fármaco-receptor, como determinados materiais se comportam sob stress etc. As aplicações
da dinâmica molecular vão além da biologia. Ela é usada em física, química, engenharia e até mesmo na
geologia.
Mas como funciona a dinâmica molecular?
No ancoramento molecular, existe uma pose com a maior pontuação de uma possível interação do ligante com
o seu receptor, seguindo o clássico modelo chave-fechadura (o ligante é a chave que encontra a proteína,
fechadura), mas sabemos que no mundo real as coisas não funcionam assim de forma tão rígida.
Pensando em solucionar esse problema, foi criada uma técnica chamada de dinâmica molecular, que
substituía esse modelo chave-fechadura por um outro chamado de modelo de ajuste induzido, não mais
utilizando uma pose apenas, e sim uma trajetória, uma simulação de um ambiente real.
Sistema usado na dinâmica molecular: uma caixa de água contendo a proteína, o ligante e o cofator.
Na dinâmica molecular, cada átomo, seja da proteína, do ligante ou da água, é levado em consideração para
calcular a movimentação de todo o sistema por alguns nano ou milissegundos e entender as movimentações
existentes. A simulação de dinâmica molecular é feita a partir de uma pose vinda do ancoramento molecular.
Essa pose (contendo o nosso sistema, proteína e ligantes) é inserida em uma caixa contendo moléculas de
água, tendo como objetivo mimetizar um ambiente biológico real. Então, uma série de cálculos complexos
baseados em um conjunto de parâmetros chamado de campo de forças é aplicado.
O campo de força possui as informações necessárias para que o computador determine e simule como as
interações acontecem, os tipos de ligações possíveis e o que é necessário para que aqueles átomos interajam
entre si. Apesar de já existirem programas de computador que realizam esses cálculos, ainda são necessários
outros mais avançados que consigam fazer dinâmicas cada vez mais complexas e mais longas.
Atualmente, há um enorme esforço global para ajudar a comunidade científica nesse sentido. Em 2017, a
revista Nature publicou o artigo Physical properties of the HIV-1 capsid from all-atom molecular dynamics
simulations, de Perilla & Schulten, no qual é relatado que um supercomputador conseguiu fazer uma simulação
de todos os átomos presentes no capsídeo do vírus HIV-1 por 400 nanossegundos. Foram observados cerca
de 4 milhões de átomos!
Imagem do capsídeo viral.
Os supercomputadores do mundo inteiro, hoje em dia, estão realizando simulações com o SARS-CoV-2. Com o
avanço da tecnologia serão possíveis feitos cada vez maiores. Quem sabe um dia até mesmo seja possível
simularmos células completas. Além das simulações levando em consideração os átomos, há também as
simulações que consideram os elétrons. São os chamados métodos quânticos. Esses exigem, porém, um
custo computacional ainda maior, e são usados apenas para moléculas pequenas ou no sítio de interação.
Saiba mais
Custo computacional seria uma quantidade de cálculos em determinado tempo. Um alto custo computacional
traduz-se em muitos cálculos ou em um longo tempo para realizar determinada tarefa.
Agora imagine que você queira descobrir novos alvos terapêuticos partindo de um ligante conhecido, como no
desenvolvimento de um medicamento que se liga à proteína S do vírus da covid-19 e assim impede sua
entrada na célula humana. Para isso, você deverá realizar uma sequência de técnicas dentro da bioinformática.
São elas: alinhamento, modelagem molecular, ancoramento e, por último, a dinâmica molecular.
Modelagem molecular de proteínas
Está na hora de falarmos sobre a importância da bioinformática para a construção de estruturas de proteínas
e, ainda, simular a construção de uma proteína. Vamos lá!
Relação estrutura-atividade
A estatística é uma ciência que pode ser aplicada diretamente nos estudos biológicos, sendo crucial para a
bioinformática.
A quantificação da relação estrutura-atividade pode ser feita por meio de uma técnica chamada QSAR
(Quantitative Structure-Activity Relationship) ou relação quantitativa de estrutura-atividade. O QSAR possibilita,
a partir de dados obtidos por dinâmica molecular, no ancoramento molecular ou em ensaios biológicos,
alcançarmos um conjunto de dados, chamado de grupo treinamento. Após isso, extraímos uma equação

matemática, por meio de algum algoritmo estatístico.
Em seguida, podemos testar essa equação contra o nosso grupo teste, com os valorestambém conhecidos,
para determinar se ela funciona. Com a confirmação da equação, podemos construir novas moléculas com
maior potencial para agir em determinado alvo ou para tentar prever a atividade de compostos já existentes,
seguindo um modelo estatístico.
Vem que eu te explico!
Os vídeos a seguir abordam os assuntos mais relevantes do conteúdo que você acabou de estudar.
Módulo 2 - Vem que eu te explico!
Bioinformática
Módulo 2 - Vem que eu te explico!
Bioinformática e suas aplicações no mundo atual

Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?
Questão 1
O projeto Genoma Humano foi uma verdadeira revolução na biologia molecular e na bioinformática. Foram
necessários 13 anos de trabalho para ser concluído e os resultados foram bem promissores. Levando em
consideração os avanços realizados, podemos concluir que
A
o projeto Genoma Humano foi capaz de reunir a comunidade científica com apenas um
objetivo em comum: sequenciar o DNA humano.
B
foi um verdadeiro marco na história, e os avanços foram cruciais para o entendimento atual
sobre genética.
C foi muito importante para estabelecer o conceito do dogma central da biologia.
D
o projeto Genoma Humano foi capaz de sequenciar 90% do DNA humano com 100% de
precisão.
E
tivemos 100% dos nossos genes definidos e suas funções completamente definidas com a
finalização do projeto Genoma Humano.
Parabéns! A alternativa B está correta.
O projeto Genoma Humano possibilitou que 99% do nosso código genético fosse sequenciado com
precisão de 99,9%, sendo um marco na história, uma vez que permitiu diferentes avanços
tecnológicos, como a criação de bancos de dados internacionais e de diversas novas técnicas de
bioinformática que compõem a base de muitos estudos recentes e que são fundamentais para oQuestão 2
Considerações finais
Durante o desenvolvimento da biologia molecular houve uma verdadeira revolução tecnológica na área da
entendimento da genética atual.
Questão 2
Novos alvos terapêuticos podem ser encontrados com o auxílio de técnicas de bioinformática. Partindo de um
ligante conhecido, qual seria a ordem lógica que um pesquisador poderia adotar para identificar um novo alvo?
A Modelagem molecular, alinhamento, dinâmica molecular, ancoramento.
B Alinhamento, modelagem molecular, ancoramento, dinâmica molecular.
C Dinâmica molecular, modelagem molecular, alinhamento, ancoramento.
D Ancoramento, dinâmica molecular, alinhamento, modelagem molecular.
E Modelagem molecular, alinhamento, ancoramento, dinâmica molecular.
Parabéns! A alternativa B está correta.
A ordem lógica ideal para o desenvolvimento de novos fármacos seria: alinhamento, para
identificarmos se o alvo possui proteína molde; modelagem molecular, para construir um modelo
tridimensional; ancoramento, para obter uma pose do ligante com o alvo; e dinâmica molecular, para
analisar como as interações acontecem.

informática. O alinhamento dessas duas ciências possibilitou o surgimento de uma nova ciência, a
Bioinformática, e com ela diversas técnicas que hoje são cruciais para o avanço da pesquisa científica
biomédica e do desenvolvimento de produtos para a área da saúde.
Assim, ao longo deste conteúdo, visitamos os principais conceitos da biologia molecular para a compreensão
da bioinformática, como o dogma central da Biologia e como ele se desenrola; a importância do DNA e dos
genes e suas mutações; e como as proteínas funcionam. Além disso, conhecemos a história da bioinformática
e algumas de suas principais técnicas e aplicações práticas.
A informática modificou completamente a forma como enxergamos o mundo, tornando a tecnologia mais
barata e acelerando o desenvolvimento científico. O aumento constante do poder computacional com os
computadores quânticos, por exemplo, pode levar a bioinformática a patamares ainda mais elevados. A
Bioinformática talvez seja uma das ciências mais promissoras do século XXI. Estamos vivenciando apenas o
começo dessa mudança de paradigmas.
Podcast
Quais serão os avanços e vantagens da bioinformática? Ouça a seguir sobre o que esperar dessa área nos
próximos anos.

Referências
ALEXANDRE, F. C. Introdução à modelagem molecular. Consultado na Internet em: 27 out. 2021.
COELHO, L. W. et al. Aplicação de mecânica molecular em química inorgânica. Química nova, v. 22, n. 3, p. 396-
404, 1999.
DE VIVO M l R l f l l d i d l d h d i d di J l f M di i l
DE VIVO, M. et al. Role of molecular dynamics and related methods in drug discovery. Journal of Medicinal
Chemistry, v. 59, n. 9, p. 4035-4061, 2016.
GAUTHIER, J. et al. A brief history of bioinformatics. Consultado na internet em: 27 out. 2021.
GREEN, E. D.; WATSON, J. D.; COLLINS, F. S. Human genome project: twenty-five years of big biology. Nature
News, v. 526, n. 7571, p. 29, 2015.
HUANG, L.; ROUX, B. Automated force field parameterization for nonpolarizable and polarizable atomic
models based on ab initio target data. Journal of Chemical Theory and Computation, v. 9, n. 8, p. 3543-3556,
2013.
HUANG, S.; ZOU, X. Advances and challenges in protein-ligand docking. International Journal of Molecular
Sciences, v. 11, n. 8, p. 3016-3034, 2010.
KARR J. R.; SANGHVI J. C.; MACKLIN D. N., et al. A whole-cell computational model predicts phenotype from
genotype. National Library of Medicine, 150:389–401, 2012.
MANDAL, S.; MOUDGIL, M.; MANDAL, S. K. Rational drug design. European Journal of Pharmacology, v. 625, n.
1-3, p. 90-100, 2009.
MORGON, N. H.; COUTINHO, K. Métodos de química teórica e modelagem molecular. São Paulo: Editora
Livraria da Física, 2007.
PAGADALA, N. S.; SYED, K.; TUSZYNSKI, J. Software for molecular docking: a review. Biophysical Reviews, v. 9,
n. 2, p. 91-102, 2017.
SLIWOSKI, G. et al. Computational methods in drug discovery. Pharmacological reviews, v. 66, n. 1, p. 334-395,
2014.
VERLI, H. et al. Bioinformática da biologia à flexibilidade molecular. São Paulo: SBBq, 2014.
Explore +
Para aprofundar seus conhecimentos sobre o conteúdo abordado, pesquise:
O artigo A era da bioinformática: seu potencial e suas aplicações para ciências da saúde, de Araújo e
colaboradores.
O artigo Ferramentas de bioinformática na caracterização de alvos de medicamentos, do VI Curso de Inverno
em Biologia Celular e Molecular do programa de pós-graduação em ciências biológicas da Universidade
Estadual de Maringá, de Pimentel e colaboradores.
Leia também:
Transcrição e Processamento de DNA, no material da USP, Biologia molecular: Texto 4, disponível na Internet.
Síntese de Proteínas, no material da USP, Biologia molecular: Texto 7, disponível na Internet.
A Transcriptase Reversa como Alvo Terapêutico em Doenças Retrovirais, disponível na Biblioteca Digital da
Universidade Federal do Paraná.
COVID-19: Fisiopatologia e Alvos para Intervenção Terapêutica, disponível na Revista Virtual de Química, da
Sociedade Brasileira de Química.
Assista ao vídeo Do DNA à Proteína, disponível no canal Inteligentista, no YouTube.
 Baixar conteúdo
javascript:CriaPDF()

Continue navegando