Introdução à Bioinformática

•

ESTÁCIO

Daniel Tenorio da Silva Rodrigues

27/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioinformática

2.055 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Introdução à Bioinformática
Prof. Eldio Gonçalves dos Santos
Descrição
Histórico, relação com a biologia molecular, áreas do conhecimento envolvidas e aplicações da
bioinformática.
Propósito
Compreender os conceitos de biologia molecular, o histórico e as aplicações da bioinformática é importante
para iniciar os estudos nessa nova área do conhecimento, que gera grandes descobertas e avanços
especialmente no âmbito biomédico.
Objetivos
Módulo 1
A biologia molecular e a bioinformática
Descrever os conceitos de biologia molecular e das proteínas importantes para a bioinformática.
Módulo 2
Aplicações da bioinformática
Aplicações da bioinformática
Reconhecer o histórico e algumas aplicações da bioinformática no mundo atual.
A biologia molecular é responsável por estudar as moléculas que realizam a manutenção da vida —
DNA, RNA e proteínas —, que têm como função principal, considerando o dogma central da Biologia,
armazenar informações, enviá-las para a síntese das proteínas e realizar as funções celulares,
respectivamente.
Diversos dos avanços que tivemos até hoje se deram devido à elaboração de técnicas que nos
proporcionaram novas formas de estudar o DNA e o RNA, que estão em constante evolução.
Recentemente, a informática tornou-se uma importante aliada, criando uma ciência, a Bioinformática.
Assim, essa nova ciência atua em parceria com a Ciência da Computação, Estatística, Matemática e
as Engenharias para analisar, interpretar e processar dados biológicos.
A bioinformática hoje está presente, mesmo que de forma indireta, na vida de todos os
pesquisadores e em praticamente todos os laboratórios do mundo. Neste conteúdo, vamos entender
conceitos sobre biologia molecular, para melhor compreender a bioinformática e descobrir afinal o
que ela é, para que serve, como surgiu e conhecer algumas de suas metodologias. Vamos juntos?
Introdução
1 - A biologia molecular e a bioinformática
Ao �nal deste módulo, você será capaz de descrever os conceitos de biologia molecular e das
proteínas importantes para a bioinformática.
Conceitos de biologia molecular importantes para a
bioinformática
Todos os seres vivos do planeta, para continuar existindo, precisam se reproduzir, ou serão extintos. Há
diversas formas de reprodução, mas todas envolvem a cópia de uma biomolécula bem característica,
formada pela união de um grupamento fosfato, uma pentose e uma base nitrogenada, chamada de ácido
desoxirribonucleico (ADN) — mais conhecida como DNA. Na imagem a seguir conseguimos relembrar a
estrutura do DNA.
Estrutura de uma molécula de DNA.
Como já sabemos, existem quatro diferentes nucleotídeos presentes no DNA: Adenina (A), Timina (T),
Guanina (G) e Citosina (C). Esses são formados por três diferentes elementos: uma base nitrogenada, que
vai de fato dar o nome para o nucleotídeo (A, T, C, G); uma pentose, que será ribose no RNA ou desoxirribose
no DNA; e um grupamento fosfato, que interage com a pentose fazendo uma ligação fosfodiéster. A
adenina se liga a uma timina por uma ligação dupla de hidrogênio e a guanina se liga com a citosina por
uma ligação tripla de hidrogênio, conforme observamos na imagem a seguir:
Ligação fosfodiéster
Une dois nucleotídeos pela ligação entre fosfatos no quinto carbono de uma desoxirribose ou ribose com a
hidroxila presente no terceiro carbono da desoxirribose ou ribose de um outro nucleotídeo.
Bases nitrogenadas presentes no DNA.
O DNA tem como função principal armazenar uma série de sequências e padrões que serão lidos por um
sistema bastante complexo. Ao ter sua expressão feita de forma correta, resulta na formação de
determinado ser vivo. Essa molécula, por ser estável, é capaz de carregar todas as informações genéticas
de um indivíduo e ser copiada para gerar outros indivíduos idênticos.
Mas como ocorre o fluxo de informação nos organismos vivos?
Replicação
Primeiramente, ocorre a cópia completa de toda a sequência de DNA contida em cada célula
individual, em um processo chamado de replicação. No entanto, para que as informações
contidas no DNA sejam convertidas em proteínas, elas precisam ser transformadas em uma
molécula intermediária — o RNA (ácido ribonucleico), que é constituído por uma pentose e um
fosfato e tem como bases nitrogenadas a adenina, a guanina, a citosina e a uracila.
Aminoácido
É a menor unidade funcional de uma proteína. É uma molécula pequena formada por um grupamento R, um
grupamento amina e um grupamento ácido carboxílico.
Cadeia peptídica
A cadeia peptídica que irá se tornar uma proteína precisa ser moldada tridimensionalmente para adquirir
sua característica terciária e quaternária. Tal processo é feito por proteínas chamadas chaperonas.
Nos seres vivos existe uma enorme variação de proteínas com diferentes funções essenciais à vida. Elas
coordenam quase todos os processos vitais, como o metabolismo celular e bioquímico, o apoio na divisão
do DNA, a síntese de moléculas importantes para a manutenção da célula etc.
Esse fluxo de informação genética dentro de uma célula ou em um organismo recebe o nome de dogma
central da biologia molecular. Na imagem abaixo vemos um esquema que retrata esse dogma tão
importante para a biologia molecular.
Transcrição
Para isso, o DNA deve ser reconhecido pela proteína RNA polimerase, para gerar uma
molécula de RNA mensageiro (RNAm), no processo chamado de transcrição. O RNAm
carrega as informações contidas no DNA e é lido pelo ribossomo, de três em três bases
nitrogenadas. A cada conjunto desse damos o nome de códon.
Tradução
Cada códon indica que um aminoácido será inserido pelo ribossomo em uma cadeia maior. A
união de diferentes aminoácidos forma uma cadeia peptídica, que, ao se organizar, gera uma
proteína. Esse processo é chamado de tradução, e ocorre quando um RNAm é traduzido em
proteínas, que são as unidades funcionais do nosso corpo.
Esquema do dogma central da biologia molecular.
O dogma central da biologia foi criado em 1958, por Francis Crick, e afirma que é preciso uma determinada
sequência de eventos para que a informação genética seja traduzida.
Francis Crick.
Saiba mais
Há alguns organismos, como vírus, capazes de reverter o dogma central da biologia a partir da proteína
transcriptase reversa. São exemplos o vírus da imunodeficiência adquirida e o SARS-CoV-2.
Replicação, transcrição e tradução do DNA
Veja agora os processos que envolvem as etapas de replicação, transcrição e tradução, que compõem o
dogma central. Vamos lá!
É um pouco difícil tentar imaginar como o DNA armazena tanta informação em um espaço tão pequeno,
mas vamos comparar com um computador tradicional.

Imagine que o hard disk (HD) do seu computador consiga guardar informações de 500 gigabytes ou 1
terabyte. Ou seja, uma unidade de conversão na qual 1 gigabyte equivale a 109 bytes, 1 terabyte equivale a
1012 bytes, e um byte equivale a 8 bits. O computador funciona com uma base binária de 0 e 1, e cada sinal
desse (0 ou 1) equivale a um bit, sendo que a cada 8 bits temos um byte.
O nosso DNA funciona como um programa de computador (de verdade, a semelhança é impressionante!).
Vejamos alguns exemplos disso: os computadores, como já dissemos, utilizam um sistema binário (0 e 1).
Já o DNA possui um sistema quaternário com as variáveis A, T, C, G, na qual cada códon seria equivalente a
1 byte (equivale a 8 bits), e cada letra de DNA, 1 bit. Além disso, alguns vírus são capazes de modificar as
sequências do DNA, assim como nos softwares.
Curiosidade
Se convertêssemos para uma unidade em bytes, cada célula humana teria cerca de 1,5 gigabytes!
Existe ainda um código que comanda a construção das proteínas, o código genético, e esse código é
universal, válido para todos os seres vivos, demonstrando que todos eles possuem uma origem única e é
determinado pelos códons.
Comentário
A universalidade do código genético indica que Darwin tinha razão em sua teoria de evolução, pois segundo
essa teoria, todas as espécies que mudam ao longo dotempo, dão origem a novas espécies e
compartilham um ancestral comum.
Na tabela a seguir vemos o código genético, ou seja, a relação entre os códons (sequência de 3 bases
nitrogenadas) e os aminoácidos correspondentes.
Quadro contendo todo o código genético.
Ao observar a tabela, percebemos que um aminoácido pode ser representando por mais de um códon.
Dizemos que o código genético é degenerado/redundante. Isso é importante, pois
modificações em uma das bases nitrogenadas podem não alterar o tipo de
aminoácido encontrado.
Por exemplo, a mudança da base uracila (GUU) para uma das outras três bases nitrogenadas (GUC, GUA ou
GUG) não altera o aminoácido que será integrado na sequência de peptídeos, que em todos os códons será
a valina. No exemplo anterior, assim como em toda a tabela do código genético, conseguimos perceber que
as alterações nos códons para esse código genético ser degenerado se encontram na terceira base
nitrogenada do códon. Isso quer dizer que o código genético apresenta especificidade para a 1ª e 2ª bases
e tolera oscilações na 3ª base no códon.
Por outro lado, observamos que cada códon não especifica mais de um aminoácido. Sendo assim, dizemos
que o código genético não é ambíguo, ou seja, o códon GUU vai sempre indicar a inclusão de uma valina na
sequência de aminoácidos e CCU de uma prolina.
Saiba mais
Alguns códons são bem importantes na construção da cadeia peptídica. Entre eles, podemos destacar o
start códon e o stop códon, que são responsáveis por iniciar e parar a síntese da cadeia, respectivamente. O
start códon é dado por AUG, e o stop códon pelas sequências UAA, UAG e UGA.
Evolução genética
Algum HD seu já deu defeito? Já perdeu algum arquivo importante, como uma foto ou um texto em que você
estava trabalhando, devido a um problema de umidade ou pancada no computador? Ou simplesmente
aconteceu uma falha no sistema? É normal. Os HDs irão dar defeito. Os técnicos de informática dizem:
“Você já perdeu seus arquivos, só não sabe quando.”
Com o DNA acontece algo relativamente semelhante: a informação armazenada pode sofrer diversos
processos que alteram a informação contida, e a essas alterações damos o nome de mutação.
As mutações são alterações permanentes na sequência de bases nitrogenadas do material genético de um
organismo, causadas por uma série de fatores, como radiação, erros de replicação, envelhecimento, falhas
na maquinaria de reparo do DNA, atuação de agentes mutagênicos etc., que podem ocasionar diferentes
alterações na estrutura do DNA. São elas:
Susbtituição de uma base por outra
Este processo pode ocorrer nas seguintes formas:
Pode acontecer de forma silenciosa, ou seja, sem perda de informação original.
Mutação de substituição silenciosa.
A mutação de substituição pode alterar a sequência de aminoácidos que será traduzida.
A substituição pode alterar o aminoácido.
Silenciosa 
Mutação de sentido trocado 
A substituição de uma base nitrogenada leva à interrupção da tradução.
A mutação de substituição pode interromper a tradução.
A inserção de base nitrogenada desloca o restante da sequência para a direita, alterando a
sequência de RNAm e os códons que serão traduzidos.
A inserção de uma base nitrogenada altera os códons que serão traduzidos.
A deleção de base nitrogenada desloca o restante da sequência para a esquerda, alterando a
sequência de RNAm e os códons que serão traduzidos.
Mutação sem sentido 
Inserção 
Deleção 
A deleção de uma base nitrogenada altera os códons que serão traduzidos.
O nosso organismo tem maneiras de reparar esse tipo de mutação, mas, quando não há o reparo, acontece
o que chamamos de frameshift, que em inglês significa “mudança de quadro”, ou seja, toda a forma com que
os códons são lidos daquele trecho em diante ficará alterada, o que pode gerar uma leitura completamente
errada de toda a sequência após a mutação ou uma interrupção da leitura, caso apareça um stop códon.
Esquema ilustrando um exemplo de frameshift gerando alteração na proteína final.
As mutações podem ocasionar doenças genéticas. Artrite reumatoide, doença de Crohn, doença de
Alzheimer e fibrose cística, por exemplo, são causadas por mutações do tipo SNPs, do inglês Single
Nucleotide Polymorphisms (polimorfismo de nucleotídeo único), em que a alteração de um único
nucleotídeo é capaz de desencadear uma doença.
Exemplo de alteração SNP no DNA.
Além das SNPs, há outras mutações que podem conferir alguma quebra na homeostasia do corpo.
O projeto Genoma Humano possibilitou o mapeamento genético humano e permitiu identificar nos genes
quais são as regiões cruciais que desencadeiam determinadas doenças, ou ainda prever possíveis outras
apenas pelo sequenciamento genético. Fique tranquilo, iremos voltar ao Projeto Genoma em um outro
momento.
O caso mais famoso desse tipo de abordagem aconteceu com a atriz Angelina Jolie. Após um
sequenciamento genético, foi detectada uma mutação no gene BRCA1, um gene responsável pela produção
de proteínas supressoras de tumores, ou seja, proteínas que reparam o DNA danificado e, assim,
desempenham um papel na garantia da estabilidade do material genético de cada célula.
Uma mutação ou alteração nesse gene leva à síntese de proteínas não funcionais, permitindo que danos no
DNA da célula não sejam reparados e aumentando a possibilidade de desenvolvimento de câncer de mama.
Assim, quando a atriz descobriu a mutação, ela decidiu remover o tecido, o que causou muita polêmica na
época.
Mas nem sempre as mutações geram malefícios. As mutações foram cruciais no decorrer da história,
considerando um longo prazo (milhões de anos) para que a vida na Terra seja como ela é hoje. As
mudanças que ocorreram no DNA dos seres vivos fizeram com que algumas proteínas se comportassem de
forma diferente, tanto para melhor, sendo mais eficientes, quanto para pior, causando problemas graves
para o organismo.
Se pensarmos a curto prazo (alguns anos), seres que tiveram mutações que de alguma forma os faziam mal
morreram e foram esquecidos, e tais mutações não foram consolidadas.
No entanto, imagine diversas e diversas perpetuações de mutações benéficas ao longo de milhares de anos.
Isso causaria uma diferenciação significativa em determinadas populações, gerando uma evolução por
seleção natural de toda uma espécie. Alguns organismos mutaram tanto a ponto de iniciar novas espécies
e, assim, por diante.
A filogenética é a ciência que estuda a história da evolução das espécies para
mapear todas essas alterações genéticas e avançarmos na montagem desse
enorme quebra-cabeça evolutivo.
A imagem abaixo retrata um mapa filogenético. Verifique a nossa posição no mapa.
Árvore filogenética universal simplificada.
A popularização da informática no final da década de 90 possibilitou construirmos enormes bibliotecas
gênicas, a ponto de ser possível concluir o projeto Genoma Humano.
Durante essa pesquisa, após observada a função de vários genes, foi descoberto que nós, seres humanos,
tínhamos genes muito semelhantes a outras espécies (até mesmo bactérias).
Genes
Segmento de DNA que possui informação para que ocorra a síntese de um RNA mensageiro.
Exemplo
Genes relacionados a vias metabólicas, estruturais, de regulação de ciclo celular etc.
O mapa filogenético nos indica que existem ancestrais comuns. Assim é possível pontuar a história
evolutiva e estudar como se deu a evolução dos genes. Dividimos as características do histórico evolutivo
em genes homólogos e análogos.
Homologia é o compartilhamento de uma característica derivada de um mesmo ancestral, ou seja,
que foi compartilhada durante a história evolutiva. Órgãos homólogos são aqueles que apresentam
características similares em diferentes espécies, por exemplo, a pata do cavalo, a pata do leão, as
nadadeiras das baleias e o braço do ser humano que são homólogos entre si.
Mas você sabe o que é Homologia? 
Exemplo de órgãos homólogos.
Os genes homólogos, por sua vez, também indicam que determinado geneapresenta uma ancestralidade
em comum. Porém, é importante relatar que esses genes não são iguais.
Os genes homólogos podem ser genes ortólogos ou parálogos.
Genes ortólogos
São genes presentes em espécies diferentes que surgem de um ancestral comum por meio de especiação,
ou seja, por meio do processo evolutivo pelo qual novas espécies surgem. Nesse caso, a função tende a ser
conservada e cada descendente tem uma cópia.
Genes parálogos
Estão presentes na mesma espécie em estudo por duplicação. Nesse caso, a função tende a mudar e estão
presentes em mais de uma cópia.
Mas e os genes análogos?
Antes, precisamos entender que, nesse caso, a analogia traz a ideia de que tais genes têm características
semelhantes, mas não pertencem a um ancestral comum.
Os exemplos mais clássicos são asas de uma ave, de um morcego e de um inseto. Elas estão muito
distantes na árvore evolutiva e mesmo assim possuem a mesma função.
As asas de um morcego, de um inseto e de uma ave têm características análogas.
Os genes análogos são sequências de nucleotídeos diferentes, mas que traduzem proteínas com a mesma
função. Confuso? Calma, a seguir vemos a imagem de uma árvore filogenética resumindo todos esses
conceitos.
Genes homólogos e análogos entre o homem, o chimpanzé e a bactéria Escherichia coli.
Na imagem, note o gene das histonas presente no chimpanzé e nos homens e o gene da proteína HNS
Escherichia coli. As histonas são proteínas responsáveis pelo processo de compactação/descompactação
do DNA, possibilitando assim a regulação gênica e a interação com RNA polimerase. Há cinco tipos de
histonas que diferem no peso molecular e na função. Na imagem ilustrada, demonstramos dois deles.
Proteína HNS
É uma proteína semelhante à histona e representa um componente estrutural na bactéria que influencia
muitos processos celulares, incluindo recombinação, transcrição e transposição.
Expressão gênica
Todas as informações do nosso corpo ficam no DNA e todas as nossas células possuem o mesmo DNA,
compactadas o máximo possível para caber dentro do núcleo. As células do intestino e do cabelo possuem
o mesmo DNA, mas como isso é possível, uma vez que elas são tão diferentes em praticamente todos os
aspectos?
Para responder a essa pergunta devemos olhar para o passado e entender como as primeiras bactérias
foram evoluindo para melhor se adaptarem ao meio em que viviam.
Como vimos, a evolução se dá por mutações perpetuadas ao longo de gerações. Vejamos a situação
apresentada abaixo:
Atividade discursiva
Imagine duas bactérias de colônias diferentes, a bactéria X e Z, em um ambiente com pouca oferta de
nutrientes. A bactéria X continua a todo vapor sua produção de proteínas, com o metabolismo e o consumo de
nutrientes funcionando normalmente. Já a bactéria Z, quando tem uma resposta de escassez nutricional
mediada por fatores intracelulares, começa a frear seu metabolismo e passa a usar outra fonte de nutrição.
Qual das duas bactérias você acredita que terá mais chances de sobreviver, a X ou a Z?
Digite sua resposta aqui
Exibir Solução
Nas bactérias, a regulação via operon Lac acontece de forma muito parecida. Mas vamos entender melhor?
O operon Lac é um conjunto de genes relacionados ao metabolismo da lactose, um açúcar que pode ser
usado para a nutrição de diversas bactérias. Na falta de lactose, não há motivos para a bactéria gastar
energia na produção de proteínas que quebram a lactose, então ocorre uma inibição da região que promove
a expressão dessas proteínas, alterando o metabolismo daquele indivíduo para algo que faça mais sentido
para o meio em que ele vive.
Esquema de regulação do operon Lac mediado por lactose.
O mecanismo no qual uma bactéria tem de controlar seu metabolismo chama-se regulação da expressão
gênica. Em resumo, são uma série de estímulos que determinam o padrão da expressão dos genes, esse
padrão fará com que o produto final, ou seja o RNA e a síntese de proteínas mude de acordo com o que está
acontecendo naquele momento.
Existem ainda as proteínas reguladoras transcricionais, que podem de alguma forma ativar ou reprimir a
transcrição, de acordo com a necessidade do organismo.
Exemplo
A ausência de lactose pode ativar a proteína reguladora repressora e as sequências regulatórias, que são os
trechos em que as proteínas reguladoras se acoplam para exercer sua função.
Os organismos procariotos possuem o DNA disperso no citoplasma, já os eucariotos possuem o DNA
envolto por uma membrana nuclear e também mecanismos próprios de expressão gênica.
Existem inúmeros processos de controle de expressão, entretanto todos eles dependem do quão
compactado está o DNA, uma vez que quando compactado fica impossibilitado de transcrever, logo não há
como aquele gene ser expresso. Já um DNA mais relaxado permite que as proteínas responsáveis pela
transcrição atuem e pode ser expresso.
Nos eucariotos damos o nome de heterocromatina à região onde o DNA está compactado e inacessível, e
eucromatina quando ele está na forma descompactada. Essa regulação é feita através das histonas, que
como já sabemos controlam o grau de compactação do DNA. O mecanismo pelo qual as histonas realizam
a compactação/descompactação do DNA ocorre por um processo químico, quando estão acetiladas (na
presença de um grupamento acetil) ocorre um relaxamento do DNA e quando estão metiladas (na presença
de um grupamento metil) ocorre a compactação do DNA.
Heterocromatina (esquerda) e Eucromatina (direita).
Outra forma de controlar a expressão em eucariotos é controlar como o transcrito de RNA será submetido
ao splicing alternativo.
Mas o que é o splicing?
O DNA apresenta sequências codificadoras (éxons) intercaladas com sequências não codificadoras
(íntrons), para esse trancrito ser funcional devemos descartar os íntrons e ter um transcrito composto
apenas por éxons. Para isso são realizados cortes em regiões específicas chamadas de sítio de splicing.
Para entender melhor, observe a imagem a seguir:
Esquema mostrando o splicing, processamento do DNA semelhante a um “corte” e “cola”.
No entanto, a ligação entre os éxons pode ser realizada de diferentes maneiras durante o processamento do
RNA, a isso chamamos de splicing alternativo. Pode haver mais de uma combinação desses diferentes
trechos chamadas de isoformas do transcrito, gerando diferentes proteínas a partir de um mesmo gene. O
splicing, desse modo, permite uma diversificação da expressão gênica e assim uma enorme variabilidade
celular.
Diferentes isoformas do RNAm.
Existem ainda diversas outras formas de controle de expressão, como os fatores transcricionais, que são
moléculas ou proteínas que atuam ativando ou inibindo a transcrição de determinados trechos, e a
epigenética, que é uma ciência que tem como objetivo estudar como fatores externos ao organismo
influenciam na expressão dos genes, entre outros.
O mais importante é compreendermos que há diversos mecanismos que influenciam a expressão genética,
para assim responder ao nosso questionamento do começo do tópico:
“As células do seu intestino e do seu cabelo possuem o mesmo DNA, mas como isso
é possível, uma vez que elas são tão diferentes em praticamente todos os aspectos?”
Resposta
Apesar dessas células terem o mesmo DNA, seu padrão de expressão genético não é o mesmo. As regiões
de hetero e de eucromatina são arranjadas de formas distintas, ou seja, o padrão de splicing é diferente.
Dessa forma, temos a síntese de diversas proteínas que são responsáveis pela função específica de um
órgão específico.
Proteínas
As proteínas são biomoléculas construídas a partir de ligações peptídicas formadas no ribossomo, com a
sua sequência dada pela ordem dos códons de RNAm, que foram transcritos do DNA. Além de serem
responsáveis por manter o funcionamento celular, elas possuem funções diversas, como:
Formar a estrutura celular (actina);
Catalisar reações químicas no metabolismo de nutrientes (desidrogenases);
Servir de transporte de pequenas moléculas(canais iônicos);
Movimentação celular (cinesina);
Sinalização (proteína G);
Defesa celular (anticorpos) etc.
As proteínas são classificadas quanto à sua estrutura em quatro diferentes níveis:
Esta estrutura constitui as ligações peptídicas entre os aminoácidos.
Estrutura primária 
É a forma como a proteína se organiza — cujos três tipos gerais de estrutura são as α-hélices, as
folhas-β e as regiões de loop que conectam as duas anteriores.
Representada pelo conjunto das α-hélices, folhas-β e loops, que dá origem a uma estrutura maior e
organizada, chamada de subunidade.
É o conjunto das estruturas terciárias, que se dá quando existe mais de uma subunidade proteica
para formar a proteína final.
Estrutura secundária 
Estrutura terciária 
Estrutura quaternária 
A forma como as proteínas se consolidam depende dos resíduos de aminoácidos que as compõem. Dentre
os aminoácidos, há três classes: com carga (positivo ou negativo), polares (sem carga) e apolares. Esses
resíduos podem interagir entre si por ligações de hidrogênio, formando α-hélices ou dobrando sua estrutura.
Além disso, também pode acontecer o oposto: a repulsão entre resíduos gerar um afastamento de trechos
da proteína. Sendo assim, há diversas formas que uma proteína pode assumir.
No esquema a seguir podemos ver os diferentes tipos de aminoácidos e suas cargas.
Com carga na cadeia lateral.
Polares não carregados.
Apolares.
O conjunto total das interações entre os resíduos forma a conformação final da proteína (basicamente a
forma tridimensional que ela assume) e é fundamental para sua função. Por exemplo, algumas proteínas
têm, na ligação das subunidades, um canal no centro. A partir desse canal, moléculas podem ser
transportadas, conforme observamos na imagem ao lado.
Vista lateral e superior de um canal iônico.
Outras têm uma pequena cavidade, onde alguma molécula pode entrar e realizar uma reação química
mediada por um cofator e ser liberada depois para seguir a sua via metabólica.
Cavidade e sítio ativo de uma proteína.
Agora imagine que um resíduo fundamental, como uma lisina (LYS – com carga positiva), seja a peça-chave
para interagir com a molécula da sua via metabólica, uma molécula que tenha carga negativa. Assim
percebemos que a lisina é um resíduo extremamente importante para o funcionamento da proteína, pois é
necessária para a interação da carga positiva do resíduo com a carga negativa da molécula.
Vem que eu te explico!
Os vídeos a seguir abordam os assuntos mais relevantes do conteúdo que você acabou de estudar.
Módulo 1 - Vem que eu te explico!
Estrutura do DNA
Módulo 1 - Vem que eu te explico!
O código genético
Módulo 1 - Vem que eu te explico!
A evolução gênica
Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?

Questão 1
O mapa filogenético nos indica que há ancestrais comuns. Assim é possível pontuar a história evolutiva e
estudar como se deu a evolução dos genes. Um gene de uma bactéria A com sequência de nucleotídeos
ACGTAGGTCGTTACCAGG codifica uma proteína Y capaz de realizar a quebra de glicose. De forma
semelhante, os pássaros apresentam a sequência de nucleotídeos GTACTAATCATGGGCAATTTC, que
codifica uma proteína Z que é capaz de quebrar glicose. Como você classifica esses dois genes?
A Homólogos
B Ortólogos
C Parálogos
D Análogos
E Universais
Parabéns! A alternativa D está correta.
Os genes análogos são aqueles que apresentam uma sequência de nucleotídeos muito
diferentes, como os encontrados em algumas bactérias e nos pássaros, mas codificam proteínas
semelhantes. Na questão, ambos os genes codificam proteínas que quebram glicose.
Questão 2
Vimos que os organismos procariotos realizam o controle da expressão por meio de operons. Um deles é o
operon Lac, conhecido por operar o metabolismo de lactose e presente em muitos organismos. Sobre esse
mecanismo assinale a alternativa correta:
A
A presença da regulação gênica ajudou, ao longo do processo evolutivo, na mutação das
espécies.
B
A presença da regulação gênica ajudou, ao longo do processo evolutivo, na preservação
da vida por meio de um controle refinado do metabolismo dos organismos.
C O operon Lac é responsável por controlar todo o metabolismo dos procariotos.
D
O operon Lac é responsável por encontrar e corrigir mutações, fazendo a regulação
gênica.
E O operon Lac também pode ser encontrado em eucariotos.
Parabéns! A alternativa B está correta.
O operon Lac é um dos operons que participa da regulação gênica dos organismos procariotos.
Ele modula a expressão de enzimas responsáveis pela metabolização de lactose e, com isso,
pode aumentar ou diminuir a expressão, evitando gasto energético desnecessário, o que foi
crucial para a manutenção da vida desses organismos ao longo do tempo.

2 - Aplicações da bioinformática
Ao �nal deste módulo, você será capaz de reconhecer o histórico e algumas aplicações da
bioinformática no mundo atual.
Histórico da bioinformática
Em todas as áreas do conhecimento existe certa interdisciplinaridade. Para saber como um objeto se move
é necessário conhecer a física e a matemática. Para entender um texto histórico, temos que saber a
linguagem escrita, o contexto em que aquele texto foi escrito e a forma como a sociedade era organizada.
Há diferentes partes que, quando juntas, formam a chave para a compreensão de qualquer conhecimento.
Na bioinformática não é diferente, pois não se trata apenas da união da biologia (bio) com a informática, e
sim de uma série de outros fatores que serão citados ao longo do nosso estudo.
Podemos dizer que essa nova área do conhecimento surgiu a partir da necessidade de armazenar dados e
realizar contas matemáticas por meio de algoritmos que auxiliariam o dia a dia dos pesquisadores.
Algoritmos
É uma “receita” para executar uma tarefa ou resolver algum problema. Pode ser, por exemplo, uma fórmula
matemática.
Para conhecermos o histórico da bioinformática, precisamos conhecer o histórico da informática. Foi na
década de 60 que surgiram os primeiros computadores para uso comercial, como o IBM 7094, que
ocupavam um espaço gigantesco e não eram nada simples de operar.
IBM 7094, um dos primeiros computadores criados para uso comercial.
Ainda assim a físico-química americana Margaret Dayhoff conseguiu criar o primeiro programa de
bioinformática da história, o COMPROTEIN, com o objetivo de determinar a estrutura proteica de uma série
de sequências de peptídeos.
O uso de computadores para auxiliar na rotina de laboratório foi uma verdadeira revolução, pelo fato de eles
serem mais ágeis e confiáveis que anotações em cadernos. Entretanto, o maior problema era a dificuldade
de operar os programas, pois todos os comandos eram dados por linhas de código e — acredite — não era
nada fácil executá-los.
Com o passar do tempo, os computadores foram ficando cada vez mais potentes, com maior capacidade de
processamento e memória, facilitando a construção de programas mais elaborados.
Exemplo de aplicação do algoritmo de Needleman-Wunsch.
Em 1970, Needleman e Wunsch criaram um algoritmo capaz de realizar o alinhamento entre duas
sequências de proteínas. Nesse algoritmo, como demostrado na figura ao lado, são comparadas duas
sequências de nucleotídeos (GATTACA e GCATGCG). Para isso, as sequências são inseridas nos eixos X e Y
e o programa realiza uma comparação entre elas. A partir dessa comparação, se as letras combinam
(match), é dado um valor, e se elas não combinam (mismatch) ou se tem um espaço entre elas (gap), é dado
outro valor. O computador, então, calcula o melhor caminho possível e, a partir deste, as duas sequências
são alinhadas.
Na década de 90, houve uma comoção de pesquisadores de 18 países, incluindo o Brasil, para desvendar
por completo o DNA do ser humano: o trabalho conhecido como projeto Genoma Humano.
O trabalho durou ao todo 13 anos para conseguir entregar, em sua conclusão, 99% do nosso código
genético com 99,9% de precisão. Para isso, abioinformática mais uma vez foi essencial, pois, a partir de
programas de computador específicos, os pequenos trechos sequenciados eram adicionados a um grande
banco de dados e encaixados no seu devido lugar. Dessa forma, foi criado um único arquivo editável que
todos os participantes do trabalho poderiam alterar conforme o progresso era feito, incluindo anotações,
descrições e comparações. Imagine como seria fazer toda essa organização sem o auxílio de programas,
no bom e velho caderno. Seria muito mais difícil e inviável.
Robert Waterston, do Centro de Sequenciamento do Genoma da Universidade de Washington, fala sobre publicações que descrevem as
análises iniciais da sequência do genoma humano.
Os benefícios e aplicações desse estudo são muito relevantes até os dias de hoje, pois a partir dele foram
desenvolvidos diversos softwares de bancos de dados que foram preenchidos com genomas de diversas
espécies. Além disso, representa um marco na tecnologia de sequenciamento com o desenvolvimento de
técnicas de montagens de sequências genômicas (reconstrução das sequências), elucidação de funções e
mutações genéticas etc. Todos esses avanços foram essenciais para o entendimento da genética atual.
Abaixo, apresentamos uma linha do tempo com importantes marcos do projeto Genoma Humano.
Esses e alguns outros eventos marcaram o início do uso da informática associada à Biologia. Entretanto,
ainda era uma área muito restrita, pois precisava que os programas fossem mais amigáveis. A tecnologia
avançou junto com a necessidade e tornou os computadores menores e mais baratos.
No início dos anos 2000, apesar de ainda um pouco caro, já era possível, com algum esforço, uma pessoa
de classe média-baixa comprar seu primeiro computador e usar as ferramentas do Windows ou a Internet
1990
O Projeto Genoma Humano
(HGP) é lançado nos Estados
Unidos.
1991
Estabelecidos os primeiros
centros de genoma dos EUA.
1992
Mapa genético humano de
segunda geração
desenvolvido.
em sua fase inicial. Utilizar um computador era relativamente simples: bastava ler o que estava na tela e ir
clicando conforme as opções e botões surgiam. Parece trivial, certo? Errado!
Um dos principais motivos de toda nossa história ter funcionado foi uma interface gráfica do usuário
chamada de Graphical User Interface (GUI).
A GUI é a forma como nos conectamos com o computador, não mais por linhas de texto ou programação,
mas hoje em dia a partir de botões e animações. Assim, ficou muito mais fácil de usar o computador. E esse
foi o grande ponto de virada da bioinformática.
Atualmente, usamos botões e atalhos onde antes eram usadas linhas de texto, tornando mais fácil o uso dos computadores.
Os laboratórios de Biologia, Química, Física e outras ciências, mesmo que com pouca verba, poderiam
comprar seus computadores e, com a ajuda de programadores e matemáticos, criar seus programas para
usar diariamente.
A tecnologia não parou de avançar, e os computadores ganharam mais uma peça: a placa de vídeo Graphics
Processing Unit (GPU). Ela era capaz de realizar contas mais complexas envolvendo objetos animados. Isso
tornou possível desenhar e visualizar proteínas em três dimensões, cadeias de DNA, polímeros e,
recentemente, até mesmo simular o comportamento de uma proteína em um ambiente bem próximo do real
por um curto período de tempo.
Conseguimos perceber que a bioinformática surgiu da união de áreas como programação, estatística, física,
química e biologia, para desenvolver programas computacionais que permitam reconhecer sequências de
genes, prever a configuração tridimensional de proteínas, organizar e relacionar informação biológica,
agrupar proteínas homólogas, estabelecer árvores filogenéticas, analisar a expressão gênica de forma
rápida etc.
Comentário
Um profissional que se interesse pela área, mesmo com os programas cada vez mais amigáveis, precisa ter
noções de todos os pontos envolvidos, o que torna o aprendizado um processo árduo, mas com certeza
muito recompensador.
Bioinformática e suas aplicações no mundo atual
Atualmente, seria bastante difícil manter a nossa sociedade sem a ajuda de computadores. Sem eles, não
teríamos mais internet, bancos on-line e nem mesmo o programa que uso para construir este texto e o que
vocês usam para ler este conteúdo. Na pesquisa científica e em praticamente todas as áreas das ciências
biológicas não é diferente. Além disso, com o desenvolvimento da bioinformática, os processos ficaram
mais rápidos e com menor custo.
O maior exemplo que pode ser dado é a vacina contra a covid-19. Claro, existem muitos fatores, mas
tivemos uma vacina eficiente para essa nova doença em menos de um ano e parte disso deve-se à
bioinformática.
Ilustração 3D da proteína S.
A partir da bioinformática foi possível o mapeamento dos possíveis sítios para a criação das vacinas, a
elucidação da proteína S do vírus (uma proteína da espícula viral que possibilita a entrada e infecção das
células humanas), entender o mecanismo de entrada e ação viral, compreender a ligação com a célula
humana e, assim, estudar melhor as maneiras de combate ao vírus.
A imagem ao lado ilustra a reconstrução do complexo que contém a proteína S a partir de um programa de
modelagem molecular.
Atualmente, a bioinformática é composta por diferentes técnicas com diferentes aplicabilidades. A partir de
agora vamos conhecê-las:
Alinhamento e modelagem molecular
Como já sabemos, o sequenciamento genético realizado no projeto Genoma Humano foi um divisor de
águas na forma como víamos as sequências genéticas. Ele permitiu que pudéssemos ler (literalmente) os
genes e entender as associações existentes entre diferentes espécies, já que uma grande parte dos genes
foi sequenciada e está disponível em bancos de dados digitais que possuem inclusive os genes de diversas
espécies de animais. Usamos esses bancos de dados para obter os códigos dos resíduos de aminoácidos
de proteínas de diferentes espécies e, a partir deles, fazer a técnica de alinhamento.
O alinhamento possui grande importância nos estudos de filogenética, possibilitando o reconhecimento de
ancestrais comuns, baseado em trechos de DNA conservados entre diferentes espécies, definidas assim
como sequências homólogas. Em alguns casos, o alinhamento também será capaz de prever
características estruturais e funcionais das proteínas a partir dos genes de origem, baseado na atuação
desse no trecho homólogo.
O alinhamento pode ser realizado entre duas ou mais sequências e obedece a um algoritmo, como o
algoritmo de Needleman & Wunsch, do qual já falamos.
Mas como este processo funciona?
Vamos imaginar que queremos verificar o alinhamento entre as sequências de aminoácidos de uma
proteína P2X7 entre o urso panda e o homem. Para isso, o algoritmo calcula e verifica o melhor alinhamento
possível. Na imagem a seguir, observe os trechos em vermelho, que são os trechos alinhados dos códigos
de resíduos de aminoácidos que geram a proteína P2X7 no ser humano e no urso panda.
Exemplo prático de alinhamento entre duas sequências da proteína P2X7.
E como o alinhamento pode ser utilizado?
Resposta
O alinhamento pode resolver problemas recorrentes, por exemplo, quando um trecho do genoma de
determinado organismo é sequenciado, sendo preciso saber qual proteína é codificada nesse trecho.
Para isso, podemos então realizar uma busca em um banco de dados (NCBI/BLAST), que faz uma série de
cruzamentos de informações para ver qual seria o gene que melhor se alinha com esse trecho, e a partir daí
é gerado uma pontuação e uma identidade (que é a porcentagem de pares perfeitos entre as duas
sequências), caso a pontuação seja alta pode ser atribuído uma função semelhante ao meu gene de estudo.
Há diferentes formas de exibição dentro dos programas de visualização de estruturas proteicas para
facilitar a visualização das proteínas. O que contribui para que, mesmo para uma pessoa leiga, compreenda
como a função da proteína pode ser relacionadaà sua estrutura. Vejamos alguns exemplos de formas de
exibição de estruturas proteicas:
Com o alinhamento realizado e uma identidade acima de 25%, podemos realizar uma técnica chamada de
modelagem por homologia e gerar um modelo tridimensional da sequência proteica alvo. A partir de uma
sequência alvo, identificamos em um banco de dados uma sequência molde com estrutura resolvida e, em
seguida, é feito o alinhamento e a modelagem, gerando um modelo final, ou seja, um modelo tridimensional
de uma proteína com estrutura não conhecida.
Modelagem proteica por homologia.
Cartoon Palitos Bolas e palitos
A modelagem molecular de proteínas pode também ser feita por métodos não comparativos, chamados de
ab initio e threading.
Método ab initio
Nesse método, a construção é feita somente a partir de cálculos matemáticos em que a sequência de
aminoácidos é levada em consideração para tentar prever a estrutura secundária das proteínas.
Método por threading
É baseado na estrutura secundária de modelos com identidade baixa ou por inteligência artificial, que
analisa bancos de dados e cruza informações para tentar obter um modelo confiável.
Ancoramento Molecular
O ancoramento molecular é também chamando de docagem molecular ou molecular docking. A técnica
consiste em utilizar um modelo tridimensional (no nosso caso uma proteína), definir uma área de busca —
que seria, basicamente, informar ao programa a área da proteína em que se deseja ancorar uma molécula —
e depois testar a possibilidade de ligação da molécula na região da proteína delimitada. O ligante irá se
encaixar no local mais energeticamente favorável, e essa interação vai gerar uma pontuação. O programa
constrói diferentes conformações da ligação ligante-proteína e cada uma delas recebe o nome de pose. A
melhor pose é aquela que obtém a maior pontuação dada pelo algoritmo do programa de ancoramento.
Esquema do ancoramento de uma pequena molécula ligante (verde) a uma proteína alvo (preta) formando um complexo proteína-ligante.
O ancoramento molecular pode ser utilizado para determinar qual ligante irá interagir melhor com uma
proteína, definir a pose de interação, encontrar sítios ativos e ajudar a determinar se mutações de resíduos
de aminoácidos serão relevantes para essa interação.
Podemos citar, por exemplo, a variante B.117 do SARS-CoV-2, um vírus mais infeccioso por causa de uma
mutação N501Y na proteína S (Spike-ACE2). Sendo assim, na posição 501 da proteína em questão, um
resíduo asparagina mutou para dar lugar a um resíduo tirosina. Essa mutação resultou em um maior número
de interações com o sítio ativo, tornando a ligação do vírus com o seu receptor mais forte. Logo, uma menor
carga viral se tornou suficiente para causar a doença.
Ancoramento molecular com a proteína S da covid-19 (N501, SARS-CoV-2).
Ancoramento molecular com a proteína S da variante B.117 (Y501, SARS-CoV-2).
Comentário
Realizar essa ligação em um ambiente virtual simulando a energia de interação é muito importante. Mas nas
poses, como são imagens estáticas, não existem a influência do tempo e outros fatores na interação entre
as proteínas.
Dinâmica molecular
A dinâmica molecular tem como objetivo analisar interações e movimentações em diversos sistemas não
apenas por um único instante, mas ao longo de uma trajetória em determinado espaço-tempo. A sua
aplicabilidade no dia a dia é muito ampla, podendo ser usada para entender mecanismos de ação de
proteínas, interações entre fármaco-receptor, como determinados materiais se comportam sob stress etc.
As aplicações da dinâmica molecular vão além da biologia. Ela é usada em física, química, engenharia e até
mesmo na geologia.
Mas como funciona a dinâmica molecular?
No ancoramento molecular, existe uma pose com a maior pontuação de uma possível interação do ligante
com o seu receptor, seguindo o clássico modelo chave-fechadura (o ligante é a chave que encontra a
proteína, fechadura), mas sabemos que no mundo real as coisas não funcionam assim de forma tão rígida.
Pensando em solucionar esse problema, foi criada uma técnica chamada de dinâmica molecular, que
substituía esse modelo chave-fechadura por um outro chamado de modelo de ajuste induzido, não mais
utilizando uma pose apenas, e sim uma trajetória, uma simulação de um ambiente real.
Sistema usado na dinâmica molecular: uma caixa de água contendo a proteína, o ligante e o cofator.
Na dinâmica molecular, cada átomo, seja da proteína, do ligante ou da água, é levado em consideração para
calcular a movimentação de todo o sistema por alguns nano ou milissegundos e entender as
movimentações existentes. A simulação de dinâmica molecular é feita a partir de uma pose vinda do
ancoramento molecular. Essa pose (contendo o nosso sistema, proteína e ligantes) é inserida em uma caixa
contendo moléculas de água, tendo como objetivo mimetizar um ambiente biológico real. Então, uma série
de cálculos complexos baseados em um conjunto de parâmetros chamado de campo de forças é aplicado.
O campo de força possui as informações necessárias para que o computador determine e simule como as
interações acontecem, os tipos de ligações possíveis e o que é necessário para que aqueles átomos
interajam entre si. Apesar de já existirem programas de computador que realizam esses cálculos, ainda são
necessários outros mais avançados que consigam fazer dinâmicas cada vez mais complexas e mais
longas.
Atualmente, há um enorme esforço global para ajudar a comunidade científica nesse sentido. Em 2017, a
revista Nature publicou o artigo Physical properties of the HIV-1 capsid from all-atom molecular dynamics
simulations, de Perilla & Schulten, no qual é relatado que um supercomputador conseguiu fazer uma
simulação de todos os átomos presentes no capsídeo do vírus HIV-1 por 400 nanossegundos. Foram
observados cerca de 4 milhões de átomos!
Imagem do capsídeo viral.
Os supercomputadores do mundo inteiro, hoje em dia, estão realizando simulações com o SARS-CoV-2.
Com o avanço da tecnologia serão possíveis feitos cada vez maiores. Quem sabe um dia até mesmo seja
possível simularmos células completas. Além das simulações levando em consideração os átomos, há
também as simulações que consideram os elétrons. São os chamados métodos quânticos. Esses exigem,
porém, um custo computacional ainda maior, e são usados apenas para moléculas pequenas ou no sítio de
interação.
Saiba mais
Custo computacional seria uma quantidade de cálculos em determinado tempo. Um alto custo
computacional traduz-se em muitos cálculos ou em um longo tempo para realizar determinada tarefa.
Agora imagine que você queira descobrir novos alvos terapêuticos partindo de um ligante conhecido, como
no desenvolvimento de um medicamento que se liga à proteína S do vírus da covid-19 e assim impede sua
entrada na célula humana. Para isso, você deverá realizar uma sequência de técnicas dentro da
bioinformática. São elas: alinhamento, modelagem molecular, ancoramento e, por último, a dinâmica
molecular.
Modelagem molecular de proteínas
Está na hora de falarmos sobre a importância da bioinformática para a construção de estruturas de
proteínas e, ainda, simular a construção de uma proteína. Vamos lá!
Relação estrutura-atividade
A estatística é uma ciência que pode ser aplicada diretamente nos estudos biológicos, sendo crucial para a
bioinformática.

A quantificação da relação estrutura-atividade pode ser feita por meio de uma técnica chamada QSAR
(Quantitative Structure-Activity Relationship) ou relação quantitativa de estrutura-atividade. O QSAR
possibilita, a partir de dados obtidos por dinâmica molecular, no ancoramento molecular ou em ensaios
biológicos, alcançarmos um conjunto de dados, chamado de grupo treinamento. Após isso, extraímos uma
equação matemática, por meio de algum algoritmo estatístico.
Em seguida, podemos testar essa equação contra o nosso grupo teste, com os valores também conhecidos,
para determinar se ela funciona. Com a confirmação da equação,podemos construir novas moléculas com
maior potencial para agir em determinado alvo ou para tentar prever a atividade de compostos já existentes,
seguindo um modelo estatístico.
Vem que eu te explico!
Os vídeos a seguir abordam os assuntos mais relevantes do conteúdo que você acabou de estudar.
Módulo 2 - Vem que eu te explico!
Bioinformática
Módulo 2 - Vem que eu te explico!
Bioinformática e suas aplicações no mundo atual

Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?
Questão 1
O projeto Genoma Humano foi uma verdadeira revolução na biologia molecular e na bioinformática. Foram
necessários 13 anos de trabalho para ser concluído e os resultados foram bem promissores. Levando em
consideração os avanços realizados, podemos concluir que
A
o projeto Genoma Humano foi capaz de reunir a comunidade científica com apenas um
objetivo em comum: sequenciar o DNA humano.
B
foi um verdadeiro marco na história, e os avanços foram cruciais para o entendimento
atual sobre genética.
C foi muito importante para estabelecer o conceito do dogma central da biologia.
D
o projeto Genoma Humano foi capaz de sequenciar 90% do DNA humano com 100% de
precisão.
E
tivemos 100% dos nossos genes definidos e suas funções completamente definidas com
a finalização do projeto Genoma Humano.
Parabéns! A alternativa B está correta.
O projeto Genoma Humano possibilitou que 99% do nosso código genético fosse sequenciado
com precisão de 99,9%, sendo um marco na história, uma vez que permitiu diferentes avanços
tecnológicos, como a criação de bancos de dados internacionais e de diversas novas técnicas de
bioinformática que compõem a base de muitos estudos recentes e que são fundamentais para o
entendimento da genética atual.
Questão 2
Novos alvos terapêuticos podem ser encontrados com o auxílio de técnicas de bioinformática. Partindo de
um ligante conhecido, qual seria a ordem lógica que um pesquisador poderia adotar para identificar um
novo alvo?
A Modelagem molecular, alinhamento, dinâmica molecular, ancoramento.
B Alinhamento, modelagem molecular, ancoramento, dinâmica molecular.
C Dinâmica molecular, modelagem molecular, alinhamento, ancoramento.
D Ancoramento, dinâmica molecular, alinhamento, modelagem molecular.
E Modelagem molecular, alinhamento, ancoramento, dinâmica molecular.
Parabéns! A alternativa B está correta.
A ordem lógica ideal para o desenvolvimento de novos fármacos seria: alinhamento, para
identificarmos se o alvo possui proteína molde; modelagem molecular, para construir um modelo
tridimensional; ancoramento, para obter uma pose do ligante com o alvo; e dinâmica molecular,
para analisar como as interações acontecem.
Considerações �nais
Durante o desenvolvimento da biologia molecular houve uma verdadeira revolução tecnológica na área da
informática. O alinhamento dessas duas ciências possibilitou o surgimento de uma nova ciência, a
Bioinformática, e com ela diversas técnicas que hoje são cruciais para o avanço da pesquisa científica
biomédica e do desenvolvimento de produtos para a área da saúde.
Assim, ao longo deste conteúdo, visitamos os principais conceitos da biologia molecular para a
compreensão da bioinformática, como o dogma central da Biologia e como ele se desenrola; a importância
do DNA e dos genes e suas mutações; e como as proteínas funcionam. Além disso, conhecemos a história
da bioinformática e algumas de suas principais técnicas e aplicações práticas.
A informática modificou completamente a forma como enxergamos o mundo, tornando a tecnologia mais
barata e acelerando o desenvolvimento científico. O aumento constante do poder computacional com os
computadores quânticos, por exemplo, pode levar a bioinformática a patamares ainda mais elevados. A
Bioinformática talvez seja uma das ciências mais promissoras do século XXI. Estamos vivenciando apenas
o começo dessa mudança de paradigmas.
Podcast
Quais serão os avanços e vantagens da bioinformática? Ouça a seguir sobre o que esperar dessa área nos
próximos anos.


Referências
ALEXANDRE, F. C. Introdução à modelagem molecular. Consultado na Internet em: 27 out. 2021.
COELHO, L. W. et al. Aplicação de mecânica molecular em química inorgânica. Química nova, v. 22, n. 3, p.
396-404, 1999.
DE VIVO, M. et al. Role of molecular dynamics and related methods in drug discovery. Journal of Medicinal
Chemistry, v. 59, n. 9, p. 4035-4061, 2016.
GAUTHIER, J. et al. A brief history of bioinformatics. Consultado na internet em: 27 out. 2021.
GREEN, E. D.; WATSON, J. D.; COLLINS, F. S. Human genome project: twenty-five years of big biology. Nature
News, v. 526, n. 7571, p. 29, 2015.
HUANG, L.; ROUX, B. Automated force field parameterization for nonpolarizable and polarizable atomic
models based on ab initio target data. Journal of Chemical Theory and Computation, v. 9, n. 8, p. 3543-3556,
2013.
HUANG, S.; ZOU, X. Advances and challenges in protein-ligand docking. International Journal of Molecular
Sciences, v. 11, n. 8, p. 3016-3034, 2010.
KARR J. R.; SANGHVI J. C.; MACKLIN D. N., et al. A whole-cell computational model predicts phenotype
from genotype. National Library of Medicine, 150:389–401, 2012.
MANDAL, S.; MOUDGIL, M.; MANDAL, S. K. Rational drug design. European Journal of Pharmacology, v. 625,
n. 1-3, p. 90-100, 2009.
MORGON, N. H.; COUTINHO, K. Métodos de química teórica e modelagem molecular. São Paulo: Editora
Livraria da Física, 2007.
PAGADALA, N. S.; SYED, K.; TUSZYNSKI, J. Software for molecular docking: a review. Biophysical Reviews, v.
9, n. 2, p. 91-102, 2017.
SLIWOSKI, G. et al. Computational methods in drug discovery. Pharmacological reviews, v. 66, n. 1, p. 334-
395, 2014.
VERLI, H. et al. Bioinformática da biologia à flexibilidade molecular. São Paulo: SBBq, 2014.
Explore +
Para aprofundar seus conhecimentos sobre o conteúdo abordado, pesquise:
O artigo A era da bioinformática: seu potencial e suas aplicações para ciências da saúde, de Araújo e
colaboradores.
O artigo Ferramentas de bioinformática na caracterização de alvos de medicamentos, do VI Curso de
Inverno em Biologia Celular e Molecular do programa de pós-graduação em ciências biológicas da
Universidade Estadual de Maringá, de Pimentel e colaboradores.
Leia também:
Transcrição e Processamento de DNA, no material da USP, Biologia molecular: Texto 4, disponível na
Internet.
Síntese de Proteínas, no material da USP, Biologia molecular: Texto 7, disponível na Internet.
A Transcriptase Reversa como Alvo Terapêutico em Doenças Retrovirais, disponível na Biblioteca Digital da
Universidade Federal do Paraná.
COVID-19: Fisiopatologia e Alvos para Intervenção Terapêutica, disponível na Revista Virtual de Química, da
Sociedade Brasileira de Química.
Assista ao vídeo Do DNA à Proteína, disponível no canal Inteligentista, no YouTube.
 Baixar conteúdo
javascript:CriaPDF()