Buscar

Introdução à Bioinformática

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 1/31
Introdução à Bioinformática
Prof. Eldio Gonçalves dos Santos
Descrição
Histórico, relação com a biologia molecular, áreas do conhecimento envolvidas e aplicações da bioinformática.
Propósito
Compreender os conceitos de biologia molecular, o histórico e as aplicações da bioinformática é importante para iniciar os estudos nessa nova área
do conhecimento, que gera grandes descobertas e avanços especialmente no âmbito biomédico.
Objetivos
Módulo 1
A biologia molecular e a bioinformática
Descrever os conceitos de biologia molecular e das proteínas importantes para a bioinformática.
Módulo 2
Aplicações da bioinformática
Reconhecer o histórico e algumas aplicações da bioinformática no mundo atual.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 2/31
1 - A biologia molecular e a bioinformática
Ao �nal deste módulo, você será capaz de descrever os conceitos de biologia molecular e das proteínas importantes para a
bioinformática.
Conceitos de biologia molecular importantes para a bioinformática
Todos os seres vivos do planeta, para continuar existindo, precisam se reproduzir, ou serão extintos. Há diversas formas de reprodução, mas todas
envolvem a cópia de uma biomolécula bem característica, formada pela união de um grupamento fosfato, uma pentose e uma base nitrogenada,
chamada de ácido desoxirribonucleico (ADN) — mais conhecida como DNA. Na imagem a seguir conseguimos relembrar a estrutura do DNA.
A biologia molecular é responsável por estudar as moléculas que realizam a manutenção da vida — DNA, RNA e proteínas —, que têm como
função principal, considerando o dogma central da Biologia, armazenar informações, enviá-las para a síntese das proteínas e realizar as
funções celulares, respectivamente.
Diversos dos avanços que tivemos até hoje se deram devido à elaboração de técnicas que nos proporcionaram novas formas de estudar o
DNA e o RNA, que estão em constante evolução. Recentemente, a informática tornou-se uma importante aliada, criando uma ciência, a
Bioinformática. Assim, essa nova ciência atua em parceria com a Ciência da Computação, Estatística, Matemática e as Engenharias para
analisar, interpretar e processar dados biológicos.
A bioinformática hoje está presente, mesmo que de forma indireta, na vida de todos os pesquisadores e em praticamente todos os
laboratórios do mundo. Neste conteúdo, vamos entender conceitos sobre biologia molecular, para melhor compreender a bioinformática e
descobrir afinal o que ela é, para que serve, como surgiu e conhecer algumas de suas metodologias. Vamos juntos?
Introdução
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 3/31
Estrutura de uma molécula de DNA.
Como já sabemos, existem quatro diferentes nucleotídeos presentes no DNA: Adenina (A), Timina (T), Guanina (G) e Citosina (C). Esses são
formados por três diferentes elementos: uma base nitrogenada, que vai de fato dar o nome para o nucleotídeo (A, T, C, G); uma pentose, que será
ribose no RNA ou desoxirribose no DNA; e um grupamento fosfato, que interage com a pentose fazendo uma ligação fosfodiéster. A adenina se liga
a uma timina por uma ligação dupla de hidrogênio e a guanina se liga com a citosina por uma ligação tripla de hidrogênio, conforme observamos na
imagem a seguir:
igação fosfodiéster
Une dois nucleotídeos pela ligação entre fosfatos no quinto carbono de uma desoxirribose ou ribose com a hidroxila presente no terceiro carbono da
desoxirribose ou ribose de um outro nucleotídeo.
Bases nitrogenadas presentes no DNA.
O DNA tem como função principal armazenar uma série de sequências e padrões que serão lidos por um sistema bastante complexo. Ao ter sua
expressão feita de forma correta, resulta na formação de determinado ser vivo. Essa molécula, por ser estável, é capaz de carregar todas as
informações genéticas de um indivíduo e ser copiada para gerar outros indivíduos idênticos.
Mas como ocorre o fluxo de informação nos organismos vivos?
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 4/31
minoácido
É a menor unidade funcional de uma proteína. É uma molécula pequena formada por um grupamento R, um grupamento amina e um grupamento ácido
carboxílico.
adeia peptídica
A cadeia peptídica que irá se tornar uma proteína precisa ser moldada tridimensionalmente para adquirir sua característica terciária e quaternária. Tal
processo é feito por proteínas chamadas chaperonas.
Nos seres vivos existe uma enorme variação de proteínas com diferentes funções essenciais à vida. Elas coordenam quase todos os processos
vitais, como o metabolismo celular e bioquímico, o apoio na divisão do DNA, a síntese de moléculas importantes para a manutenção da célula etc.
Esse fluxo de informação genética dentro de uma célula ou em um organismo recebe o nome de dogma central da biologia molecular. Na imagem
abaixo vemos um esquema que retrata esse dogma tão importante para a biologia molecular.
Esquema do dogma central da biologia molecular.
O dogma central da biologia foi criado em 1958, por Francis Crick, e afirma que é preciso uma determinada sequência de eventos para que a
informação genética seja traduzida.
Replicação
Primeiramente, ocorre a cópia completa de toda a sequência de DNA contida em cada célula individual, em um processo chamado de
replicação. No entanto, para que as informações contidas no DNA sejam convertidas em proteínas, elas precisam ser transformadas
em uma molécula intermediária — o RNA (ácido ribonucleico), que é constituído por uma pentose e um fosfato e tem como bases
nitrogenadas a adenina, a guanina, a citosina e a uracila.
Transcrição
Para isso, o DNA deve ser reconhecido pela proteína RNA polimerase, para gerar uma molécula de RNA mensageiro (RNAm), no
processo chamado de transcrição. O RNAm carrega as informações contidas no DNA e é lido pelo ribossomo, de três em três bases
nitrogenadas. A cada conjunto desse damos o nome de códon.
Tradução
Cada códon indica que um aminoácido será inserido pelo ribossomo em uma cadeia maior. A união de diferentes aminoácidos forma
uma cadeia peptídica, que, ao se organizar, gera uma proteína. Esse processo é chamado de tradução, e ocorre quando um RNAm é
traduzido em proteínas, que são as unidades funcionais do nosso corpo.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 5/31
Francis Crick.
Saiba mais
Há alguns organismos, como vírus, capazes de reverter o dogma central da biologia a partir da proteína transcriptase reversa. São exemplos o vírus
da imunodeficiência adquirida e o SARS-CoV-2.
Replicação, transcrição e tradução do DNA
Veja agora os processos que envolvem as etapas de replicação, transcrição e tradução, que compõem o dogma central. Vamos lá!
É um pouco difícil tentar imaginar como o DNA armazena tanta informação em um espaço tão pequeno, mas vamos comparar com um computador
tradicional.
Imagine que o hard disk (HD) do seu computador consiga guardar informações de 500 gigabytes ou 1 terabyte. Ou seja, uma unidade de conversão
na qual 1 gigabyte equivale a 109 bytes, 1 terabyte equivale a 1012 bytes, e um byte equivale a 8 bits. O computador funciona com uma base binária
de 0 e 1, e cada sinal desse (0 ou 1) equivale a um bit, sendo que a cada 8 bits temos um byte.
O nosso DNA funciona como um programa de computador (de verdade, a semelhança é impressionante!).
Vejamos alguns exemplos disso: os computadores, como já dissemos, utilizam um sistema binário (0 e 1). Já o DNA possui um sistema quaternário
com as variáveis A, T, C, G, na qual cada códon seria equivalente a 1 byte (equivale a 8 bits), e cada letra de DNA, 1 bit. Além disso, alguns vírus são
capazes de modificar as sequênciasdo DNA, assim como nos softwares.
Curiosidade
Se convertêssemos para uma unidade em bytes, cada célula humana teria cerca de 1,5 gigabytes!
Existe ainda um código que comanda a construção das proteínas, o código genético, e esse código é universal, válido para todos os seres vivos,
demonstrando que todos eles possuem uma origem única e é determinado pelos códons.

11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 6/31
Comentário
A universalidade do código genético indica que Darwin tinha razão em sua teoria de evolução, pois segundo essa teoria, todas as espécies que
mudam ao longo do tempo, dão origem a novas espécies e compartilham um ancestral comum.
Na tabela a seguir vemos o código genético, ou seja, a relação entre os códons (sequência de 3 bases nitrogenadas) e os aminoácidos
correspondentes.
Quadro contendo todo o código genético.
Ao observar a tabela, percebemos que um aminoácido pode ser representando por mais de um códon.
Dizemos que o código genético é degenerado/redundante. Isso é importante, pois modificações em uma das bases
nitrogenadas podem não alterar o tipo de aminoácido encontrado.
Por exemplo, a mudança da base uracila (GUU) para uma das outras três bases nitrogenadas (GUC, GUA ou GUG) não altera o aminoácido que será
integrado na sequência de peptídeos, que em todos os códons será a valina. No exemplo anterior, assim como em toda a tabela do código genético,
conseguimos perceber que as alterações nos códons para esse código genético ser degenerado se encontram na terceira base nitrogenada do
códon. Isso quer dizer que o código genético apresenta especificidade para a 1ª e 2ª bases e tolera oscilações na 3ª base no códon.
Por outro lado, observamos que cada códon não especifica mais de um aminoácido. Sendo assim, dizemos que o código genético não é ambíguo,
ou seja, o códon GUU vai sempre indicar a inclusão de uma valina na sequência de aminoácidos e CCU de uma prolina.
Saiba mais
Alguns códons são bem importantes na construção da cadeia peptídica. Entre eles, podemos destacar o start códon e o stop códon, que são
responsáveis por iniciar e parar a síntese da cadeia, respectivamente. O start códon é dado por AUG, e o stop códon pelas sequências UAA, UAG e
UGA.
Evolução genética
Algum HD seu já deu defeito? Já perdeu algum arquivo importante, como uma foto ou um texto em que você estava trabalhando, devido a um
problema de umidade ou pancada no computador? Ou simplesmente aconteceu uma falha no sistema? É normal. Os HDs irão dar defeito. Os
técnicos de informática dizem: “Você já perdeu seus arquivos, só não sabe quando.”
Com o DNA acontece algo relativamente semelhante: a informação armazenada pode sofrer diversos processos que alteram a informação contida,
e a essas alterações damos o nome de mutação.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 7/31
As mutações são alterações permanentes na sequência de bases nitrogenadas do material genético de um organismo, causadas por uma série de
fatores, como radiação, erros de replicação, envelhecimento, falhas na maquinaria de reparo do DNA, atuação de agentes mutagênicos etc., que
podem ocasionar diferentes alterações na estrutura do DNA. São elas:
Susbtituição de uma base por outra
Este processo pode ocorrer nas seguintes formas:
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 8/31
Pode acontecer de forma silenciosa, ou seja, sem perda de informação original.
Mutação de substituição silenciosa.
A mutação de substituição pode alterar a sequência de aminoácidos que será traduzida.
A substituição pode alterar o aminoácido.
A substituição de uma base nitrogenada leva à interrupção da tradução.
A mutação de substituição pode interromper a tradução.
A inserção de base nitrogenada desloca o restante da sequência para a direita, alterando a sequência de RNAm e os códons que serão
traduzidos.
Silenciosa 
Mutação de sentido trocado 
Mutação sem sentido 
Inserção 
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 9/31
A inserção de uma base nitrogenada altera os códons que serão traduzidos.
A deleção de base nitrogenada desloca o restante da sequência para a esquerda, alterando a sequência de RNAm e os códons que serão
traduzidos.
A deleção de uma base nitrogenada altera os códons que serão traduzidos.
O nosso organismo tem maneiras de reparar esse tipo de mutação, mas, quando não há o reparo, acontece o que chamamos de frameshift, que em
inglês significa “mudança de quadro”, ou seja, toda a forma com que os códons são lidos daquele trecho em diante ficará alterada, o que pode gerar
uma leitura completamente errada de toda a sequência após a mutação ou uma interrupção da leitura, caso apareça um stop códon.
Esquema ilustrando um exemplo de frameshift gerando alteração na proteína final.
As mutações podem ocasionar doenças genéticas. Artrite reumatoide, doença de Crohn, doença de Alzheimer e fibrose cística, por exemplo, são
causadas por mutações do tipo SNPs, do inglês Single Nucleotide Polymorphisms (polimorfismo de nucleotídeo único), em que a alteração de um
único nucleotídeo é capaz de desencadear uma doença.
Exemplo de alteração SNP no DNA.
Além das SNPs, há outras mutações que podem conferir alguma quebra na homeostasia do corpo.
Deleção 
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 10/31
O projeto Genoma Humano possibilitou o mapeamento genético humano e permitiu identificar nos genes quais são as regiões cruciais que
desencadeiam determinadas doenças, ou ainda prever possíveis outras apenas pelo sequenciamento genético. Fique tranquilo, iremos voltar ao
Projeto Genoma em um outro momento.
O caso mais famoso desse tipo de abordagem aconteceu com a atriz Angelina Jolie. Após um sequenciamento genético, foi detectada uma
mutação no gene BRCA1, um gene responsável pela produção de proteínas supressoras de tumores, ou seja, proteínas que reparam o DNA
danificado e, assim, desempenham um papel na garantia da estabilidade do material genético de cada célula.
Uma mutação ou alteração nesse gene leva à síntese de proteínas não funcionais, permitindo que danos no DNA da célula não sejam reparados e
aumentando a possibilidade de desenvolvimento de câncer de mama. Assim, quando a atriz descobriu a mutação, ela decidiu remover o tecido, o
que causou muita polêmica na época.
Mas nem sempre as mutações geram malefícios. As mutações foram cruciais no decorrer da história, considerando um longo prazo (milhões de
anos) para que a vida na Terra seja como ela é hoje. As mudanças que ocorreram no DNA dos seres vivos fizeram com que algumas proteínas se
comportassem de forma diferente, tanto para melhor, sendo mais eficientes, quanto para pior, causando problemas graves para o organismo.
Se pensarmos a curto prazo (alguns anos), seres que tiveram mutações que de alguma forma os faziam mal morreram e foram esquecidos, e tais
mutações não foram consolidadas.
No entanto, imagine diversas e diversas perpetuações de mutações benéficas ao longo de milhares de anos. Isso causaria uma diferenciação
significativa em determinadas populações, gerando uma evolução por seleção natural de toda uma espécie. Alguns organismos mutaram tanto a
ponto de iniciar novas espécies e, assim, por diante.
A filogenética é a ciência que estuda a história da evolução das espécies para mapear todas essas alterações
genéticas e avançarmos na montagem desse enorme quebra-cabeça evolutivo.
A imagem abaixo retrata um mapa filogenético. Verifique a nossa posição no mapa.
Árvore filogenética universal simplificada.
A popularização da informática no final da década de 90 possibilitou construirmos enormes bibliotecas gênicas, a ponto de ser possível concluiro
projeto Genoma Humano.
Durante essa pesquisa, após observada a função de vários genes, foi descoberto que nós, seres humanos, tínhamos genes muito semelhantes a
outras espécies (até mesmo bactérias).
enes
Segmento de DNA que possui informação para que ocorra a síntese de um RNA mensageiro.
Exemplo
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 11/31
Genes relacionados a vias metabólicas, estruturais, de regulação de ciclo celular etc.
O mapa filogenético nos indica que existem ancestrais comuns. Assim é possível pontuar a história evolutiva e estudar como se deu a evolução dos
genes. Dividimos as características do histórico evolutivo em genes homólogos e análogos.
Homologia é o compartilhamento de uma característica derivada de um mesmo ancestral, ou seja, que foi compartilhada durante a história
evolutiva. Órgãos homólogos são aqueles que apresentam características similares em diferentes espécies, por exemplo, a pata do cavalo, a
pata do leão, as nadadeiras das baleias e o braço do ser humano que são homólogos entre si.
Exemplo de órgãos homólogos.
Os genes homólogos, por sua vez, também indicam que determinado gene apresenta uma ancestralidade em comum. Porém, é importante relatar
que esses genes não são iguais.
Os genes homólogos podem ser genes ortólogos ou parálogos.
Genes ortólogos
São genes presentes em espécies diferentes que surgem de um ancestral comum por meio de especiação, ou seja, por meio do processo evolutivo
pelo qual novas espécies surgem. Nesse caso, a função tende a ser conservada e cada descendente tem uma cópia.
Genes parálogos
Estão presentes na mesma espécie em estudo por duplicação. Nesse caso, a função tende a mudar e estão presentes em mais de uma cópia.
Mas e os genes análogos?
Antes, precisamos entender que, nesse caso, a analogia traz a ideia de que tais genes têm características semelhantes, mas não pertencem a um
ancestral comum.
Os exemplos mais clássicos são asas de uma ave, de um morcego e de um inseto. Elas estão muito distantes na árvore evolutiva e mesmo assim
possuem a mesma função.
As asas de um morcego, de um inseto e de uma ave têm características análogas.
Mas você sabe o que é Homologia? 
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 12/31
Os genes análogos são sequências de nucleotídeos diferentes, mas que traduzem proteínas com a mesma função. Confuso? Calma, a seguir
vemos a imagem de uma árvore filogenética resumindo todos esses conceitos.
Genes homólogos e análogos entre o homem, o chimpanzé e a bactéria Escherichia coli.
Na imagem, note o gene das histonas presente no chimpanzé e nos homens e o gene da proteína HNS Escherichia coli. As histonas são proteínas
responsáveis pelo processo de compactação/descompactação do DNA, possibilitando assim a regulação gênica e a interação com RNA
polimerase. Há cinco tipos de histonas que diferem no peso molecular e na função. Na imagem ilustrada, demonstramos dois deles.
roteína HNS
É uma proteína semelhante à histona e representa um componente estrutural na bactéria que influencia muitos processos celulares, incluindo
recombinação, transcrição e transposição.
Expressão gênica
Todas as informações do nosso corpo ficam no DNA e todas as nossas células possuem o mesmo DNA, compactadas o máximo possível para
caber dentro do núcleo. As células do intestino e do cabelo possuem o mesmo DNA, mas como isso é possível, uma vez que elas são tão diferentes
em praticamente todos os aspectos?
Para responder a essa pergunta devemos olhar para o passado e entender como as primeiras bactérias foram evoluindo para melhor se adaptarem
ao meio em que viviam.
Como vimos, a evolução se dá por mutações perpetuadas ao longo de gerações. Vejamos a situação apresentada abaixo:
Atividade discursiva
Imagine duas bactérias de colônias diferentes, a bactéria X e Z, em um ambiente com pouca oferta de nutrientes. A bactéria X continua a todo vapor
sua produção de proteínas, com o metabolismo e o consumo de nutrientes funcionando normalmente. Já a bactéria Z, quando tem uma resposta de
escassez nutricional mediada por fatores intracelulares, começa a frear seu metabolismo e passa a usar outra fonte de nutrição.
Qual das duas bactérias você acredita que terá mais chances de sobreviver, a X ou a Z?
Digite sua resposta aqui
Exibir solução
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 13/31
Se você respondeu bactéria Z, você acertou! Ela consegue poupar mais energia e assim se adapta melhor ao meio. Isso acontece devido a
diferentes fatores intracelulares, como a regulação gênica.
Nas bactérias, a regulação via operon Lac acontece de forma muito parecida. Mas vamos entender melhor?
O operon Lac é um conjunto de genes relacionados ao metabolismo da lactose, um açúcar que pode ser usado para a nutrição de diversas
bactérias. Na falta de lactose, não há motivos para a bactéria gastar energia na produção de proteínas que quebram a lactose, então ocorre uma
inibição da região que promove a expressão dessas proteínas, alterando o metabolismo daquele indivíduo para algo que faça mais sentido para o
meio em que ele vive.
Esquema de regulação do operon Lac mediado por lactose.
O mecanismo no qual uma bactéria tem de controlar seu metabolismo chama-se regulação da expressão gênica. Em resumo, são uma série de
estímulos que determinam o padrão da expressão dos genes, esse padrão fará com que o produto final, ou seja o RNA e a síntese de proteínas
mude de acordo com o que está acontecendo naquele momento.
Existem ainda as proteínas reguladoras transcricionais, que podem de alguma forma ativar ou reprimir a transcrição, de acordo com a necessidade
do organismo.
Exemplo
A ausência de lactose pode ativar a proteína reguladora repressora e as sequências regulatórias, que são os trechos em que as proteínas
reguladoras se acoplam para exercer sua função.
Os organismos procariotos possuem o DNA disperso no citoplasma, já os eucariotos possuem o DNA envolto por uma membrana nuclear e
também mecanismos próprios de expressão gênica.
Existem inúmeros processos de controle de expressão, entretanto todos eles dependem do quão compactado está o DNA, uma vez que quando
compactado fica impossibilitado de transcrever, logo não há como aquele gene ser expresso. Já um DNA mais relaxado permite que as proteínas
responsáveis pela transcrição atuem e pode ser expresso.
Nos eucariotos damos o nome de heterocromatina à região onde o DNA está compactado e inacessível, e eucromatina quando ele está na forma
descompactada. Essa regulação é feita através das histonas, que como já sabemos controlam o grau de compactação do DNA. O mecanismo pelo
qual as histonas realizam a compactação/descompactação do DNA ocorre por um processo químico, quando estão acetiladas (na presença de um
grupamento acetil) ocorre um relaxamento do DNA e quando estão metiladas (na presença de um grupamento metil) ocorre a compactação do
DNA.
Heterocromatina (esquerda) e Eucromatina (direita).
Outra forma de controlar a expressão em eucariotos é controlar como o transcrito de RNA será submetido ao splicing alternativo.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 14/31
Mas o que é o splicing?
O DNA apresenta sequências codificadoras (éxons) intercaladas com sequências não codificadoras (íntrons), para esse trancrito ser funcional
devemos descartar os íntrons e ter um transcrito composto apenas por éxons. Para isso são realizados cortes em regiões específicas chamadas de
sítio de splicing. Para entender melhor, observe a imagem a seguir:
Esquema mostrando o splicing, processamento do DNA semelhante a um “corte” e “cola”.
No entanto, a ligação entre os éxons pode ser realizada de diferentes maneiras durante o processamento do RNA, a isso chamamosde splicing
alternativo. Pode haver mais de uma combinação desses diferentes trechos chamadas de isoformas do transcrito, gerando diferentes proteínas a
partir de um mesmo gene. O splicing, desse modo, permite uma diversificação da expressão gênica e assim uma enorme variabilidade celular.
Diferentes isoformas do RNAm.
Existem ainda diversas outras formas de controle de expressão, como os fatores transcricionais, que são moléculas ou proteínas que atuam
ativando ou inibindo a transcrição de determinados trechos, e a epigenética, que é uma ciência que tem como objetivo estudar como fatores
externos ao organismo influenciam na expressão dos genes, entre outros.
O mais importante é compreendermos que há diversos mecanismos que influenciam a expressão genética, para assim responder ao nosso
questionamento do começo do tópico:
“As células do seu intestino e do seu cabelo possuem o mesmo DNA, mas como isso é possível, uma vez que elas são
tão diferentes em praticamente todos os aspectos?”
Resposta
Apesar dessas células terem o mesmo DNA, seu padrão de expressão genético não é o mesmo. As regiões de hetero e de eucromatina são
arranjadas de formas distintas, ou seja, o padrão de splicing é diferente. Dessa forma, temos a síntese de diversas proteínas que são responsáveis
pela função específica de um órgão específico.
Proteínas
As proteínas são biomoléculas construídas a partir de ligações peptídicas formadas no ribossomo, com a sua sequência dada pela ordem dos
códons de RNAm, que foram transcritos do DNA. Além de serem responsáveis por manter o funcionamento celular, elas possuem funções diversas,
como:
Formar a estrutura celular (actina);
Catalisar reações químicas no metabolismo de nutrientes (desidrogenases);
Servir de transporte de pequenas moléculas (canais iônicos);
Movimentação celular (cinesina);
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 15/31
Sinalização (proteína G);
Defesa celular (anticorpos) etc.
As proteínas são classificadas quanto à sua estrutura em quatro diferentes níveis:
Esta estrutura constitui as ligações peptídicas entre os aminoácidos.
É a forma como a proteína se organiza — cujos três tipos gerais de estrutura são as α-hélices, as folhas-β e as regiões de loop que conectam
as duas anteriores.
Representada pelo conjunto das α-hélices, folhas-β e loops, que dá origem a uma estrutura maior e organizada, chamada de subunidade.
Estrutura primária 
Estrutura secundária 
Estrutura terciária 
Estrutura quaternária 
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 16/31
É o conjunto das estruturas terciárias, que se dá quando existe mais de uma subunidade proteica para formar a proteína final.
A forma como as proteínas se consolidam depende dos resíduos de aminoácidos que as compõem. Dentre os aminoácidos, há três classes: com
carga (positivo ou negativo), polares (sem carga) e apolares. Esses resíduos podem interagir entre si por ligações de hidrogênio, formando α-hélices
ou dobrando sua estrutura. Além disso, também pode acontecer o oposto: a repulsão entre resíduos gerar um afastamento de trechos da proteína.
Sendo assim, há diversas formas que uma proteína pode assumir.
No esquema a seguir podemos ver os diferentes tipos de aminoácidos e suas cargas.
Com carga na cadeia lateral.
Polares não carregados.
Apolares.
O conjunto total das interações entre os resíduos forma a conformação final da proteína (basicamente a forma tridimensional que ela assume) e é
fundamental para sua função. Por exemplo, algumas proteínas têm, na ligação das subunidades, um canal no centro. A partir desse canal,
moléculas podem ser transportadas, conforme observamos na imagem ao lado.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 17/31
Vista lateral e superior de um canal iônico.
Outras têm uma pequena cavidade, onde alguma molécula pode entrar e realizar uma reação química mediada por um cofator e ser liberada depois
para seguir a sua via metabólica.
Cavidade e sítio ativo de uma proteína.
Agora imagine que um resíduo fundamental, como uma lisina (LYS – com carga positiva), seja a peça-chave para interagir com a molécula da sua via
metabólica, uma molécula que tenha carga negativa. Assim percebemos que a lisina é um resíduo extremamente importante para o funcionamento
da proteína, pois é necessária para a interação da carga positiva do resíduo com a carga negativa da molécula.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 18/31
Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?
Questão 1
O mapa filogenético nos indica que há ancestrais comuns. Assim é possível pontuar a história evolutiva e estudar como se deu a evolução dos
genes. Um gene de uma bactéria A com sequência de nucleotídeos ACGTAGGTCGTTACCAGG codifica uma proteína Y capaz de realizar a
quebra de glicose. De forma semelhante, os pássaros apresentam a sequência de nucleotídeos GTACTAATCATGGGCAATTTC, que codifica uma
proteína Z que é capaz de quebrar glicose. Como você classifica esses dois genes?
Parabéns! A alternativa D está correta.
Os genes análogos são aqueles que apresentam uma sequência de nucleotídeos muito diferentes, como os encontrados em algumas bactérias
e nos pássaros, mas codificam proteínas semelhantes. Na questão, ambos os genes codificam proteínas que quebram glicose.
Questão 2
Vimos que os organismos procariotos realizam o controle da expressão por meio de operons. Um deles é o operon Lac, conhecido por operar o
metabolismo de lactose e presente em muitos organismos. Sobre esse mecanismo assinale a alternativa correta:
A Homólogos
B Ortólogos
C Parálogos
D Análogos
E Universais
A A presença da regulação gênica ajudou, ao longo do processo evolutivo, na mutação das espécies.
B
A presença da regulação gênica ajudou, ao longo do processo evolutivo, na preservação da vida por meio de um controle
refinado do metabolismo dos organismos.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 19/31
Parabéns! A alternativa B está correta.
O operon Lac é um dos operons que participa da regulação gênica dos organismos procariotos. Ele modula a expressão de enzimas
responsáveis pela metabolização de lactose e, com isso, pode aumentar ou diminuir a expressão, evitando gasto energético desnecessário, o
que foi crucial para a manutenção da vida desses organismos ao longo do tempo.
2 - Aplicações da bioinformática
Ao �nal deste módulo, você será capaz de reconhecer o histórico e algumas aplicações da bioinformática no mundo atual.
Histórico da bioinformática
Em todas as áreas do conhecimento existe certa interdisciplinaridade. Para saber como um objeto se move é necessário conhecer a física e a
matemática. Para entender um texto histórico, temos que saber a linguagem escrita, o contexto em que aquele texto foi escrito e a forma como a
sociedade era organizada. Há diferentes partes que, quando juntas, formam a chave para a compreensão de qualquer conhecimento.
Na bioinformática não é diferente, pois não se trata apenas da união da biologia (bio) com a informática, e sim de uma série de outros fatores que
serão citados ao longo do nosso estudo.
Podemos dizer que essa nova área do conhecimento surgiu a partir da necessidade de armazenar dados e realizar contas matemáticas por meio de
algoritmos que auxiliariam o dia a dia dos pesquisadores.
lgoritmos
C O operon Lac é responsável por controlar todo o metabolismo dos procariotos.
D O operon Lac é responsável por encontrar e corrigir mutações, fazendo a regulação gênica.
E O operon Lac também pode ser encontrado em eucariotos.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html#20/31
É uma “receita” para executar uma tarefa ou resolver algum problema. Pode ser, por exemplo, uma fórmula matemática.
Para conhecermos o histórico da bioinformática, precisamos conhecer o histórico da informática. Foi na década de 60 que surgiram os primeiros
computadores para uso comercial, como o IBM 7094, que ocupavam um espaço gigantesco e não eram nada simples de operar.
IBM 7094, um dos primeiros computadores criados para uso comercial.
Ainda assim a físico-química americana Margaret Dayhoff conseguiu criar o primeiro programa de bioinformática da história, o COMPROTEIN, com o
objetivo de determinar a estrutura proteica de uma série de sequências de peptídeos.
O uso de computadores para auxiliar na rotina de laboratório foi uma verdadeira revolução, pelo fato de eles serem mais ágeis e confiáveis que
anotações em cadernos. Entretanto, o maior problema era a dificuldade de operar os programas, pois todos os comandos eram dados por linhas de
código e — acredite — não era nada fácil executá-los.
Com o passar do tempo, os computadores foram ficando cada vez mais potentes, com maior capacidade de processamento e memória, facilitando
a construção de programas mais elaborados.
Exemplo de aplicação do algoritmo de Needleman-Wunsch.
Em 1970, Needleman e Wunsch criaram um algoritmo capaz de realizar o alinhamento entre duas sequências de proteínas. Nesse algoritmo, como
demostrado na figura ao lado, são comparadas duas sequências de nucleotídeos (GATTACA e GCATGCG). Para isso, as sequências são inseridas
nos eixos X e Y e o programa realiza uma comparação entre elas. A partir dessa comparação, se as letras combinam (match), é dado um valor, e se
elas não combinam (mismatch) ou se tem um espaço entre elas (gap), é dado outro valor. O computador, então, calcula o melhor caminho possível
e, a partir deste, as duas sequências são alinhadas.
Na década de 90, houve uma comoção de pesquisadores de 18 países, incluindo o Brasil, para desvendar por completo o DNA do ser humano: o
trabalho conhecido como projeto Genoma Humano.
O trabalho durou ao todo 13 anos para conseguir entregar, em sua conclusão, 99% do nosso código genético com 99,9% de precisão. Para isso, a
bioinformática mais uma vez foi essencial, pois, a partir de programas de computador específicos, os pequenos trechos sequenciados eram
adicionados a um grande banco de dados e encaixados no seu devido lugar. Dessa forma, foi criado um único arquivo editável que todos os
participantes do trabalho poderiam alterar conforme o progresso era feito, incluindo anotações, descrições e comparações. Imagine como seria
fazer toda essa organização sem o auxílio de programas, no bom e velho caderno. Seria muito mais difícil e inviável.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 21/31
Robert Waterston, do Centro de Sequenciamento do Genoma da Universidade de Washington, fala sobre publicações que descrevem as análises iniciais da sequência do genoma humano.
Os benefícios e aplicações desse estudo são muito relevantes até os dias de hoje, pois a partir dele foram desenvolvidos diversos softwares de
bancos de dados que foram preenchidos com genomas de diversas espécies. Além disso, representa um marco na tecnologia de sequenciamento
com o desenvolvimento de técnicas de montagens de sequências genômicas (reconstrução das sequências), elucidação de funções e mutações
genéticas etc. Todos esses avanços foram essenciais para o entendimento da genética atual. Abaixo, apresentamos uma linha do tempo com
importantes marcos do projeto Genoma Humano.
Esses e alguns outros eventos marcaram o início do uso da informática associada à Biologia. Entretanto, ainda era uma área muito restrita, pois
precisava que os programas fossem mais amigáveis. A tecnologia avançou junto com a necessidade e tornou os computadores menores e mais
baratos.
No início dos anos 2000, apesar de ainda um pouco caro, já era possível, com algum esforço, uma pessoa de classe média-baixa comprar seu
primeiro computador e usar as ferramentas do Windows ou a Internet em sua fase inicial. Utilizar um computador era relativamente simples:
bastava ler o que estava na tela e ir clicando conforme as opções e botões surgiam. Parece trivial, certo? Errado!
Um dos principais motivos de toda nossa história ter funcionado foi uma interface gráfica do usuário chamada de Graphical User Interface (GUI).
A GUI é a forma como nos conectamos com o computador, não mais por linhas de texto ou programação, mas hoje em dia a partir de botões e
animações. Assim, ficou muito mais fácil de usar o computador. E esse foi o grande ponto de virada da bioinformática.
Atualmente, usamos botões e atalhos onde antes eram usadas linhas de texto, tornando mais fácil o uso dos computadores.
Os laboratórios de Biologia, Química, Física e outras ciências, mesmo que com pouca verba, poderiam comprar seus computadores e, com a ajuda
de programadores e matemáticos, criar seus programas para usar diariamente.
A tecnologia não parou de avançar, e os computadores ganharam mais uma peça: a placa de vídeo Graphics Processing Unit (GPU). Ela era capaz de
realizar contas mais complexas envolvendo objetos animados. Isso tornou possível desenhar e visualizar proteínas em três dimensões, cadeias de
DNA, polímeros e, recentemente, até mesmo simular o comportamento de uma proteína em um ambiente bem próximo do real por um curto período
de tempo.
1990
O Projeto Genoma Humano
(HGP) é lançado nos Estados
Unidos.
1991
Estabelecidos os primeiros
centros de genoma dos EUA.
1992
Mapa genético humano de
segunda geração
desenvolvido.
1995
Objetivo de mapeamento
físico humano do HGP
alcançado.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 22/31
Conseguimos perceber que a bioinformática surgiu da união de áreas como programação, estatística, física, química e biologia, para desenvolver
programas computacionais que permitam reconhecer sequências de genes, prever a configuração tridimensional de proteínas, organizar e relacionar
informação biológica, agrupar proteínas homólogas, estabelecer árvores filogenéticas, analisar a expressão gênica de forma rápida etc.
Comentário
Um profissional que se interesse pela área, mesmo com os programas cada vez mais amigáveis, precisa ter noções de todos os pontos envolvidos,
o que torna o aprendizado um processo árduo, mas com certeza muito recompensador.
Bioinformática e suas aplicações no mundo atual
Atualmente, seria bastante difícil manter a nossa sociedade sem a ajuda de computadores. Sem eles, não teríamos mais internet, bancos on-line e
nem mesmo o programa que uso para construir este texto e o que vocês usam para ler este conteúdo. Na pesquisa científica e em praticamente
todas as áreas das ciências biológicas não é diferente. Além disso, com o desenvolvimento da bioinformática, os processos ficaram mais rápidos e
com menor custo.
O maior exemplo que pode ser dado é a vacina contra a covid-19. Claro, existem muitos fatores, mas tivemos uma vacina eficiente para essa nova
doença em menos de um ano e parte disso deve-se à bioinformática.
Ilustração 3D da proteína S.
A partir da bioinformática foi possível o mapeamento dos possíveis sítios para a criação das vacinas, a elucidação da proteína S do vírus (uma
proteína da espícula viral que possibilita a entrada e infecção das células humanas), entender o mecanismo de entrada e ação viral, compreender a
ligação com a célula humana e, assim, estudar melhor as maneiras de combate ao vírus.
A imagem ao lado ilustra a reconstrução do complexo que contém a proteína S a partir de um programa de modelagem molecular.
Atualmente, a bioinformática é composta por diferentes técnicas com diferentes aplicabilidades. A partir de agora vamos conhecê-las:
Alinhamento e modelagem molecular
Como já sabemos, o sequenciamento genético realizado no projeto Genoma Humano foium divisor de águas na forma como víamos as sequências
genéticas. Ele permitiu que pudéssemos ler (literalmente) os genes e entender as associações existentes entre diferentes espécies, já que uma
grande parte dos genes foi sequenciada e está disponível em bancos de dados digitais que possuem inclusive os genes de diversas espécies de
animais. Usamos esses bancos de dados para obter os códigos dos resíduos de aminoácidos de proteínas de diferentes espécies e, a partir deles,
fazer a técnica de alinhamento.
O alinhamento possui grande importância nos estudos de filogenética, possibilitando o reconhecimento de ancestrais comuns, baseado em trechos
de DNA conservados entre diferentes espécies, definidas assim como sequências homólogas. Em alguns casos, o alinhamento também será capaz
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 23/31
de prever características estruturais e funcionais das proteínas a partir dos genes de origem, baseado na atuação desse no trecho homólogo.
O alinhamento pode ser realizado entre duas ou mais sequências e obedece a um algoritmo, como o algoritmo de Needleman & Wunsch, do qual já
falamos.
Mas como este processo funciona?
Vamos imaginar que queremos verificar o alinhamento entre as sequências de aminoácidos de uma proteína P2X7 entre o urso panda e o homem.
Para isso, o algoritmo calcula e verifica o melhor alinhamento possível. Na imagem a seguir, observe os trechos em vermelho, que são os trechos
alinhados dos códigos de resíduos de aminoácidos que geram a proteína P2X7 no ser humano e no urso panda.
Exemplo prático de alinhamento entre duas sequências da proteína P2X7.
E como o alinhamento pode ser utilizado?
Resposta
O alinhamento pode resolver problemas recorrentes, por exemplo, quando um trecho do genoma de determinado organismo é sequenciado, sendo
preciso saber qual proteína é codificada nesse trecho.
Para isso, podemos então realizar uma busca em um banco de dados (NCBI/BLAST), que faz uma série de cruzamentos de informações para ver
qual seria o gene que melhor se alinha com esse trecho, e a partir daí é gerado uma pontuação e uma identidade (que é a porcentagem de pares
perfeitos entre as duas sequências), caso a pontuação seja alta pode ser atribuído uma função semelhante ao meu gene de estudo.
Há diferentes formas de exibição dentro dos programas de visualização de estruturas proteicas para facilitar a visualização das proteínas. O que
contribui para que, mesmo para uma pessoa leiga, compreenda como a função da proteína pode ser relacionada à sua estrutura. Vejamos alguns
exemplos de formas de exibição de estruturas proteicas:
Com o alinhamento realizado e uma identidade acima de 25%, podemos realizar uma técnica chamada de modelagem por homologia e gerar um
modelo tridimensional da sequência proteica alvo. A partir de uma sequência alvo, identificamos em um banco de dados uma sequência molde com
Cartoon Palitos Bolas e palitos Esferas
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 24/31
estrutura resolvida e, em seguida, é feito o alinhamento e a modelagem, gerando um modelo final, ou seja, um modelo tridimensional de uma
proteína com estrutura não conhecida.
Modelagem proteica por homologia.
A modelagem molecular de proteínas pode também ser feita por métodos não comparativos, chamados de ab initio e threading.
Método ab initio
Nesse método, a construção é feita somente a partir de cálculos matemáticos em que a sequência de aminoácidos é levada em consideração para
tentar prever a estrutura secundária das proteínas.
Método por threading
É baseado na estrutura secundária de modelos com identidade baixa ou por inteligência artificial, que analisa bancos de dados e cruza informações
para tentar obter um modelo confiável.
Ancoramento Molecular
O ancoramento molecular é também chamando de docagem molecular ou molecular docking. A técnica consiste em utilizar um modelo
tridimensional (no nosso caso uma proteína), definir uma área de busca — que seria, basicamente, informar ao programa a área da proteína em que
se deseja ancorar uma molécula — e depois testar a possibilidade de ligação da molécula na região da proteína delimitada. O ligante irá se encaixar
no local mais energeticamente favorável, e essa interação vai gerar uma pontuação. O programa constrói diferentes conformações da ligação
ligante-proteína e cada uma delas recebe o nome de pose. A melhor pose é aquela que obtém a maior pontuação dada pelo algoritmo do programa
de ancoramento.
Esquema do ancoramento de uma pequena molécula ligante (verde) a uma proteína alvo (preta) formando um complexo proteína-ligante.
O ancoramento molecular pode ser utilizado para determinar qual ligante irá interagir melhor com uma proteína, definir a pose de interação,
encontrar sítios ativos e ajudar a determinar se mutações de resíduos de aminoácidos serão relevantes para essa interação.
Podemos citar, por exemplo, a variante B.117 do SARS-CoV-2, um vírus mais infeccioso por causa de uma mutação N501Y na proteína S (Spike-
ACE2). Sendo assim, na posição 501 da proteína em questão, um resíduo asparagina mutou para dar lugar a um resíduo tirosina. Essa mutação
resultou em um maior número de interações com o sítio ativo, tornando a ligação do vírus com o seu receptor mais forte. Logo, uma menor carga
viral se tornou suficiente para causar a doença.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 25/31
Ancoramento molecular com a proteína S da covid-19 (N501, SARS-CoV-2).
Ancoramento molecular com a proteína S da variante B.117 (Y501, SARS-CoV-2).
Comentário
Realizar essa ligação em um ambiente virtual simulando a energia de interação é muito importante. Mas nas poses, como são imagens estáticas,
não existem a influência do tempo e outros fatores na interação entre as proteínas.
Dinâmica molecular
A dinâmica molecular tem como objetivo analisar interações e movimentações em diversos sistemas não apenas por um único instante, mas ao
longo de uma trajetória em determinado espaço-tempo. A sua aplicabilidade no dia a dia é muito ampla, podendo ser usada para entender
mecanismos de ação de proteínas, interações entre fármaco-receptor, como determinados materiais se comportam sob stress etc. As aplicações da
dinâmica molecular vão além da biologia. Ela é usada em física, química, engenharia e até mesmo na geologia.
Mas como funciona a dinâmica molecular?
No ancoramento molecular, existe uma pose com a maior pontuação de uma possível interação do ligante com o seu receptor, seguindo o clássico
modelo chave-fechadura (o ligante é a chave que encontra a proteína, fechadura), mas sabemos que no mundo real as coisas não funcionam assim
de forma tão rígida.
Pensando em solucionar esse problema, foi criada uma técnica chamada de dinâmica molecular, que substituía esse modelo chave-fechadura por
um outro chamado de modelo de ajuste induzido, não mais utilizando uma pose apenas, e sim uma trajetória, uma simulação de um ambiente real.
Sistema usado na dinâmica molecular: uma caixa de água contendo a proteína, o ligante e o cofator.
Na dinâmica molecular, cada átomo, seja da proteína, do ligante ou da água, é levado em consideração para calcular a movimentação de todo o
sistema por alguns nano ou milissegundos e entender as movimentações existentes. A simulação de dinâmica molecular é feita a partir de uma
pose vinda do ancoramento molecular. Essa pose (contendo o nosso sistema, proteína e ligantes) é inserida em uma caixa contendo moléculas de
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 26/31
água, tendo como objetivo mimetizar um ambiente biológico real. Então, uma série de cálculos complexos baseados em um conjunto de parâmetros
chamado de campo de forças é aplicado.
O campo de forçapossui as informações necessárias para que o computador determine e simule como as interações acontecem, os tipos de
ligações possíveis e o que é necessário para que aqueles átomos interajam entre si. Apesar de já existirem programas de computador que realizam
esses cálculos, ainda são necessários outros mais avançados que consigam fazer dinâmicas cada vez mais complexas e mais longas.
Atualmente, há um enorme esforço global para ajudar a comunidade científica nesse sentido. Em 2017, a revista Nature publicou o artigo Physical
properties of the HIV-1 capsid from all-atom molecular dynamics simulations, de Perilla & Schulten, no qual é relatado que um supercomputador
conseguiu fazer uma simulação de todos os átomos presentes no capsídeo do vírus HIV-1 por 400 nanossegundos. Foram observados cerca de 4
milhões de átomos!
Imagem do capsídeo viral.
Os supercomputadores do mundo inteiro, hoje em dia, estão realizando simulações com o SARS-CoV-2. Com o avanço da tecnologia serão possíveis
feitos cada vez maiores. Quem sabe um dia até mesmo seja possível simularmos células completas. Além das simulações levando em
consideração os átomos, há também as simulações que consideram os elétrons. São os chamados métodos quânticos. Esses exigem, porém, um
custo computacional ainda maior, e são usados apenas para moléculas pequenas ou no sítio de interação.
Saiba mais
Custo computacional seria uma quantidade de cálculos em determinado tempo. Um alto custo computacional traduz-se em muitos cálculos ou em
um longo tempo para realizar determinada tarefa.
Agora imagine que você queira descobrir novos alvos terapêuticos partindo de um ligante conhecido, como no desenvolvimento de um
medicamento que se liga à proteína S do vírus da covid-19 e assim impede sua entrada na célula humana. Para isso, você deverá realizar uma
sequência de técnicas dentro da bioinformática. São elas: alinhamento, modelagem molecular, ancoramento e, por último, a dinâmica molecular.
Modelagem molecular de proteínas
Está na hora de falarmos sobre a importância da bioinformática para a construção de estruturas de proteínas e, ainda, simular a construção de uma
proteína. Vamos lá!
Relação estrutura-atividade
A estatística é uma ciência que pode ser aplicada diretamente nos estudos biológicos, sendo crucial para a bioinformática.

11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 27/31
A quantificação da relação estrutura-atividade pode ser feita por meio de uma técnica chamada QSAR (Quantitative Structure-Activity Relationship)
ou relação quantitativa de estrutura-atividade. O QSAR possibilita, a partir de dados obtidos por dinâmica molecular, no ancoramento molecular ou
em ensaios biológicos, alcançarmos um conjunto de dados, chamado de grupo treinamento. Após isso, extraímos uma equação matemática, por
meio de algum algoritmo estatístico.
Em seguida, podemos testar essa equação contra o nosso grupo teste, com os valores também conhecidos, para determinar se ela funciona. Com a
confirmação da equação, podemos construir novas moléculas com maior potencial para agir em determinado alvo ou para tentar prever a atividade
de compostos já existentes, seguindo um modelo estatístico.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 28/31
Falta pouco para atingir seus objetivos.
Vamos praticar alguns conceitos?
Questão 1
O projeto Genoma Humano foi uma verdadeira revolução na biologia molecular e na bioinformática. Foram necessários 13 anos de trabalho
para ser concluído e os resultados foram bem promissores. Levando em consideração os avanços realizados, podemos concluir que
Parabéns! A alternativa B está correta.
O projeto Genoma Humano possibilitou que 99% do nosso código genético fosse sequenciado com precisão de 99,9%, sendo um marco na
história, uma vez que permitiu diferentes avanços tecnológicos, como a criação de bancos de dados internacionais e de diversas novas
técnicas de bioinformática que compõem a base de muitos estudos recentes e que são fundamentais para o entendimento da genética atual.
Questão 2
Novos alvos terapêuticos podem ser encontrados com o auxílio de técnicas de bioinformática. Partindo de um ligante conhecido, qual seria a
ordem lógica que um pesquisador poderia adotar para identificar um novo alvo?
A
o projeto Genoma Humano foi capaz de reunir a comunidade científica com apenas um objetivo em comum: sequenciar o DNA
humano.
B foi um verdadeiro marco na história, e os avanços foram cruciais para o entendimento atual sobre genética.
C foi muito importante para estabelecer o conceito do dogma central da biologia.
D o projeto Genoma Humano foi capaz de sequenciar 90% do DNA humano com 100% de precisão.
E
tivemos 100% dos nossos genes definidos e suas funções completamente definidas com a finalização do projeto Genoma
Humano.
A Modelagem molecular, alinhamento, dinâmica molecular, ancoramento.
B Alinhamento, modelagem molecular, ancoramento, dinâmica molecular.
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 29/31
Parabéns! A alternativa B está correta.
A ordem lógica ideal para o desenvolvimento de novos fármacos seria: alinhamento, para identificarmos se o alvo possui proteína molde;
modelagem molecular, para construir um modelo tridimensional; ancoramento, para obter uma pose do ligante com o alvo; e dinâmica
molecular, para analisar como as interações acontecem.
Considerações �nais
Durante o desenvolvimento da biologia molecular houve uma verdadeira revolução tecnológica na área da informática. O alinhamento dessas duas
ciências possibilitou o surgimento de uma nova ciência, a Bioinformática, e com ela diversas técnicas que hoje são cruciais para o avanço da
pesquisa científica biomédica e do desenvolvimento de produtos para a área da saúde.
Assim, ao longo deste conteúdo, visitamos os principais conceitos da biologia molecular para a compreensão da bioinformática, como o dogma
central da Biologia e como ele se desenrola; a importância do DNA e dos genes e suas mutações; e como as proteínas funcionam. Além disso,
conhecemos a história da bioinformática e algumas de suas principais técnicas e aplicações práticas.
A informática modificou completamente a forma como enxergamos o mundo, tornando a tecnologia mais barata e acelerando o desenvolvimento
científico. O aumento constante do poder computacional com os computadores quânticos, por exemplo, pode levar a bioinformática a patamares
ainda mais elevados. A Bioinformática talvez seja uma das ciências mais promissoras do século XXI. Estamos vivenciando apenas o começo dessa
mudança de paradigmas.
Podcast
Quais serão os avanços e vantagens da bioinformática? Ouça a seguir sobre o que esperar dessa área nos próximos anos.
C Dinâmica molecular, modelagem molecular, alinhamento, ancoramento.
D Ancoramento, dinâmica molecular, alinhamento, modelagem molecular.
E Modelagem molecular, alinhamento, ancoramento, dinâmica molecular.

11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 30/31
Referências
ALEXANDRE, F. C. Introdução à modelagem molecular. Consultado na Internet em: 27 out. 2021.
COELHO, L. W. et al. Aplicação de mecânica molecular em química inorgânica. Química nova, v. 22, n. 3, p. 396-404, 1999.
DE VIVO, M. et al. Role of molecular dynamics and related methods in drug discovery. Journal of Medicinal Chemistry, v. 59, n. 9, p. 4035-4061, 2016.
GAUTHIER, J. et al. A brief history of bioinformatics. Consultado na internet em: 27 out. 2021.
GREEN, E. D.; WATSON, J. D.; COLLINS, F. S. Human genome project: twenty-five years of big biology. Nature News, v. 526, n. 7571, p. 29, 2015.
HUANG, L.; ROUX, B. Automated force field parameterization for nonpolarizable and polarizable atomic models based on ab initio target data.
Journal ofChemical Theory and Computation, v. 9, n. 8, p. 3543-3556, 2013.
HUANG, S.; ZOU, X. Advances and challenges in protein-ligand docking. International Journal of Molecular Sciences, v. 11, n. 8, p. 3016-3034, 2010.
KARR J. R.; SANGHVI J. C.; MACKLIN D. N., et al. A whole-cell computational model predicts phenotype from genotype. National Library of Medicine,
150:389–401, 2012.
MANDAL, S.; MOUDGIL, M.; MANDAL, S. K. Rational drug design. European Journal of Pharmacology, v. 625, n. 1-3, p. 90-100, 2009.
MORGON, N. H.; COUTINHO, K. Métodos de química teórica e modelagem molecular. São Paulo: Editora Livraria da Física, 2007.
PAGADALA, N. S.; SYED, K.; TUSZYNSKI, J. Software for molecular docking: a review. Biophysical Reviews, v. 9, n. 2, p. 91-102, 2017.
SLIWOSKI, G. et al. Computational methods in drug discovery. Pharmacological reviews, v. 66, n. 1, p. 334-395, 2014.
VERLI, H. et al. Bioinformática da biologia à flexibilidade molecular. São Paulo: SBBq, 2014.
Explore +
11/03/2023, 12:56 Introdução à Bioinformática
https://stecine.azureedge.net/repositorio/00212sa/03017/index.html# 31/31
Para aprofundar seus conhecimentos sobre o conteúdo abordado, pesquise:
O artigo A era da bioinformática: seu potencial e suas aplicações para ciências da saúde, de Araújo e colaboradores.
O artigo Ferramentas de bioinformática na caracterização de alvos de medicamentos, do VI Curso de Inverno em Biologia Celular e Molecular do
programa de pós-graduação em ciências biológicas da Universidade Estadual de Maringá, de Pimentel e colaboradores.
Leia também:
Transcrição e Processamento de DNA, no material da USP, Biologia molecular: Texto 4, disponível na Internet.
Síntese de Proteínas, no material da USP, Biologia molecular: Texto 7, disponível na Internet.
A Transcriptase Reversa como Alvo Terapêutico em Doenças Retrovirais, disponível na Biblioteca Digital da Universidade Federal do Paraná.
COVID-19: Fisiopatologia e Alvos para Intervenção Terapêutica, disponível na Revista Virtual de Química, da Sociedade Brasileira de Química.
Assista ao vídeo Do DNA à Proteína, disponível no canal Inteligentista, no YouTube.

Continue navegando