Prévia do material em texto
BIOTECNOLOGIA E BIOINFORMÁTICA AULA 1 Prof. Benisio Ferreira da Silva Filho CONVERSA INICIAL Desde o famoso experimento de Gregor Mendel e suas ervilhas que a Biologia não é mais a mesma. A cada novo avanço e a cada nova descoberta mais informações sobre genes, genética e estrutura molecular da célula estão disponíveis. Ao longo das aulas da disciplina iremos abordar diversas técnicas moleculares de uso rotineiro para biomédicos. Inicialmente, iremos abordar técnicas de extração, quantificação e análise do material genético e posteriormente técnicas de purificação e análise de proteínas. Sabemos que todas as células, eucarióticas e procarióticas, animais e vegetais, possuem a mesma composição bioquímica: lipídeos, proteínas, carboidratos e ácidos nucléicos. Baseados nesta informação, de uma composição universal similar entre os mais diversos tipos celulares, é que as técnicas de biologia molecular ganham destaque, pois podem ser aplicadas aos mais diversos tipos de seres vivos existentes. Apesar de ser uma área recente, a Biologia Molecular é cada vez mais estudada e seus avanços são notórios nos últimos anos: descobriu-se desde a estrutura molecular do DNA, até como sequenciá-lo e curar doenças por meio das terapias gênicas. TEMA 1 – IMPORTÂNCIA DA BIOLOGIA MOLECULAR NA BIOTECNOLOGIA A Biologia Molecular é a ciência que estuda os ácidos nucléicos e seus produtos. Os dois ácidos nucléicos presentes em uma célula são DNA e RNA e suas estruturas e funções já foram muito bem descritas em outras disciplinas deste curso. Por meio dos processos de transcrição e tradução, o DNA comanda a formação de proteínas, num processo denominado expressão gênica. Desta forma, o foco principal da Biologia Molecular é o estudo do DNA, RNA e das proteínas. A Biotecnologia é o conjunto de técnicas e análises, construído ao longo das últimas décadas que nos permite analisar e modificar ácidos nucleicos e proteínas e nos propiciou avanços tecnológicos importantes em diferentes áreas. Segundo a ONU, “biotecnologia é qualquer aplicação tecnológica que utilize sistemas biológicos, organismos vivos ou seus derivados, para fabricar ou modificar produtos ou processos para a utilização específica. Ou seja, a biotecnologia é a ciência a partir da qual utilizam-se organismos vivos e a manipulação de suas macromoléculas (DNA, RNA e proteínas) para a produção de produtos que melhorem a forma como vivemos e compreendemos o mundo. No ano de 1866, Gregor Mendel publica seus postulados sobre hereditariedade. Ele não possuía o conhecimento necessário sobre estrutura da célula e genes, chamando naquele momento os genes de fatores relacionados à hereditariedade. Somente em 1869, Friedrich Miescher descobre a existência dos ácidos nucleicos e a expressão Biologia Molecular só foi criada em 1939 por Warren Weaver, com o intuito de designar o trabalho em conjunto da biologia, física e química na busca pelo conhecimento das moléculas. Com os avanços das técnicas bioquímicas e da microscopia, em 1944 Oswald Avery comprovou que as informações hereditárias estavam armazenadas no DNA. Mas afinal, nesta época, o que se considerava DNA? Foi apenas em 1953 que James Watson e Francis Crick demonstraram o que era uma molécula de DNA, qual era sua estrutura química e como a informação hereditária estava armazenada nesta molécula. Em 1966 Marchal Niremberg e Har Khorana decifram o código genético humano e 6 anos mais tarde, em 1972, Stanley Cohen e Herbert Boyer desenvolvem a tecnologia do DNA recombinante. Ainda na década de 70, Frederich Sanger desenvolveu o primeiro método de sequenciamento de DNA (1977) e no início da década de 80 os primeiros exemplares de clonagem foram criados por Richard Palmiter e Ralph Brinster. Em 1983, Kary Mullis cria a técnica de reação em cadeia da polimerase (PCR - Polymerase Chain Reaction) e em 1985 são desenvolvidas as primeiras técnicas de impressão digital por DNA (DNA fingerprint). O grande marco das ciências moleculares se deu em 1996 com a clonagem da ovelha Dolly por Ian Wilmut e sua equipe. Na mesma época se iniciava o projeto genoma humano que foi completado em 2001 com cerca de 99% do genoma humano sequenciado. Desde o início dos anos 2000 os avanços nas áreas de Biologia molecular têm sido cada vez mais pronunciados com diversas aplicações práticas. Dentre as aplicações práticas mais famosas estão a criação de organismos transgênicos, que ainda hoje suscitam discussões e polêmicas em meio a comunidade científica. Mas a biotecnologia não para por aí. Ela evoluiu com o desenvolvimento de testes moleculares para a detecção de diversos tipos de doenças como tuberculose, HIV e câncer; para a elucidação de crimes com a genética forense; para o tratamento e cura de doenças hereditárias por meio da terapia gênica; para a identificação de mutações causadoras de doenças; testes de paternidade e uma infinidade de outras aplicações demonstrando que a biologia molecular e suas aplicações biotecnológicas estão na vanguarda dos estudos científicos de ponta. TEMA 2 –EXTRAÇÃO DE MATERIAL GENÉTICO Todos os organismos vivos são compostos por células e estas possuem em seu interior o material genético. No caso dos procariotos o DNA está disperso no citoplasma, já nos eucariotos este DNA encontra-se compartimentalizado no núcleo. Independentemente de sua localização, para que se possa estudar o DNA é necessário de alguma forma extraí-lo, ou seja, retirá-lo de dentro da célula. A retirada do DNA de uma célula é denominada extração e compreende diversas etapas que serão descritas a seguir. Existem inúmeros protocolos na literatura e a escolha do mais adequado deve levar em conta qual material genético se deseja extrair (se DNA ou RNA), o tipo de amostra, o grau de pureza necessário ao ensaio e os recursos disponíveis em cada laboratório. 2.1 PREPARO DAS AMOSTRAS Diferentes tipos de amostras podem ter seu DNA/RNA extraídos, incluindo células sanguíneas, tecidos para biópsia, células de cultivo, bactérias, fungos e plantas. Independente da origem, o material deve ser preservado adequadamente até que a etapa de extração ocorra. Esta preservação pode ser feita por meio do congelamento em ultrafreezer (-80o.C), ou em nitrogênio líquido, ou ainda por meio de kits comerciais que estabilizam estas amostras. Amostras líquidas como sangue ou urina devem passar por uma etapa de centrifugação a fim de separar o pellet celular do sobrenadante. Nestes casos o pellet, que é mais denso, se deposita no fundo do tubo de ensaio, enquanto que o sobrenadante líquido pode ser descartado. Já para tecidos sólidos como por exemplo tecido hepático para um biópsia, é necessário um protocolo de dissociação do tecido visando aumentar a superfície de reação para os reagentes da etapa de lise celular. Esta dissociação pode ser feita picando-se o tecido em pequenos fragmentos com a ajuda de uma tesoura ou macerando-o com o auxílio de um pistilo. 2.2 LISE CELULAR Após obtidas e armazenadas adequadamente, as amostras precisam ter suas células lisadas, ou seja, rompidas. Tal lise é necessária pois libera os componentes citoplasmáticos, dentre eles os ácidos nucléicos. A lise deve ocorrer em soluções tamponadas contendo um detergente e os reagentes tris-hidroximetil aminometano (Tris), cloreto de sódio (NaCl) e ácido etileno diamino tetra- acético (EDTA). O detergente tem função primordial neste procedimento visto que atua solubilizando os lipídeos de membrana, facilitando a liberação do conteúdo celular. O Tris é uma solução tamponante que visa manter o pH em torno de 8, evitando desta forma que o DNA sofra a ação de enzimas DNAses que o degradam. O EDTA é uma agente quelante de íons divalentes Cálcio e Magnésio, que também atua inibindo a ação das DNAses. O NaCl promove desnaturação de proteínas, ruptura de ligações iônicas e aglomeração de moléculas de ácidos nucléicos. Alguns protocolos adicionam a enzima proteinase K ao tampão de lise com o objetivo demelhorar a digestão da célula e solubilizar mais facilmente o conteúdo intracelular. O beta-mercapto etanol em geral é adicionado ao tampão de lise para evitar a oxidação de ácidos nucleicos. 2.3 SEPARAÇÃO DOS CONSTITUINTES CELULARES Após a lise temos uma solução que é uma sopa de constituintes e restos celulares, sendo necessário separar os ácidos nucleicos de nosso interesse. Na etapa de separação dos constituintes celulares é adicionado um solvente como fenol e clorofórmio que desnatura e precipita proteínas; desta forma o DNA permanece solúvel no sobrenadante. A solução então é centrifugada formando um pellet contendo proteínas, que será descartado, e um sobrenadante com ácidos nucleicos. Este sobrenadante é coletado e separado para um novo tubo. Quanto mais vezes esta etapa de separação dos constituintes celulares for repetida, maior será a pureza da amostra. 2.4 PRECIPITAÇÃO DO DNA O NaCl presente no tampão de lise associado a baixas temperaturas e a adição de solventes orgânicos como etanol, isopropanol ou acetato de amônio promove a precipitação do DNA. Este DNA precipitado forma um conglomerado esbranquiçado com aspecto de um algodão em solução. Este “algodão” pode ser pescado com o auxílio de um bastão de vidro ou a amostra pode ser centrifugada. Nesta etapa de centrifugação o DNA formará um pellet no fundo do tubo e o sobrenadante será descartado (diferente do que ocorreu na etapa de lise, na qual o pellet foi descartado e o sobrenadante utilizado). 2.5 LAVAGEM E RESSUSPENSÃO DO DNA Para garantir maior pureza e eliminar resíduos de outros reagentes, as amostras provenientes da etapa anterior devem ser lavadas com etanol 70%. O etanol é eliminado das amostras por simples evaporação, dada sua elevada volatilidade. Após a evaporação, o pellet de DNA é ressuspenso em tampão Tris-EDTA ou água ultrapura. A água ultrapura é diferente de água destilada. A água destilada passa por um processo de destilação simples que remove os sais presentes nela. A água ultrapura, também chamada de água Mili-Q é uma água livre de qualquer sal, contaminantes e enzimas, ou seja, é apenas água sem nenhuma outra substância. TEMA 3 – MÉTODOS DE QUANTIFICAÇÃO DO MATERIAL GENÉTICO EXTRAÍDO Após sua extração é necessário ter certeza de que o que foi extraído era realmente DNA. Além disso, é necessário também saber a quantidade de DNA presente na amostra. Para avaliar a presença e quantificar o DNA são utilizadas diversas técnicas que serão descritas a seguir. 3.1 ESPECTROFOTOMETRIA A técnica de espectrofotometria se baseia no uso de um aparelho chamado espectrofotômetro, que incide uma radiação de determinado comprimento de onda sobre a amostra e mensura quanto desta radiação foi absorvida pela mesma. Por isso a unidade de medida lida pelo equipamento denomina-se absorbância, referindo-se à quantidade de luz absorvida pela amostra quando excitada por determinado comprimento de onda. Esta técnica relaciona a quantidade de luz absorvida por uma amostra a 260nm (comprimento de onda) com a quantidade de DNA presente nesta amostra. Quanto maior a absorção de luz, maior a quantidade de DNA na amostra. Esta técnica possui uma curva padrão que determina que uma absorbância igual a 1 corresponde a uma concentração de 50 µg de DNA por ml de solução. Desta forma, fazendo o uso de uma simples regra de três, é possível determinar a quantidade de DNA em uma amostra. Se houve necessidade de diluição da amostra, esta deve ser levada em conta na hora do cálculo da contração de DNA, segundo a fórmula abaixo: Concentração DNA = Absorbância(260 nm) x Diluição x 50. Além de quantificar, a espectrofotometria também permite avaliar a qualidade das amostras de DNA. Para isto deve-se medir a absorbância em 260 e 280 nm e fazer uma relação entre estes valores, ou seja, dividir o valor da absorbância em 260 nm pelo valor da absorbância em 280 nm; valores entre 1,4 e 2 indicam boa pureza das amostras e valores abaixo de 1,4 indicam presença de contaminante na amostra. A absorbância a 260 nm reflete a luz absorvida pelas ligações entre as bases nitrogenadas do DNA; já a leitura a 280 nm reflete a absorbância a 280 nm, comprimento de onda no qual as ligações peptídicas das proteínas fluorescem. Esta relação só é verdadeira se todo o fenol for removido da amostra, pois o mesmo fluoresce a 270 nm podendo gerar leituras incorretas. Embora a espectrofotometria seja a técnica mais utilizada rotineiramente ela possui um limiar de detecção alto, não sendo indicada quando a quantidade de DNA na amostra é da ordem de nanogramas. Nestes casos deve-se utilizar a fluorimetria, um método bastante similar mas que baseia sua leitura em fluorescência e é capaz de detectar DNA na ordem de nanogramas. 3.2 ELETROFORESE EM GEL DE AGAROSE A eletroforese é a principal técnica utilizada em biologia molecular para a análise de DNA. Ela permite separar, identificar e purificar os fragmentos de DNA quando não é possível utilizar outras técnicas, como os gradientes de centrifugação. É uma técnica rápida, que permite excelente resolução dos fragmentos de DNA. O gel é formado por agarose, um polissacarídeo que ao sofrer solidificação forma uma malha que retém as moléculas durante a migração. Dependendo da concentração de agarose, há diferenças no gradiente de separação. Quanto maior a concentração, mais fechados são os poros da malha do gel e maior retenção de fragmentos de DNA. Para se analisar amostras com fragmentos maiores deve-se dar preferência para géis de malha menos densa (ou seja, mais frouxa, com menor concentração de agarose), pois assim os fragmentos grandes terão facilidade em “correr” a malha do gel. O inverso também é verdadeiro, para fragmentos menores deve-se dar preferência para géis com poros menores, ou seja, maior concentração de agarose, pois desta forma os pequenos fragmentos ficarão retidos no gel. Esta técnica permite a separação de fragmentos de DNA de tamanho diversos por meio da aplicação de um campo elétrico. Os grupos fosfatos dos ácidos nucléicos possuem cargas negativas e, portanto, quando submetidos a um campo elétrico, por diferença de potencial, migram em direção ao polo positivo deste campo. Quanto menor o tamanho do fragmento de DNA, mais rápido ele migra pela malha de agarose e portanto maior será a distância percorrida no gel. Moléculas com maior número de pares de base possuem tamanho maior e portanto migram mais lentamente pela malha do gel, ocupando posições mais superiores no gel. Fragmentos de mesmo tamanho ocupam a mesma posição no gel, formando as denominadas bandas. Figura 1 – Na imagem acima, um aparelho de eletroforese com o polo positivo indicado em vermelho e o negativo em preto. As amostras são adicionadas nos poços do gel e irão migrar ao longo do gel do polo negativo para o polo positivo. A foto do gel (última imagem à direita) demonstrando bandas superiores (de maior peso molecular) e bandas inferiores (de menor peso molecular) Crédito: Soleil Nordic/Shutterstock. Figura 2 – Gel de agarose corado com brometo de etídio. Cada coluna corresponde a uma canaleta do gel na qual foi colocada uma amostra específica de DNA. Acima do gel estão os fragmentos maiores e abaixo os menores Crédito: Martinek Jan/Shutterstock. Para que se possa visualizar o resultado da separação das amostras de DNA em gel de agarose é necessário que este passe por um procedimento de coloração. Este processo consiste em corar o DNA com corantes fluorescentes como o brometo de etídio (altamente tóxico e carcinogênico). Este corante, sob luz ultravioleta, emite uma luz alaranjada formando bandas visíveis no gel. Outros corantes menos tóxicos como o GelGreen e SybrGreen vem suplantando o brometo de etídio. Nas extrações podem-se obter grandes moléculas, que incluem cromossomos inteiros ou cromossomos fragmentados. Amostras de boa qualidade formam bandas íntegras, enquanto amostras degradadas ou com presença de moléculas de RNA apresentam rastros ao longodo gel. A quantificação é feita pela comparação entre a intensidade da fluorescência das amostras extraídas com uma solução de DNA de concentração conhecida, como por exemplo, soluções contendo DNA do fago lambda. Após a obtenção de amostras de DNA e de sua avaliação quantitativa e qualitativa, pode ser realizada a etapa de análise de DNA que serão descritas nos temas 4 e 5 desta aula e na posterior. As análises dos ácidos nucleicos incluem o uso de enzimas de restrição, técnicas de hibridação molecular, técnicas de amplificação do DNA (PCR – reação em cadeia da polimerase), sequenciamento de DNA e outras técnicas de análise de ácidos nucleicos. TEMA 4 – USO DE ENZIMAS DE RESTRIÇÃO Enzimas de restrição são proteínas encontradas em bactérias que as protegem de infecções virais pois são capazes de clivar o DNA viral, impedindo que este se replique em seu interior. As enzimas de restrição, também chamadas de endonucleases Tipo II, são enzimas que quebram a dupla fita de DNA em regiões específicas gerando fragmentos de DNA sempre do mesmo tamanho e composição. Cada tipo de enzima de restrição é capaz de reconhecer um segmento específico do DNA, denominado sítio de restrição, realizando a clivagem da molécula de DNA nestes sítios específicos. Como resultado existirão vários fragmentos de DNA, sendo que todos foram clivados exatamente na mesma região. Diversas espécies de bactérias são usadas para a produção e isolamento das enzimas de restrição. Cada enzima tem seu nome acompanhado de uma inscrição que indica o sítio do DNA no qual ocorre a clivagem. Por exemplo a enzima Afe I 5´AGC-GCT 3´ / 3´TGC - CGA 5´, foi produzida no microorganismo Alcaligenes faecalis e cliva o DNA nas sequências especificadas. A descoberta das enzimas de restrição foi essencial para o surgimento da tecnologia do DNA recombinante, na qual moléculas de DNA de organismos diferentes podem ser cortadas e posteriormente unidas por complementaridade das duas fitas de DNA e ação da enzima DNA ligase, que refaz as ligações fosfodiéster. As enzimas de restrição também são utilizadas no diagnóstico de doenças genéticas, dado que mutações específicas no DNA podem alterar o sítio de clivagem deste pelas enzimas, alterando o tamanho dos fragmentos gerados, permitindo a diferenciação entre moléculas portadoras e não portadoras da mutação com base nos tamanhos dos fragmentos gerados pela clivagem. Figura 3 – As enzimas de restrição atuam como tesouras moleculares. Estas enzimas clivam a fita de DNA em sequências específicas Crédito: Mopic/Adobe Stock. Figura 4 – Uso das enzimas de restrição em técnicas de engenharia genética. Neste caso a enzima de restrição (em vermelho) foi utilizada para clivar duas regiões do DNA, permitindo a remoção de um gene causador de doenças. Créditos: designua/Adobe stock. TEMA 5 – HIBRIDAÇÃO MOLECULAR Os métodos de hibridização foram um dos primeiros métodos desenvolvidos para analisar o DNA extraído e fragmentado pelo uso de enzimas de restrição e consiste basicamente na separação dos fragmentos de DNA de uma amostra por eletroforese em gel de agarose, seguida da transferência destes fragmentos para uma membrana sólida com a posterior detecção dos mesmos por métodos enzimáticos, cromogênicos ou luminiferous. 5.1 HIBRIDAÇÃO SOUTHERN O método batizado em homenagem ao seu criador Edwin Southern, também conhecido como hibridação southern ou hibridação DNA-DNA, permite o reconhecimento específico de certas moléculas de DNA. Imagine que você tem uma amostra de um tecido qualquer e realizou a extração de DNA dessa amostra. Na sequência você tratou essa amostra com enzimas específicas de restrição a fim de clivar o DNA e isolar um segmento específico do mesmo, ou seja, um gene. Como saber se o gene de interesse realmente estava presente na amostra e como saber se o processamento com a enzima de restrição obteve sucesso? É neste ponto que entra a técnica de hibridização DNA-DNA. Para a realização desta técnica é necessário conhecer a sequência do gene que se quer analisar (por ex 5´AATTGCGC 3´). Baseado nesta sequência, o pesquisador sintetiza em laboratório uma sonda de DNA que consiste basicamente em um fragmento de DNA sintético complementar a sequência do gene de interesse (por ex 3´ TTAACGCG 5´). Esta sonda sintética é marcada com uma substância que emite fluorescência quando uma sequência complementar se liga a ela. Ao misturar os fragmentos de DNA da minha amostra, que contém o gene de interesse, com a sonda sintética, é possível medir a fluorescência emitida e concluir se havia ou não o gene de interesse na minha amostra. A técnica denomina-se hibridação pois ocorre a formação de um fragmento de DNA híbrido, sendo uma das fitas composta pelo DNA da minha amostra e a outra pela sonda sintética. A amostra contendo o DNA deve ser separada em um gel de agarose e deste transferida para uma membrana de nylon ou nitrocelulose, onde as moléculas de DNA ficam estáticas. Antes da transferência, o gel é tratado com hidróxido de sódio promovendo a abertura das duplas fitas de DNA. A membrana é uma réplica exata de tudo que existe no gel, porém sobre esta membrana é possível se realizar uma série de experimentos que não seriam possíveis sobre o gel devido a sua malha porosa. A sonda é colocada em contato com essa membrana e irá se ligar especificamente apenas onde houver fragmentos de DNA complementares a ela. Lavagens removem sondas não ligadas e também sondas que se ligam incorretamente, pois ligações incorretas tem baixa especificidade se desfazendo facilmente. A sonda é previamente marcada com fosfato radioativo (32P) e desta forma os DNAs hibridizados quando expostos a determinado comprimento de onda irão emitir luminosidade/ fluorescência específicos, indicando e simultaneamente quantificando a hibridização. Figura 5 – Em 1 as bandas do gel de agarose sendo colocadas em contato com a membrana de nitrocelulose ou nylon. Em 2 os fragmentos de DNA do gel foram transferidos para a membrana. Em 3 a membrana é colocada em contato com sondas específicas de DNA. Em 4 as sondas se ligam especificamente ao DNA de interesse. Em 5 as moléculas de DNA que sofrem hibridização são detectadas Crédito: Daniele Dietrich Moura Costa. 5.2 HIBRIDAÇÃO NORTHERN A técnica de northern blot, também conhecida como hibridização DNA-RNA, visa a detecção de RNAs mensageiros (abreviados como mRNA). Recebeu esse nome devido ao trocadilho com o nome da técnica Southern. É muito similar a técnica de southern blot, no entanto a sonda desenhada é complementar ao um mRNA, permitindo a detecção deste tipo de molécula. Esta técnica é muito utilizada para avaliar a expressão gênica, dados que os mRNA são o resultado da transcrição dos genes e serão traduzidos em proteínas posteriormente. NA PRÁTICA Desde sua descoberta, as enzimas de restrição passaram a ser utilizadas em diversos tipos de ensaios para avaliar o DNA. Um de seus usos mais frequentes é nos testes de identificação de pessoas, sejam eles testes de paternidade, testes para identificação de possíveis criminosos ou vítimas de acidentes. Nestes ensaios, o DNA da pessoa que se quer identificar é extraído, quantificado e então fragmentado em regiões específicas pelas endonucleases. Após a fragmentação, o DNA é analisado em um gel de agarose. Relembrando que fragmentos diferentes migram de forma diferencial pelo gel de agarose, desta forma produzindo uma padrão de bandas específicas. Cada indivíduo possui seu DNA exclusivo que irá sofrer clivagem em sítios específicos pelas endonucleases gerando também um padrão específico de bandas no gel. No caso de um crime, se o padrão de bandas no gel for 100% similar ao padrão de bandas de um acusado, este é considerado culpado, pois a compatibilidade de bandas entre o indica que se trata da mesma pessoa. No caso de um teste de paternidade, o DNA do filho deve ter padrão de similaridade de 50% com DNA do suposto pai, pois o filho contém metade da cargagenética da mãe e metade do pai. Observe a figura abaixo. Você consegue descobrir quem é o pai da criança? Figura 6 – Um filho, uma mãe e dois supostos pais. Os retângulos pretos indicam a presença da banda no gel de agarose e os retângulos brancos indicam a ausência de bandas no gel. Observe a banda 1: ela está ausente no filho, na mãe e em ambos pais, logo não permite concluir nada em relação à paternidade da criança. A banda 3 está presente no filho e na mãe, mas ausente em ambos os pais, indicando que de fato a criança é filho da referida mãe. A banda 7 está presente no filho, ausente na mãe e no pai 2, mas presente no pai 1. Esta banda é conclusiva em relação ao teste, pois o filho tem e deve ter herdado de um dos genitores; se a mãe não tem essa banda ela só pode ter sido herdada do pai Crédito: Daniele Dietrich Moura Costa. FINALIZANDO Trabalhar com ácidos nucléicos não é fácil e requer precisão e treinamentos específicos. Conforme visualizamos ao longo desta aula, primeiramente é necessário obter uma amostra e armazená-la corretamente. Na sequência o DNA contido na amostra deve ser extraído. O processo de extração possui várias etapas que devem ser realizadas sequencialmente: lise celular, separação dos constituintes celulares, precipitação e ressuspensão do DNA. Esse DNA extraído deve ser quantificado antes de prosseguir para análises. Esta quantificação pode ser feita dos espectrofotometria ou por eletroforese em gel de agarose. Verificada a pureza do DNA extraído por estas duas técnicas, o mesmo pode ser utilizado em diversos experimentos, entre eles: processamento com enzimas de restrição, ensaios de hibridização, amplificação, clonagem entre outros. REFERÊNCIAS ALBERTS, B. Biologia molecular da célula. 4. ed. São Paulo: Artmed, 2004. BROWN, T. A. Clonagem gênica e análise de DNA: uma introdução. 4. ed. Porto Alegre: Artmed, 2003. COX, M. M.; DOUDNA, J. A.; O’DONNELL, M. Biologia molecular: princípios e técnicas. Porto Alegre: Artmed, 2012. FARAH, S. B. DNA: segredos e mistérios. 2. ed. São Paulo: Savier, 2000. KLUG, W. S. et al. Conceitos de genética. 9. ed. Porto Alegre: Artmed, 2010. KREUZER, H.; MASSEY, A. Engenharia genética e biotecnologia. Porto Alegre: Artmed, 2002. WATSON, J. D. et al. DNA recombinante: genes e genomas. 3. ed. Porto Alegre: Artmed, 2009. BIOTECNOLOGIA E BIOINFORMÁTICA AULA 2 Profª Daniele Dietrich Moura Costa CONVERSA INICIAL Na aula anterior, aprendemos como extrair o material genético, seja ele DNA ou RNA, de diferentes tipos de materiais (tecidos biológicos, sangue, urina, células em cultivo etc.). Uma vez extraído, esse material precisa ser quantificado para que possa ser utilizado em diversos tipos de ensaios. Os dois principais métodos de quantificação são a eletroforese em gel de agarose e a espectrofotometria. Conhecida a quantidade de DNA ou RNA, estes podem então ser processados e analisados por diferentes técnicas. Uma das técnicas mais utilizadas é o processamento utilizando enzimas de restrição. Essas enzimas reconhecem segmentos específicos do DNA, clivando a dupla fita e gerando fragmentos. Esses fragmentos podem ser então utilizados numa ampla gama de testes moleculares, entre eles a clonagem de DNA, diferentes tipos de reação de amplificação de DNA por reação em cadeia da polimerase (PCR – polymerase chain reaction) e sequenciamento de DNA. Nesta aula, iremos explorar mais algumas técnicas de processamento e análise de DNA (lembrando que algumas técnicas já foram descritas na aula anterior). Demonstraremos também aplicações práticas dessas técnicas na rotina do biomédico e por fim, na última aula sobre biotecnologia, abordaremos técnicas de expressão, purificação e análise de proteínas, encerrando nosso ciclo de aprendizagem sobre técnicas moleculares de análises de macromoléculas aplicadas à Biotecnologia. TEMA 1 – CLONAGEM DO DNA A primeira técnica de duplicação de moléculas de DNA em laboratório foi a clonagem de DNA. Nesse procedimento, fragmentos específicos de DNA, obtidos por meios de técnicas utilizando enzimas de restrição, são inseridos em bactérias (procariotos) ou leveduras (eucariotos). O procedimento de inserção de fragmentos específicos de DNA (correspondentes a genes específicos) em organismos é denominado transformação genética e origina organismos modificados geneticamente ou transgênicos. No caso dos organismos modificados geneticamente, a inserção do gene é feita entre indivíduos da mesma espécie, ou seja, eu retiro o gene de interesse do indivíduo 1 da espécie A e insiro no indivíduo 2 também da espécie A. No caso dos transgênicos, o gene é transferido entre espécies distintas; eu retiro o gene 1 da espécie A e insiro o gene 1 na espécie B, sendo a espécie B a transgênica. Esse processo é chamado transformação por causa das novas características que podem ser adquiridas pela bactéria com a introdução do novo gene (como a resistência a determinados antibióticos). O gene inserido é incorporado ao DNA plasmidial do organismo receptor (bactéria), e quando este for realizar a replicação do seu material genético, irá replicar também o DNA inserido no plasmídio. Devemos nos lembrar que procariotos se reproduzem muito rapidamente, dessa forma, a replicação do gene inserido também é muito rápida, gerando inúmeras cópias ou clones desse gene. Nessa técnica, o DNA é retirado de um organismo doador por meio de técnicas de extração de DNA já descritas na última aula. Esse DNA isolado é então digerido por endonucleases de restrição, e os fragmentos gerados que contêm os genes de interesse são ligados a um vetor de clonagem, geralmente um plasmídeo. Um vetor de clonagem é uma estrutura de DNA com capacidade de se introduzir em células bacterianas, um processo conhecido como transfecção. A união do gene de interesse, extraído da amostra e do plasmídeo (vetor), forma uma molécula de DNA recombinante. Esse DNA recombinante é inserido na bactéria/levedura por meio da técnica de transformação. Quando esse organismo se replicar, ele irá replicar também o DNA inserido. O conjunto dos fragmentos de DNA digeridos pela enzima de restrição e ligados aos vetores, que foram transferidos e replicados pelo procarioto, constitui uma biblioteca genômica, ou seja, uma biblioteca de genes. Se, ao invés do DNA, utilizarmos um RNAm nesse procedimento, convertendo-o em DNA complementar (cDNA) antes de realizar a transformação bacteriana, teremos uma biblioteca de expressão gênica, que corresponde aos mRNAs que são expressos pela célula doadora. Observe, na Figura 1, a técnica de clonagem de DNA por meio do uso de DNA recombinante. Em 1, o DNA é extraído da célula doadora e tratado com enzimas de restrição a fim de se isolar os genes específicos. Simultaneamente (ainda em 1), o plasmídio é extraído da bactéria. Em 2, ocorre a formação do DNA recombinante, no qual o DNA da célula doadora é unido ao DNA plasmidial. Em 4, há o processo de transformação, no qual o plasmídio contendo o DNA recombinante é inserido novamente na bactéria. Em 5, observe o processo de clonagem do DNA, sendo que, ao replicar o seu próprio material genético (que inclui o plasmídio), a bactéria replica também o DNA da célula doadora. Figura 1 – Clonagem do DNA Créditos: Why Design/Shutterstock. TEMA 2 – REAÇÃO EM CADEIA DA POLIMERASE Conhecendo o processo de replicação do DNA e o papel primordial da DNA polimerase (DNApol) neste processo, em 1983, Karry Mullis desenvolveu a primeira técnica de multiplicação de moléculas de DNA em laboratório, a PCR (Reação em cadeia da polimerase; do inglês polymerase chain reaction). A PCR consiste na síntese enzimática de fragmentos de DNA, em laboratório, sem a necessidade de uma célula hospedeira como ocorria na clonagem. O DNA é obtido de uma célula doadora, extraído e tratado com enzimas de restrição. Os fragmentos de DNA gerados pelos endonucleases são então utilizados na reação de PCR. 2.1 PRINCÍPIOS PCR A PCR é uma técnica que ocorrenas seguintes etapas sequenciais: desnaturação (separação das duplas fitas de DNA), anelamento (hibridação de primers) e polimerização (também chamadas de extensão ou elongação). A desnaturação consiste na separação das duplas fitas dos fragmentos de DNA parental (obtido da célula doadora) utilizando altas temperaturas (acima de 90 oC). Essas temperaturas são capazes de romper as ligações de hidrogênio que mantêm as duas fitas unidas. Na etapa de anelamento, a temperatura é reduzida para cerca de 60 oC (temperatura ideal para que ocorra o anelamento dos primers) e dois oligonucleotídeos iniciadores são adicionados à reação. Esses oligonucleotídeos são denominados primers e são complementares a sequências de DNA de cada uma das fitas parentais, ligando-se a elas por meio da complementaridade de bases. Em razão da característica antiparalela da dupla fita de DNA, é citado que um primer se liga na extremidade 3’ da região-alvo (primer direto ou forward), enquanto o outro se liga na extremidade 5’, na fita oposta (primer reverso ou reverse). Os primers fornecem extremidades 3´OH livres que, na etapa de polimerização, são utilizadas pelas DNA polimerases para sintetizar novas fitas de DNA, obedecendo ao princípio da complementaridade de bases. A temperatura é então elevada para cerca de 72 °C e a DNA polimerase promove a ligação fosfodiéster entre o último nucleotídeo da nova fita e nucleotídeo trifosfatado a ser adicionado. Essas três etapas são repetidas por inúmeros ciclos, sendo que a cada ciclo ocorre a duplicação de uma molécula de DNA, gerando ao final dos ciclos várias cópias da molécula de DNA parental. O equipamento no qual a PCR é realizada chama-se termociclador, pois ele tem a capacidade de realizar os ciclos de variação de temperatura necessários para as etapas de desnaturação e anelamento. Os microtubos contendo os reagentes necessários para que ocorra a reação enzimática são colocados no termociclador, o qual realiza sozinho o processo de elevação e redução sequencial da temperatura. Os reagentes utilizados nesse processo são: água ultrapura, moléculas de DNA a serem duplicadas (DNA molde ou DNA parental), desoxirribonucleotídeos trifosfatos (dNTPs, necessários para permitir a elongação do DNA), primers, enzima DNA polimerase, solução de cloreto de magnésio (cofator da enzima DNA polimerase) e solução tampão para a DNA polimerase. A DNA polimerase usada na reação é isolada da bactéria Thermus aquaticus, e por isso é chamada de Taq polimerase (em menção às iniciais do nome da espécie a partir da qual foi obtida). Esta é a DNA polimerase ideal, pois diferentemente das demais, ela não sofre desnaturação em altas temperaturas. Obviamente que todo esse processo requer o conhecimento prévio da sequência de DNA que se quer amplificar, pois é necessário que os primers sejam complementares a tal sequência. Tal conhecimento é altamente difundido e está presente nas inúmeras bibliotecas genômicas disponíveis on-line. Na Figura 2, a seguir, observe a reação em cadeia da polimerase. Em azul, a dupla fita de DNA; em verde, os primers iniciadores e em amarelo, os nucleotídeos necessários para a síntese e novas cadeias de DNA. Na etapa de desnaturação, a dupla fita de DNA é aberta por elevação da temperatura. Na etapa de anelamento, a temperatura é reduzida e os primers pareiam com as fitas simples de DNA. Na etapa de elongação, a temperatura é elevada a 72 oC, que é a ideal para que a Taq polimerase sintetize novas cadeias de DNA. Figura 2 – Reação em cadeia da polimerase Créditos: WhiteDragon/Shutterstock. 2.2 TIPOS PCR – PCR MULTIPLEX 2.2.1 PCR MULTIPLEX Neste tipo de PCR, mais de um fragmento de DNA e mais de um par de primers são utilizados simultaneamente, promovendo a amplificação de vários fragmentos de DNA em um mesmo tubo numa só reação. No caso de genomas pequenos como os dos vírus e bactérias, essa técnica apresenta elevada especificidade, permitindo a identificação precisa desses organismos e eliminando riscos de falsos positivos. 2.2.2 RT-PCR Este é o tipo de PCR feito a partir de moléculas de RNA mensageiro com o auxílio da enzima transcriptase reversa (RT – reverse transcriptase). Nesse ensaio, os RNAm totais são extraídos de uma amostra e convertidos em DNA complementar (cDNA) pela transcriptase reversa. Esse cDNA é então submetido aos ciclos de amplificação por PCR. Esse tipo de PCR é utilizado para avaliar a expressão gênica. Na Figura 3, observe que o mRNA é convertido em cDNA pela enzima transcriptase reversa. Esse cDNA é então submetido a diversos ciclos de amplificação utilizando o termociclador. Ao final de vários ciclos, várias cópias do cDNA são obtidas. Figura 3 – RT-PCR Créditos: DAntes Design/Shutterstock. 2.2.3 NESTED PCR Esta técnica, em vez de um par de primers, utiliza dois pares de primers complementares à sequência-alvo de DNA, aumentando a sensibilidade da técnica. Inicialmente, é realizada a amplificação com o par mais externo e, posteriormente, o produto dessa PCR é amplificado com um par interno ao primeiro (aninhado), que utilizará os fragmentos multiplicados na primeira reação como molde. Nesta técnica, realizam-se dois ensaios consecutivos de PCR. No primeiro, um fragmento de DNA é amplificado com um par de primers. Uma alíquota desses DNAs amplificados inicialmente é então submetida a um novo ciclo de PCRs, utilizando-se um novo par de primers, localizados internamente em relação à posição do par de primers inicialmente utilizados. 2.2.4 PCR EM TEMPO REAL Essa reação de PCR é muito similar a uma PCR convencional, porém a ela é adicionado um primer que sofre anelamento com a parte média do fragmento de DNA a ser amplificado. Esse primer extra é denominado sonda e contém, em uma extremidade, uma molécula fluorescente (fluoróforo) e, na outra extremidade, uma molécula inibidora. Na sonda íntegra, a molécula inibidora impede a emissão de fluorescência. Durante a etapa de elongação da PCR, a sonda hibridiza-se ao DNA-alvo e sua região inibidora é degradada pela atividade 5’-3’ exonuclease da enzima Taq polimerase, ativando a sonda e resultando na emissão da fluorescência. A emissão de fluorescência é medida a cada ciclo, permitindo acompanhar o seu aumento da fluorescência ao longo da reação, geralmente por um computador acoplado ao termociclador (por isso, a denominação em tempo real). A quantidade de fluorescência emitida pela reação irá aumentar conforme as moléculas são sintetizadas, sendo proporcional à quantidade inicial de DNA-alvo, ou seja, quanto mais DNA houver no começo da reação, maior a fluorescência detectada a cada ciclo. A técnica de PCR em tempo real permite a quantificação precisa de moléculas de DNA e tem sido utilizada para a quantificação de patógenos virais e bacterianos em amostras biológicas, na genotipagem de variantes genéticas, na avaliação dos níveis de expressão gênica e na detecção de produtos transgênicos em alimentos. Observe, na Figura 4, que o DNA é inicialmente desnaturado por aumento da temperatura (ou seja, tem suas duplas fitas separadas). Esse DNA desnaturado sofre então o anelamento com os primers e também se liga à sonda fluorescente. À medida que a Taq polimerase sintetiza a nova cadeia de DNA, ela degrada a sonda, que então passa a liberar sua fluorescência que pode ser medida pelo termociclador. Figura 4 – PCR em tempo real Créditos: DAntes Design/Shutterstock. TEMA 3 – SEQUENCIAMENTO DE DNA O sequenciamento de DNA ou RNA é a técnica por meio da qual a sequência exata de nucleotídeos dessas moléculas é desvendada. Essa técnica possui diversas aplicações, desde a identificação de genes de organismos patogênicos até o sequenciamento completo do genoma humano. Na década de 1970, Frederick Sanger e colaboradores desenvolveram a técnica que tornou possível sequenciar fragmentos de DNA. O método consiste na incorporação aleatória de dideoxinucleotídeos trifosfatos (ddNTPs), em uma fita de DNA, pela enzima DNA polimerase,seguindo os princípios da replicação do DNA. Os ddNTPs, ao contrário dos deoxinucleotídeos trifosfatados (dNTPs), não possuem em sua estrutura uma hidroxila na posição 3’. Assim, a síntese da fita de DNA é paralisada sempre que a DNA polimerase incorpora uma ddNTP na nova fita, produzindo fragmentos de DNA de tamanhos distintos. Dessa forma, a técnica consiste na produção de fragmentos de DNA que diferem em um nucleotídeo um do outro, utilizando como molde uma fita simples de DNA. A utilização do primer complementar determina qual a sequência de DNA que será produzida. A reação se inicia com a desnaturação de um fragmento de DNA dupla fita de DNA, formando uma simples fita. A reação requer a presença de uma DNA polimerase, primers iniciadores, altas concentrações de dNTPs e baixas concentrações de ddNTPs. À medida que a reação ocorre, a DNA polimerase vai elongando a cadeia de DNA usando os dNTPs que estão em concentração maior; em um dado momento, um ddNTP é incorporado aleatoriamente à cadeia em elongação e a polimerização é interrompida. Cada um dos ddNTPs (adenina, citosina, guanina e timina) são marcados diferencialmente, cada um com uma cor de fluorescência. Os fragmentos truncados são então separados em gel de poliacrilamida e analisados quanto aos seus tamanhos e composição da fluorescência. Essa técnica era inicialmente manual, o que consumia muito tempo, dinheiro e esforços dos envolvidos. Os equipamentos mais atuais utilizam capilares finos dentro dos quais os fragmentos de DNA são separados por tamanho, do menor para o maior, sendo então, ao final da eletroforese capilar, detectados por um feixe de laser. Cada um dos 4 nucleotídeos usados nessa síntese (Adenina, Timina, Guanina e Citosina) são marcados com fluoróforos distintos, o que permite identificar qual foi o nucleotídeo adicionado ao final de cada fragmento de DNA. A ordem em que os diferentes fragmentos passam pelo detector de fluorescência indica a sequência dos nucleotídeos da cadeia complementar ao DNA molde, determinando assim a sequência original. TEMA 4 – MARCADORES MOLECULARES Um marcador molecular é qualquer característica molecular (DNA, RNA ou proteínas), que gere um dado fenótipo expresso de forma diferencial entre indivíduos da mesma espécie. Os marcadores moleculares são técnicas baseadas em biologia molecular utilizadas para avaliar variações nas sequências de DNA, permitindo a identificação de indivíduos, diferenciação de espécies e variantes de uma mesma espécie e identificação de alterações relacionadas a doenças. 4.1 RFLP A técnica RFLP (Polimorfismos no comprimento de fragmentos por restrição - Restriction Fragment Length Polymorphism) refere-se à identificação de polimorfismos no DNA. Apesar de todos os indivíduos da mesma espécie possuírem o mesmo genoma, eles apresentam variações individuais denominadas polimorfismos. Os polimorfismos são responsáveis não apenas pelas características individuais de cada pessoa, mas também pelas características étnicas de populações e mais recentemente têm sido descritos como promotores ou supressores de doenças. A presença ou ausência de determinadas sequências de DNA faz com que, ao ser tratado com uma enzima de restrição, o DNA gere uma gama diferente de fragmentos em cada indivíduo. Tomemos como exemplo os indivíduos A e B, que serão submetidos à técnica de RFLP para avaliação de polimorfismos relacionados a genes promotores de câncer de tireoide. Embora ambos tenham o mesmo genoma, possuem variações individuais. Entre essas variações, está a presença ou não de alelos relacionados à maior ocorrência de câncer de tireoide. O DNA de ambos indivíduos é extraído e então tratado com enzimas de restrição que clivam especificamente regiões que contêm esses promotores tumorais. Desse modo, como seus DNAs possuem polimorfismos, o tratamento com as enzimas irá resultar em fragmentos diferentes para cada indivíduo: o indivíduo que tem o promotor possuirá um fragmento de DNA correspondente a esse promotor; já o indivíduo que não tem o promotor não possuirá o fragmento de DNA correspondente a esse promotor, dado que a enzima de restrição não encontrou o sítio específico para sua ação. Esses fragmentos, quando separados por eletroforese, irão gerar um padrão distinto em cada pessoa, permitindo sua identificação. Para efetuar a detecção dos marcadores RFLP, os fragmentos separados no gel de agarose pela eletroforese são transferidos para uma membrana de nylon (ou nitrocelulose) pela técnica de Southern Blot, descrita na aula anterior. Os fragmentos são então identificados pelo uso de sondas específicas. Dessa maneira, busca-se reconhecer modificações do DNA que possam estar presentes dentro da sequência de reconhecimento das enzimas de restrição. Então, um indivíduo que apresente uma modificação no genoma que impossibilite a clivagem por determinada enzima de restrição pode ser identificado por meio da comparação com outro da mesma espécie e que não apresente essa modificação, o que não impossibilita a clivagem do DNA. 4.2 MICROSSATÉLITE Os microssatélites são também denominados de repetições de sequências simples (do inglês SSR, simple sequence repeats) ou repetições em tandem. Os microssatélites são pequenos segmentos do DNA que se repetem continuamente ao longo de uma molécula de DNA e o número de repetições varia de indivíduo para indivíduo. Baseado nesse conhecimento, surge a técnica do DNA fingerprint (ou impressão digital do DNA), dado que a análise do número de repetições de cada uma destas sequências permite identificar uma pessoa. Inicialmente, deve ser obtida uma amostra biológica (sangue, sêmen, saliva, tecidos, cabelos com bulbo capilar etc.) e o DNA deve ser extraído dela. Após a extração do DNA, faz-se o uso de enzimas de restrição para a obtenção de fragmentos específicos e de diferentes tamanhos do DNA. Esses fragmentos são então submetidos à PCR e posteriormente à eletroforese, conforme descrito na última aula, e então analisados. O perfil de bandas formadas será específico para cada indivíduo, dado que os fragmentos formados pelas enzimas de restrição, os microssatélites, têm quantidade variável de indivíduo para indivíduo. Apesar de todas as vantagens e aplicabilidades que os marcadores SSR apresentam, a grande limitação reside na necessidade do isolamento e desenvolvimento de primers específicos para cada espécie, ou ter disponível primers de espécies relacionadas para testar transferabilidade, problema que foi resolvido com a criação da técnica RAPD descrita a seguir. 4.3 RAPD (RANDOM AMPLIFIED POLYMORFIC DNA) Este é um método de análise de polimorfismos baseado na PCR e envolve a amplificação de vários lócus do genoma utilizando primers de sequência arbitrária. Um primer de sequência arbitrária é um primer mais curto desenhado de forma aleatória, sem que se conhecesse previamente a sequência que se desejava amplificar. Lembre-se que para a PCR convencional, era necessário conhecer a sequência de DNA a ser amplificada para então desenhar um primer específico para essa sequência. A amplificação ao acaso de sequências de DNA deu nome à técnica, DNA polimórfico amplificado ao acaso (do inglês Random Amplified Polymorfic DNA). A grande vantagem dessa técnica é permitir o estudo de espécies que não têm seu genoma disponível em bancos de dados. Os polimorfismos RAPD resultam da variação da sequência nos locais de anelamento do primer e/ou variação de comprimento na sequência-alvo situada entre os locais de ligação do primer. O RAPD é uma técnica não radioativa que requer uma pequena quantidade de DNA (15-25 ng), a maior vantagem dessa técnica em relação à técnica de RFLP, e pode ser realizado em poucas horas. Seu grande problema é a baixa taxa de reprodutibilidade interlaboratórios. TEMA 5 – APLICAÇÕES DA ANÁLISE DO DNA 5.1 EXAME DE DNA: TESTE DE PATERNIDADE E GENÉTICA FORENSE Os testes de paternidade e a identificação forense de criminosos se baseiam na técnica demicrossatélite. No caso dos testes de paternidade, devemos lembrar que cada indivíduo possui polimorfismos específicos daquela pessoa, ou seja, o número de repetições das sequências microssatélite é individual. A denominação impressão digital do DNA (DNA fingerprinting) foi estabelecida justamente em referência à impressão digital, anteriormente única utilizada na identificação humana. Além disso, essas sequências satélite possuem herança mendeliana, fazendo com que a prole tenha metade das sequências provenientes do pai e a outra metade proveniente da mãe. Ao realizar um teste de paternidade, metade das sequências do filho deve corresponder às do suposto pai e a outra metade da mãe. Já no caso de crimes, compara-se a sequência de um suspeito com amostras encontradas na cena do crime (por exemplo, compara-se o sangue do suspeito com sêmen encontrado em vítimas de estupro). Para que o suspeito seja considerado culpado, deve haver 100% de correspondência entre o seu padrão de microssatélites e o padrão encontrado na cena do crime, indicando se tratar da mesma pessoa. 5.2 DIAGNÓSTICOS DE DOENÇAS GENÉTICAS Sabemos que as proteínas são essenciais para o correto funcionamento das células e de todo o organismo. A falta de uma proteína ou a presença de uma proteína defeituosa pode ser a responsável por inúmeras doenças como, por exemplo, anemia falciforme ou tirosinemia. Mas qual é a relação do DNA com essas doenças? É que ele, por meio dos processos de transcrição e tradução, comanda a formação das proteínas. A ausência de um gene específico acarreta a não produção da proteína ou a mutação desse gene acarreta a produção de uma proteína não funcional. Tanto o sequenciamento quanto reações baseadas em PCR ou hibridação molecular podem ser usados para se fazer o diagnóstico de doenças moleculares. No caso do sequenciamento, a sequência de DNA de um indivíduo portador da doença pode ser comparada com a sequência de indivíduos normais ou com a sequência de banco de dados. Conhecendo a sequência do gene causador da doença, é possível também desenvolver primers para a amplificação total ou parcial do gene por PCR e também a clivagem por enzimas de restrição. Imagine uma doença X, cuja mutação causadora já seja bem descrita. Nesse caso, é possível coletar uma amostra de sangue de um paciente e extrair o DNA, processá-lo com enzimas de restrição e comparar o resultado dos fragmentos em gel de agarose com o de um indivíduo normal. O indivíduo doente possui uma mutação no sítio de restrição da enzima e, portanto, não sofre clivagem; já o indivíduo normal não tem essa mutação e a clivagem ocorre normalmente, gerando um fragmento específico. Ao comparar os géis de agarose de ambos pacientes, o indivíduo normal irá ter uma banda correspondente ao fragmento gerado, enquanto o indivíduo doente não terá essa banda. 5.3 DIAGNÓSTICO DE DOENÇAS INFECCIOSAS A maioria das doenças infecciosas, como por exemplo a covid-19 ou a tuberculose, são causadas por patógenos que já possuem seu genoma bem descrito em bancos de dados. Conhecendo-se o genoma de uma espécie, é possível selecionar alguns genes de interesse e desenhar primers específicos para determinados fragmentos de DNA. Quando se suspeita da infecção por esse patógeno, materiais biológicos adequados devem ser coletados (no caso da covid- 19, são amostras de naso e orofaringe, e no caso da tuberculose, é escarro pulmonar) e a presença do material genético desses patógenos pode ser avaliada por técnicas baseadas em PCR. Além disso, a PCR permite identificar variantes desses patógenos, bem como a possível resistência a antibióticos no caso de bactérias. A PCR em tempo real é o método que mais tem sido utilizado para a quantificação de diferentes agentes infecciosos, permitindo a obtenção de resultados sensíveis e precisos. NA PRÁTICA Em tempos de pandemia, muito tem se falado sobre os testes para a detecção do coronavírus. Mas e você, sabe a diferença entre eles? Sabe quando aplicar e quando indicar cada um deles? Existem dois tipos principais de testes: o sorológico e o PCR. O teste sorológico consiste na detecção de anticorpos contra o Sars-CoV-2 no sangue dos pacientes. Ou seja, esse teste detecta se uma pessoa já teve contato com o vírus no passado e, portanto, desenvolveu memória imune. É indicado para pesquisas epidemiológicas, para saber se a pessoa teve ou não o vírus, mesmo tendo sido assintomático. O teste de RT-PCR é feito através de um swab nasal. Nesse caso, coletam-se amostras na naso e orofaringe que são processadas pela técnica de RT-PCR, já que o coronavírus é um vírus de RNA. Essa técnica permite a identificação do material genético do vírus, indicando se uma pessoa está ou não contaminada pelo Sars-CoV-2 naquele exato momento. Por detectar o material genético do vírus, esse teste é chamado de detecção de antígeno (diferentemente do teste sorológico, que é de detecção de anticorpo). É indicado quando há suspeita clínica de que os sintomas que um paciente apresenta sejam devido ao vírus. FINALIZANDO O passo essencial para o estudo do DNA/RNA é sua obtenção a partir de amostras biológicas. Essa obtenção depende de um protocolo de extração, que deve ser adequado ao tipo de material genético (se DNA ou RNA) e compatível com a realidade de cada laboratório. Uma vez obtido, esse material serve para uma gama de análises experimentais. Na aula anterior, vimos como extrair esse DNA e algumas técnicas para processá-lo e analisá-lo, como o processamento por enzimas de restrição e técnicas de hibridização. Nesta aula, vimos o uso de DNA para sequenciar o genoma de uma espécie, técnicas de amplificação de fragmentos de DNA obtidos por enzimas de restrição e técnicas de análises de marcadores moleculares. Por fim, encerramos nosso estudo sobre os ácidos nucleicos falando de algumas aplicações possíveis de todas essas análises no dia a dia do biomédico. Na terceira e última aula deste módulo do curso de Biotecnologia e Bioinformática, abordaremos as técnicas de manipulação e análise de proteínas. REFERÊNCIAS ALBERTS, B. et al. Biologia molecular da célula. 4. ed. São Paulo: Artmed, 2004. AZEVEDO, M. de O. et al. Técnicas básicas em biologia molecular. Brasília: Editora UnB, 2003. BROWN, T. A. Clonagem gênica e análise de DNA: uma introdução. 4. ed. Porto Alegre: Artmed, 2003. COX, M. M.; DOUDNA, J. A.; O’DONNELL, M. Biologia molecular: princípios e técnicas. Porto Alegre: Artmed, 2012. FARAH, S. B. DNA: segredos e mistérios. 2. ed. São Paulo: Savier, 2000. HAUSMANN, R. História da biologia molecular. 2. ed. Ribeirão Preto: Funpec–RP, 2002. KLUG, W. S. et al. Conceitos de genética. 9. ed. Porto Alegre: Artmed, 2010. KREUZER, H.; MASSEY, A. Engenharia genética e biotecnologia. Porto Alegre: Artmed, 2002. MICKLOS, D. A.; FREYER, G. A.; CROTTY, D. A. A ciência do DNA. 2. ed. Porto Alegre: Artmed, 2005. RUMJANEK, F. D. Introdução à biologia molecular. Rio de Janeiro: Âmbito Cultural, 2001. ZAHA, A.; FERREIRA, H. B.; PASSAGLIA, L. M. P. Biologia molecular básica. 3. ed. Porto Alegre: Mercado Aberto, 2003. BIOTECNOLOGIA E BIOINFORMÁTICA AULA 3 Profª Daniele Dietrich Moura Costa CONVERSA INICIAL Até agora, tínhamos estudado os ácidos nucleicos, como extraí-los e analisá-los. É sabido que o DNA é um repositório quase que estático de informação genética, exceto pela ocorrência de algumas mutações. Como então que esse repositório é capaz de comandar diversas funções celulares? A resposta está no Dogma Central da Biologia Molecular, segundo o qual o DNA é transcrito em RNA e este é traduzido em proteínas. As proteínas são as grandes efetoras das células; são elas que catalisam reações, têm funções estruturais, funções imunológicas, conferem características fenotípicas e uma gama de outras funções já conhecidas por você aluno. Uma proteína é formada basicamente por uma estrutura linear de aminoácidos ligados entre si por ligações peptídicas. Esses aminoácidos se organizamno espaço conferindo uma estrutura tridimensional às proteínas que, em última instância, é essencial para o funcionamento correto das mesmas. A Biotecnologia, ao trabalhar com proteínas, deve primeiramente ser capaz de removê-las das células e isolá-las, sendo esses procedimentos conhecidos como lise celular e purificação/extração proteica respectivamente. Outra meta é descobrir a sequência de aminoácidos e como essa sequência interfere na conformação espacial da proteína, conhecimento que pode ser obtido por meio do sequenciamento de aminoácidos e de espectrometria de massa. Além disso, técnicas como SDS-PAGE (uni ou bidimensional) associadas a Western Blot podem separar e identificar alvos proteicos com precisão por meio de imunoensaios. Por fim, técnicas como a cristalografia de raios X e a ressonância magnética nuclear permitem identificar a estrutura tridimensional dessas moléculas. Ao longo desta aula, descreveremos cada uma dessas técnicas e suas aplicações para o biomédico. TEMA 1 – TÉCNICAS DE SEPARAÇÃO E PURIFICAÇÃO DE PROTEÍNAS 1.1 RECONHECIMENTO E EXTRAÇÃO PROTEICA Cada célula possui em sua composição bioquímica básica ácidos nucleicos, lipídeos, carboidratos e proteínas. O genoma humano contém mais de 3 milhões de pares de bases e cerca de 40.000 genes descritos. No entanto, a quantidade de proteínas pode ser muito superior à de genes devido à possibilidade de modificações pós-transcricionais e pós-traducionais. Cada célula é composta exatamente pelo mesmo DNA, logo o que difere entre um neurônio e um miócito são as proteínas que esses tipos celulares são capazes de expressar. De fato, uma célula expressa uma gama enorme de proteínas. Como então reconhecer uma proteína de interesse? Diversos ensaios bioquímicos permitem reconhecer proteínas específicas por meio de suas propriedades intrínsecas. Por exemplo, para uma proteína com função enzimática, um ensaio que meça a conversão de reagentes em substratos pode ser uma boa opção para reconhecer esta proteína. A partir do momento em que já temos certeza que a proteína de nosso interesse está presente em uma amostra ou tipo celular, é necessário agora remover essa proteína das células, num processo conhecido como lise celular. A lise permite que as proteínas sejam liberadas das células para que então sejam purificadas. Inicialmente, as células podem ser rompidas por homogeneização mecânica ou por sonicação utilizando-se um tampão adequado. Esse tampão deve conter detergentes capazes de solubilizar os lipídeos de membrana, inibidores de proteases que impeçam essas enzimas de degradar as proteínas da amostra e um regulador de pH a fim de manter as proteínas estáveis em solução. Além disso, a temperatura de manuseio das amostras deve ser mantida sempre baixa, a fim de se evitar a desnaturação proteica. O homogenato celular corresponde a uma sopa de proteínas e restos celulares que deve então ser centrifugado. O pellet resultante contém restos celulares, enquanto o sobrenadante contém as proteínas e deve ser separado para um novo tubo. Etapas adicionais de centrifugação em diferentes velocidades podem ser realizadas a fim de se removerem outros componentes como ácidos nucléicos e lipídeos. 1.2 PURIFICAÇÃO PROTEICA A purificação de uma proteína é o primeiro passo essencial para que se possa estudar sua estrutura e função. Diversas técnicas podem ser aplicadas para essa finalidade, e as proteínas podem ser separadas com base na sua solubilidade, carga, tamanho e ligação com outras moléculas. Em geral, ocorre a associação de técnicas com o intuito de se obter uma amostra mais pura da proteína de interesse. 1.2.1 Salting out Salting out faz referência ao fato de a maioria das proteínas serem insolúveis em altas quantidades de sal. Cada proteína específica sofre precipitação em uma quantidade de sal diferente, logo é possível usar concentrações salinas específicas para promover a precipitação de proteínas de interesse. O sal mais usado é o sulfato de amônio, o qual é adicionado à solução de macromoléculas até uma concentração bem próxima do ponto de precipitação da proteína de interesse. Após a centrifugação, as proteínas precipitadas e não desejadas são descartadas e mais sal é adicionado ao sobrenadante até uma concentração suficiente para precipitar a proteína desejada. Após uma segunda centrifugação, a proteína é recuperada como precipitado e o sobrenadante é descartado. Observe, na Figura 1, as etapas da purificação de proteínas por salting out. O primeiro tubo contém a solução contendo a proteína de interesse (proteína alvo em verde), demais proteínas e sal. No segundo tubo, as proteínas que não eram alvo da reação sofreram precipitação devido à alta concentração de sal. No terceiro tubo, a proteína-alvo é precipitada por interações com outras concentrações salinas. Figura 1 – Salting out Crédito: Daniele Dietrich Moura Costa. 1.2.2 Diálise A diálise é uma técnica que permite separar proteínas de acordo com seus tamanhos. Uma membrana semipermeável porosa específica, chamada de membrana de diálise (ou saco de diálise), é utilizada nesse processo. Cada membrana possui uma porosidade de um tamanho específico. As proteínas são colocadas no interior do saco de diálise; proteínas com diâmetro inferior ao poro irão atravessar a membrana, enquanto proteínas com diâmetro superior ao poro ficarão retidas dentro do saco de diálise. Essa técnica é ótima para a remoção de pequenas moléculas contaminantes como sais ou separar proteínas muito pequenas, mas sozinha não é o ideal para a separação de moléculas maiores. Observe, na Figura 2, a purificação por diálise. As proteínas (em verde e amarelo) são colocadas no interior de um saco de diálise (em vermelho). O poro da membrana permite a passagem apenas das proteínas em amarelo. Após algum tempo, as proteínas em amarelo podem ser encontradas na solução, enquanto as proteínas em verde são mantidas dentro do saco de diálise. Figura 2 – Diálise Crédito: Daniele Dietrich Moura Costa. 1.2.3 Cromatografia de filtração em gel As técnicas cromatográficas se baseiam em preencher uma coluna com um polímero, sendo que as características do polímero irão determinar o tipo de cromatografia e a forma de separação da proteína. Na maioria dos procedimentos cromatográficos, a mistura de proteínas a ser fracionada é dissolvida em um líquido (a fase “móvel”), e esse líquido é passado através de uma coluna contendo uma matriz sólida e porosa (a fase “estacionária” ou polímero). À medida que os solutos fluem pela coluna, eles interagem com a fase estacionária e sua eluição (liberação da coluna) é retardada. Esse retardamento depende das propriedades de cada soluto. A cromatografia de filtração em gel é chamada também de peneiramento molecular ou exclusão molecular e se baseia na separação de proteínas de acordo com seu tamanho molecular em uma coluna de polímeros porosos. Primeiramente, a coluna é preenchida por um polímero adequado, e na sequência, as amostras contendo as proteínas de interesse são colocadas no topo dessa coluna. As moléculas menores são capazes de entrar dentro dos polímeros, enquanto as grandes ficam na solução ao redor do polímero. Considerando-se que o procedimento está ocorrendo dentro de um tubo de vidro que forma uma coluna, as moléculas maiores irão passar mais rápido por entre os polímeros e sairão primeiramente da coluna de fracionamento, em sua parte inferior; enquanto as moléculas menores que ficarem presas dentro do polímero irão migrar mais lentamente pela coluna, demorando mais para sair dela. Observe, na figura a seguir, um esquema geral de como ocorre a cromatografia em coluna. Dentro da coluna de vidro, são adicionadas a fase móvel ou líquida, que contém as proteínas (representadas por azul, vermelho e verde), e a fase sólida que contém os polímeros. A proteína em verde tem maior massa molecular e, portanto, menor interação com o polímero, sendo liberada da coluna mais facilmente. Jáa proteína em azul possui pequena massa molecular e interage fortemente com os poros do polímero, tendo sua migração retardada ao longo da coluna, sendo a última a ser eluída. Figura 3 – Cromatografia Crédito: DariaRen/Shutterstock. 1.2.4 Cromatografia de troca iônica É um método de separação baseado na carga iônica da proteína. Proteínas com cargas positivas podem ser purificadas utilizando-se colunas de cromatografia contendo polímeros de cargas negativas; já proteínas de cargas negativas podem ser purificadas utilizando-se polímeros de cargas positivas. A solução contendo inúmeras proteínas é colocada em contato com o polímero da coluna. As proteínas de carga oposta ao polímero irão ficar ligadas a ele, enquanto as de mesma carga serão lavadas da coluna. Posteriormente, as proteínas ligadas podem ser eluídas (liberadas) do polímero com o uso de tampões contendo altas concentrações de sais que desfazem a interação proteína- polímero. 1.2.5 Cromatografia de afinidade Esta técnica se baseia na alta afinidade que algumas proteínas possuem por grupamentos químicos ou moléculas específicas. Por exemplo, se eu desejo isolar uma proteína que atua como um fator de transcrição de um dado gene, basta que eu acople esse gene ao polímero e realize a reação. O fator de transcrição, por ter afinidade pelo gene, ficará ligado a ele na coluna, enquanto as demais proteínas passam direto pela coluna sem interagir com o gene e o polímero. Posteriormente o fator de transcrição é eluído da coluna através do uso de tampões de eluição, contendo altas concentrações de sais. Ainda é possível utilizar um anticorpo específico para a proteína. Nesse caso, o anticorpo é ligado ao polímero e ele realiza a captura das proteínas-alvo da solução. Na Figura 4 a seguir, observe os tipos de cromatografia. Na primeira imagem à esquerda, está representada uma cromatografia por gel filtração, na qual as proteínas de tamanho compatível ficam aderidas aos poros do polímero. Na imagem do meio, está representada a cromatografia por afinidade iônica, na qual proteínas de cargas positivas (em vermelho) ficam aderidas ao polímero de cargas negativas. Na última imagem à direita, está representada a cromatografia por afinidade, na qual anticorpos específicos são aderidos ao polímero e realizam a captura da proteína de interesse. Figura 4 – Tipos de cromatografia Crédito: Art of Science/Shutterstock. 1.2.6 Cromatografia líquida de alta pressão Esta técnica, chamada de HPLC (high pressure liquid cromatography), é utilizada para melhorar a qualidade e o rendimento de todos os tipos de cromatografia descritos anteriormente. Nessa técnica, os polímeros que compõem a coluna são finamente divididos e há mais pontos de inserção para a proteína, aumentando o poder de resolução da técnica. Como o material do polímero possui granulometria mais fina, é necessário a aplicação de altas pressões para se manter o fluxo de solução através da coluna. TEMA 2 – SEQUENCIAMENTO DE AMINOÁCIDOS Após a purificação de uma proteína, sua sequência primária de aminoácidos pode ser determinada. A chave do sequenciamento é dividir a proteína em pequenos fragmentos menores para que estes possam ser sequenciados e então unidos com auxílio da bioinformática. As informações sobre a sequência primária (ou seja, a sequência linear de aminoácidos) de uma proteína são essenciais para a compreensão de suas propriedades funcionais, para a sua identificação, assim como para a caracterização de proteínas mutadas que causam doenças. Conheça, na Figura 5, a estrutura das proteínas. As proteínas possuem uma conformação primária que corresponde à sua sequência linear de aminoácidos. Essa sequência pode ser determinada por técnicas como a reação de Edman ou por espectrometria de massa. As proteínas se enovelam adquirindo uma conformação terciária que é essencial para o funcionamento das proteínas. Essa conformação terciária pode ser estudada por técnicas como a ressonância magnética nuclear e a cristalografia de raios X. Figura 5 – Estrutura das proteínas Crédito: N.Vinoth Narasingam/Shutterstock. 2.1 REAÇÃO DE EDMAN O procedimento de degradação de Edman marca e remove apenas o resíduo aminoterminal de um peptídeo, deixando todas as outras ligações peptídicas intactas. Essa reação consiste em identificar de forma sequencial o aminoácido amino-terminal de uma cadeia polipeptídica. Nesse procedimento, Pehr Edman estabeleceu um método de marcação do aminoácido amino-terminal e clivagem deste sem romper as ligações peptídicas com os demais aminoácidos. Nessa reação, utiliza-se o isotiocianato de fenila que reage com a amina-terminal neutra desse grupamento formando o radical feniltiocarbamida. Com isso, libera-se um derivado cíclico do aminoácido amino- terminal deixando o restante da proteína intacta. Esse derivado cíclico pode ser identificado cromatograficamente. O método de Edman pode ser repetido a cada peptídeo encurtado, produzindo um novo derivado cíclico a cada etapa da reação, permitindo assim a identificação sequencial de todos os aminoácidos que compõem a proteína. Um ciclo de degradação de Edman é composto pela clivagem de um aminoácido e sua posterior identificação e demora cerca de 1 hora. As degradações repetidas permitem a identificação da sequência de aminoácidos de uma proteína. Em teoria, qualquer proteína poderia ser sequenciada por essa técnica, o que na prática não se demonstrou verdadeiro, pois a etapa de liberação do composto cíclico não tem eficiência de 100% e nem sempre o aminoácido amino-terminal libera o composto cíclico. Além disso, o tempo gasto em cada etapa da reação tornaria o sequenciamento de proteínas muito grandes extremamente demorado. A técnica de degradação de Edman tem interesse, basicamente, histórico. A espectrometria de massas costuma ser mais empregada atualmente para a obtenção simultânea da massa molecular e da sequência dos polipeptídios. Ambas as técnicas podem ser aplicadas diretamente às proteínas ou aos peptídeos recuperados da SDS-PAGE ou da eletroforese bidimensional em gel (IEF + SDS-PAGE). 2.2 SEQUENCIAMENTO USANDO ESPECTROMETRIA DE MASSA Inicialmente a proteína de interesse, que já foi previamente purificada, deve ser digerida em fragmentos menores com o uso de uma protease, em geral a tripsina. Lembrando que uma protease é uma enzima capaz de clivar as ligações peptídicas, logo irá clivar a proteína (que é um polipeptídeo) em fragmentos menores (pequenos peptídeos). A tripsina cliva especificamente a cadeia de peptídeos na região carboxílica ao lado de lisinas e argininas. Antes de sua digestão, as proteínas são tratadas com agentes desnaturantes (por exemplo o iodoacetato) que promovem a redução das pontes dissulfeto. Os fragmentos peptídicos são separados por cromatografia e cada fração do eluato é submetida separadamente à espectrometria de massa, que permitirá identificar quais são os aminoácidos constituintes daquele fragmento. Mas ainda resta uma dúvida: como ordenar os fragmentos peptídicos para obter a estrutura primária da proteína original? Isso é feito utilizando-se a técnica da superposição de peptídeos. Nessa técnica, a proteína purificada é tratada com uma outra protease, por exemplo a quimiotripsina, que cliva os peptídeos ao lado de aminoácidos de cadeia lateral cíclica. Os peptídeos originados pela quimiotripsina se superpõem aos peptídeos gerados pela tripsina, permitindo que sejam sobrepostos com o auxílio de um computador, permitindo o ordenamento destes. Figura 6 – Sobreposição e ordenamento de sequências peptídicas identificadas por espectrometria de massa Crédito: Daniele Dietrich Moura Costa. TEMA 3 – SDS-PAGE E WESTERN BLOT 3.1 SDS-PAGE A eletroforese em gel de poliacrilamida contendo dodecil sulfato de sódio (do inglês Sodium Dodecyl Sulfate Poliacrylamide Gel Electroforesis) é uma técnica que permite a separação de proteínas de acordo com sua massa molecular. Nessa técnica, as proteínas são preparadasem um tampão contendo SDS (dodecyl sulfato de sódio), um reagente que confere cargas negativas às proteínas. A separação eletroforética é executada em um gel que serve de peneira molecular, acentuando a separação. Quando submetidas a um campo elétrico, essas proteínas carregadas negativamente irão migrar em direção ao polo positivo. A migração acontece através da malha porosa de um gel de poliacrilamida (um polímero de acrilamida e bisacrilamida). As proteínas menores migram mais facilmente por esse gel, ocupando posições inferiores neste ao final da corrida eletroforética. Já as proteínas maiores têm maior dificuldade em passar pelos poros da malha do gel, ocupando posições superiores no gel ao final da corrida eletroforética. Moléculas de tamanho e carga semelhantes movem-se como uma banda única no gel. Além do SDS, as proteínas são tratadas também com um agente tiolíco, o beta mercaptoetanol, que desnatura as pontes dissulfeto das proteínas, conferindo uma conformação linear a elas. A conformação linear é essencial para que moléculas de mesma carga e massa molecular migrem igualmente, sem “entalar” nos poros do gel. Após a eletroforese, as bandas separadas podem ser visualizadas por uma técnica apropriada, como mergulhar o gel em uma solução de um corante que se liga fortemente às proteínas, sendo os mais utilizados o Comassie Blue e a prata. A prata é mais indicada para a detecção de proteínas presentes em menores concentrações na amostra (cerca de 0,02 µg), enquanto o Comassie Blue detecta proteína na ordem de 0,1 µg. A técnica de eletroforese seguida de coloração é tão precisa que permite que proteínas com diferenças em torno de 10 aminoácidos (o que corresponde a 40 KDa) possam ser distinguidas após uma corrida eletroforética. Observe, na Figura 7, o aparato de eletroforese ligado a uma fonte elétrica que cria um campo elétrico com um polo negativo acima e um positivo abaixo. Figura 7 – Aparato de eletroforese Crédito: WhiteDragon/Shutterstock. Na figura a seguir, a imagem à esquerda demonstra a aplicação das amostras nos poços do gel com o auxílio de uma micropipeta. À direita o resultado final da corrida eletroforética, com as proteínas menores ocupando posições inferiores e as maiores ocupando posições superiores. Figura 8 – Corrida eletroforética Crédito: Tali Lavy/Shutterstock. 3.2 WESTERN BLOT As diferentes técnicas de imunoensaios se baseiam no uso de anticorpos que reconhecem especificamente uma proteína de interesse (proteína-alvo). Esse tipo de ensaio é fundamental para identificar alvos moleculares, como por exemplo proteínas relacionadas ao câncer, bem como para entender as funções de uma proteína em seu contexto fisiológico. Se um anticorpo para uma proteína específica estiver à disposição, ele poderá ser usado para detectar de forma precisa a proteína separada anteriormente por SDS-PAGE na presença de muitas outras proteínas, em processo conhecido como immunoblot ou Western Blot. Nessa técnica, inicialmente as proteínas do gel devem ser transferidas para uma membrana de nitrocelulose. Isso porque o gel é poroso e não permite que as reações com anticorpos sejam realizadas sobre ele. Uma vez na membrana, utiliza-se um anticorpo específico para se ligar à proteína de interesse; esse anticorpo é denominado de primário. Como podem ocorrer ligações inespecíficas mais fracas, a membrana deve ser lavada com tampão, para que os anticorpos ligados inespecificamente se desliguem. Ao final das lavagens, apenas os anticorpos primários ligados especificamente às proteínas de interesse permanecem ligados. Para que a reação seja evidenciada, é necessária a utilização de um anticorpo secundário. Esse segundo anticorpo possui duas características essenciais: ele reconhece especificamente o anticorpo primário (mas não reconhece a proteína-alvo) e possui em sua região FC uma enzima capaz de emitir luminosidade quando fornecido o substrato adequado. O anticorpo secundário se liga ao primário e, ao se fornecer o substrato específico, todos os secundários irão emitir uma luminosidade que pode ser captada por meio de filmes fotográficos. A luminosidade será emitida especificamente para onde os anticorpos primários reconheceram e se ligaram à proteína de interesse, evidenciando a presença da mesma na amostra. Observe, na Figura 9, a reação de Western Blot (ou immunoblot). Em 1, as proteínas de interesse (em laranja) ligadas à membrana de nitrocelulose. Em 2, anticorpos primários específicos (em azul claro) reconhecem a proteína-alvo. Em 3, anticorpos secundários (em roxo) reconhecem os anticorpos primários. Observe que os anticorpos secundários possuem uma enzima (em verde) acoplada a sua região FC. Em 4, o substrato enzimático é fornecido e a reação emite um sinal que pode ser detectado. Figura 9 – Western Blot Crédito: Soleil Nordic/Shutterstock. TEMA 4 – ELETROFORESE BIDIMENSIONAL E ESPECTROMETRIA DE MASSA 4.1 ELETROFORESE BIDIMENSIONAL A eletroforese bidimensional consiste em uma etapa de focalização isoelétrica seguida de uma etapa de SDS-PAGE convencional. A combinação dessas duas técnicas permite separar com maior precisão as proteínas de uma amostra. A focalização isoelétrica consiste na separação das proteínas de uma amostra baseadas no seu conteúdo de radicais ácidos e básicos. O ponto isoelétrico (pI) de uma proteína é o pH no qual o balanço de cargas positivas e negativas é nulo. Uma dada proteína migra ao longo de um gradiente de pH até atingir seu pI. A focalização isoelétrica permite separar proteínas com diferenças em seus pIs de 0,01, ou seja, proteínas com apenas uma carga de diferença podem ser distinguidas por essa técnica. A focalização ocorre sobre uma fita contendo um gradiente de pH. Posteriormente à focalização, a fita de pH contendo as amostras focalizadas é colocada no topo de um gel de poliacrilamida. Nessa segunda etapa, as proteínas (que foram primeiramente separadas de acordo com seus pontos isoelétricos) serão separadas de acordo com suas massas moleculares. Esta técnica é denominada de bidimensional, pois as proteínas são separadas em duas dimensões perpendiculares entre si: a do ponto isoelétrico (horizontal) e a das massas moleculares (vertical). Isso permite altíssima precisão, dado que duas proteínas não possuem a mesma massa molecular e o mesmo ponto isoelétrico simultaneamente. Observe na Figura 10, a seguir, à esquerda, a fita contendo um gradiente de pH sobre o qual ocorre a focalização isoelétrica. Após a focalização, a fita de pH contendo as amostras de proteínas focalizadas em seus devidos pIs é colocada em contato com o gel de poliacrilamida (à direita). Ao final da corrida eletroforética, cada spot (mancha) representa uma proteína diferente. Figura 10 – Eletroforese bidimensional Crédito: Art of Science/Shutterstock. 4.2 ESPECTROMETRIA DE MASSA A eletroforese em gel bidimensional é uma valiosa ferramenta para o estudo do proteoma, que é definido como o conjunto completo de proteínas produzidas por um genoma em particular, sendo que seu campo de estudo envolve a catalogação de todas as proteínas expressas em uma célula, com ênfase em sua quantificação, localização, modificações, interações e atividades. As proteínas são extraídas e submetidas à eletroforese bidimensional em gel de poliacrilamida (2D-PAGE) formando spots proteicos nos quais cada proteína foi separada conforme sua massa molecular e seu ponto isoelétrico. Cada spot proteico selecionado é identificado por coloração, e a proteína correspondente a esse spot é então extraída do gel com o auxílio de um bisturi e digerida com proteases, gerando inúmeros peptídeos. Os pequenos peptídeos oriundos da digestão são sequenciados por meio da espectrometria de massas, o que possibilita a identificação da proteína. A espectrometria de massa é uma técnica capaz de detectar com precisão a massa de substâncias voláteis, mas como sabemos, as proteínas não são voláteis. Esse problema foi resolvido com odesenvolvimento da tecnologia MALDI (matrix-assisted laser desorption-ionization) e da tecnologia Electrospray ionization (ESI), ambas associadas a TOF (time of flight). No MALDI, as proteínas são ligadas a uma matriz que, ao ser estimulada eletricamente (por um laser), se torna ionizada e, portanto, volátil. Já no ESI, a solução contendo os peptídeos é aspergida a partir de um tubo capilar com alta voltagem formando finas gotículas carregadas que volatilizam rapidamente. Em ambas as técnicas, ao volatilizar, as proteínas entram num tubo de voo (por isso time of flight, “tempo de voo”) e são aceleradas por um campo elétrico; as mais leves chegam primeiro ao detector, e as mais pesadas demoram mais para chegar. O detector mede o tempo de voo das partículas em seu interior e correlaciona com padrões de massa pré-estabelecidos. Ao final do processo, o computador registra o espectro das massas detectadas (por isso a técnica se chama espectrometria). Figura 11 – Esquema representativo da espectrometria de massa do tipo MALDI-TOF Crédito: Daniele Dietrich Moura Costa. TEMA 5 – DETERMINAÇÃO DA ESTRUTURA TRIDIMENSIONAL DE PROTEÍNAS A função de uma proteína depende não apenas da sua sequência primária de aminoácidos, mas em última instância, da conformação tridimensional que esses aminoácidos adquirem no espaço. É essa conformação, por exemplo, que cria sítios catalíticos nas enzimas ou que conferem conformação específica aos anticorpos. As duas técnicas mais usadas para determinar a conformação tridimensional de uma proteína são a cristalografia por raios X e a espectroscopia por ressonância magnética. 5.1 CRISTALOGRAFIA DE RAIOS X A cristalografia de raios X, também conhecida como difração de raios X, consiste na difração de raios X pelos átomos que constituem uma amostra quando na sua forma cristalizada. Quando cristalizados, cada átomo da proteína apresenta a mesma conformação específica e a mesma orientação no espaço, formando uma malha tridimensional. Quando essa malha é submetida a um feixe de elétron, alguns atravessam a malha e outros são difratados. Um filme fotográfico é utilizado para detectar os elétrons difratados pelos cristais da amostra, formando uma imagem tridimensional da proteína. O cristal contendo a proteína é colocado entre uma fonte de raios X e uma anteparo (que é o detector). Um feixe de raios X incide sobre o cristal e um conjunto de pontos, chamados de reflexões, é gerado. Os pontos são gerados pela difração do feixe de raios X, e cada átomo da molécula faz uma contribuição para cada ponto. Um mapa de densidade eletrônica da proteína é reconstruído a partir do padrão total de difração, por uma técnica matemática chamada de transformada de Fourier. Esse mapa é gerado por um computador que analisa a imagem formada por cada ponto, transformando-a em um número plausível de análise. 5.2 ESPECTROSCOPIA POR RESSONÂNCIA MAGNÉTICA NUCLEAR Diferentemente da cristalografia, que requer que as amostras estejam cristalizadas, a espectroscopia por ressonância magnética nuclear (RMN) permite avaliar a estrutura de uma proteína em solução. Essa técnica se baseia no fato de que o núcleo de alguns átomos apresenta uma característica chamada spin, que é uma propriedade mecânico-quântica que gera um sinal detectável pela RMN. Quando os núcleos desses átomos são excitados por uma fonte de energia, eles mudam o estado rotacional de seus spins; ao retornar para o estado energético inicial, esses núcleos emitem um tipo de energia que pode ser detectada por RMN. O conjunto de todas as energias detectadas forma um espectro de RMN que permite estimar computacionalmente a estrutura tridimensional da proteína, em um processo extremamente trabalhoso que requer muitos conhecimentos técnicos-científicos. NA PRÁTICA A uma primeira vista, pode parecer que essas técnicas estão todas muito longe do dia a dia do biomédico, o que não é verdadeiro. Uma das técnicas mais utilizadas pela Patologia Médica é a identificação de proteínas marcadoras de tumores. Um exemplo clássico é a alfafetoproteína (AFP). Essa proteína está presente no recém-nascido e nas mulheres grávidas de forma fisiológica, mas está ausente nos adultos saudáveis. A presença de AFP em adultos é marcador de hepatocarcinoma, um tipo de câncer hepático. Quando se suspeita desse tipo de carcinoma, uma amostra de sangue do paciente é colhida e o plasma é processado para um ensaio de SDS-PAGE seguido de Western Blot. Anticorpos específicos para a AFP estão disponíveis comercialmente e são usados para detectar a presença desta proteína no plasma de pacientes suspeitos de hepatocarcinoma. É um teste pouco invasivo quando comparado a uma biópsia, que possui boa precisão e que pode ser realizado rapidamente (cerca de 24h para a realização de um SDS-PAGE seguido de Western), permitindo um diagnóstico precoce. FINALIZANDO Nesta aula, aprendemos como o DNA direciona a síntese de proteínas e como podemos proceder para analisar essas moléculas. Primeiramente, devemos ser capazes de extraí-las das células e purificá-las, sendo que diferentes técnicas de purificação podem ser aplicadas de acordo com a experiência do pesquisador e a disponibilidade de reagentes em seu laboratório. Uma vez extraídas e/ou purificadas, essas proteínas podem ser usadas em uma gama de ensaios. O sequenciamento permite identificar a estrutura primária das proteínas. Já a cristalografia de raios X e a espectroscopia por RMN permitem reconstruir a estrutura terciária das proteínas. O SDS-PAGE permite determinar a massa de uma proteína específica em meio a várias outras proteínas de uma amostra. O Western Blot é um imunoensaio que permite detectar uma proteína específica que tenha sido previamente separada por eletroforese. Já a eletroforese bidimensional permite isolar proteínas de acordo com seu ponto isoelétrico e sua massa molecular, permitindo uma isolamento e identificação muito mais precisos quando comparados ao SDS-PAGE. Com todo o conhecimento obtido nesta aula, associado ao conhecimento adquirido nas aulas anteriores sobre Biotecnologia, você está pronto para desbravar o universo da pesquisa científica que envolve os ácidos nucléicos e as proteínas. Mãos à obra e boa sorte! REFERÊNCIAS ALBERTS, B. et al. Fundamentos de Biologia Celular. 6. ed. Porto Alegre: Ed. ArtMed, 2017. ALBERTS, B. et al. Biologia Molecular da Célula. 6. ed. Ed. Porto Alegre: ArtMed, 2017. LODISH, H. et al. Fundamentos da Biologia Celular. 7. ed. Porto Alegre: Editora Artmed, 2015. MARSHALL, W. J.; LAPSLEY, M. Bioquímica Clínica: Aspectos Clínicos e Metabólicos. Rio de Janeiro: GEN Guanabara Koogan, 2016. SMITH, C.; MARKS, A. D.; LIEBERMAN, M. Bioquímica Médica Básica de Marks. Porto Alegre: Artmed, 2007. BIOTECNOLOGIA E BIOINFORMÁTICA AULA 4 Prof. Benisio Ferreira da Silva Filho CONVERSA INICIAL ERA DAS CIÊNCIAS ÔMICAS PÓS ACÚMULO DE CONHECIMENTO COMO FOI A EVOLUÇÃO DO CONHECIMENTO EM BIOTECNOLOGIA Hoje nós temos conhecimento sobre nossa informação genética, sobre a genética de microrganismos e manipulamos essas informações. Para que isso fosse possível, muitas pesquisas foram realizadas previamente, muitos dados gerados foram validados, compreendidos até serem aplicados no desenvolvimento de técnicas e equipamentos que permitiram avanços na área da saúde, agronegócios e farmacológicos. Vamos conversar sobre esse histórico da Biotecnologia de forma simples e leve, fazendo você entender definitivamente que o que sabemos e fazemos hoje é fruto do acúmulo de conhecimento secular. Hoje, uma técnica como a PCR ou o monitoramento genético parece óbvio, mas você irá compreender como chegamos até aqui, até a era pós-genômica. TEMA 1 – BIOTECNOLOGIA EXISTE HÁ SÉCULOS O real conceito de Biotecnologia é o uso de elementos biológicos como ferramentas. Logo, produzir algo por meio do uso de microrganismos e enzimas é um trabalho biotecnológico. Produzir pão por meio de fermentação, produzir queijos e bebidasé um trabalho biotecnológico. Entendo que a imagem que vem à sua cabeça é aquele laboratório “hi-tech”, mas o conceito é simples e te ajuda a entender. Há alguns autores que tentam explicar que o manejo e domesticação de animais, bem como técnicas de agricultura também é biotecnologia, porém, pessoalmente não acredito ser algo a se relacionar. Além de atrapalhar no entendimento do futuro biotecnólogo moderno. Melhor ficar com o conceito de usar elementos biológicos como ferramentas. No lugar de tesouras para produzir cortes, colas, parafusos e lâmpadas, podemos usar enzimas, ácidos nucléicos e moléculas que brilham para realizar trabalhos e produzir coisas, produtos. Um trabalho de engenharia a nível molecular. Por exemplo, preciso cortar um elemento A. Vou usar o elemento B dividindo A em dois pedaços. Se o elemento A for um DNA e o elemento B uma proteína com função de enzima específica para ácidos nucléicos (Nuclease) vou cortar esse DNA em dois pedaços. Isso pode ser útil de alguma forma, por exemplo para genotipagem por RFLP. Tivemos avanços na produção de medicamentos, metodologias de pesquisa científica, compreensão de doenças, aumento da produção de alimentos, melhores formas de diagnósticos e por fim, maior conhecimento sobre nós humanos e sobre organismos de interesse médico. A Biotecnologia representa uma área do futuro, pois o que ela faz só é possível após dois séculos de conhecimento e abriu portas para uma imensa quantidade de dados que com certeza levarão mais um século para serem analisados, compreendidos e dominados, gerando assim mais produtos. 1.1 CONHECIMENTO IDENTIFICANDO AS FERRAMENTAS DE BIOTECNOLOGIA Tudo que aprendemos em química, biologia celular, matemática e física permitiu que identificássemos elementos e criássemos meios de análise e investigação e produção culminando em mais avanços a humanidade. Os primeiros trabalhos de Mendel não falavam de DNA, muito menos de genes, mas mostraram que era possível identificar a existência de fatores transmitidos através das gerações de forma organizada, o que permitida que análise estatística predissesse o que poderia ocorrer após o cruzamento de dois indivíduos nas próximas gerações. Além disso Mendel mostrou que era possível entender também a possibilidade de duas características se misturarem dando origem a um terceiro fenótipo. Figura 1 – Gregor Mendel e sua experiência com plantas de ervilha. Um monge austríaco e um cientista que lançou as bases da genética Crédito: Yeti Crab/Shutterstock. Vários cientistas realizaram trabalhos importantes para o acúmulo de conhecimento e uso deste nos avanços. Merece destaque aqui neste texto também Charles Darwin, que com seu trabalho de observação mostrou a adaptação dos organismos em diferentes regiões de acordo com a necessidade de cada um. O organismo sofrendo mudanças para sobreviver ao meio em que vive. Seria também um trabalho daqueles fatores transformadores que Mendel havia descrito? Figura 2 – O naturalista e geólogo Charles Darwin com a teoria da evolução Crédito: Yeti Crab/Shutterstock. Merecem destaque aqui também, dentre centenas de cientistas, os que desenvolveram e apresentaram informações sobre física, química e biologia. Os dados gerados por tantos cientistas apontaram a direção para o progresso. Muito importante para Biotecnologia, o conhecimento em microbiologia gerado por Frederick Griffith, cujo experimento mostrou que bactérias são capazes de transferir informação genética, transformando e alterando o fenótipo de bactérias (primeiro exemplo de transferência de DNA, transformando organismos), permitiu aumentar o desejo pelo controle dessa poderosa informação. Conhecer, entender e manipular o DNA poderia então ser a chave para cura de doenças, melhorias da saúde humana e de forma muito ambiciosa, naquela época, alguns cientistas falavam em prolongar a vida. Sendo assim, todas as áreas de conhecimento iam realizando seus trabalhos, dessa forma contribuindo com avanços. É muito importante mostrar para você aluno de Biomedicina que os avanços discutidos aqui não dependem exclusivamente do conhecimento em Biologia, Biologia Molecular e Genética, pelo contrário, dependem muito do que aprendemos em física, química e matemática. Sequenciar DNA por exemplo, só é possível devido ao novo conhecimento em física, química, matemática e biologia celular e genética. União de conhecimento é o que promove avanços. Continuando a informação sobre essa busca pelo entendimento e domínio do DNA, o bioquímico austríaco Erwin Chargaff através de seus estudos mostrou que a “nucleína”, o ácido nucléico, tinha uma composição química bem específica. Ele mostrou que havia uma proporcionalidade entre cada um dos tipos de bases nitrogenadas. Seus dados mostraram que havia uma clara relação entre Adenina e Timina, podendo haver diferença entre a quantidade em diferentes organismos, porém a proporção entre Adenina e Timina de cada organismo era sempre a mesma e a proporção mesmo em diferentes quantidades encontradas em outros organismos também se mantinha a mesma. Ex: No organismo A – quantidade de Adenina detectada corresponde a 22,5%, é observado que a quantidade de Timina também é de 22,5%. Consequentemente a quantidade de Citosina é de 27,5% e de Guanina de 27,5%. No organismo B – Adenina 26,3% - Timina 26,3% / Citosina 23,7% - Guanina 23,7%. Há uma clara relação entre Adenina e Timina e entre Citosina e Guanina. Figura 3 – Regra de Chargaff: Ligação entre Adenina e Timina e entre Citosina e Guanina em todos os organismos Crédito: Art Of Science/Shutterstock. Hoje nós sabemos, mas lá nos anos 1940 essa informação foi muito importante e ajudou a explicar o que foi observado por meio de experimentos com difração de raios X realizados por Rosalind Franklin. Ela fotografou a organização dos elementos que compõem o DNA e a imagens geradas por ela foram decisivas para que Watson e Crick, juntando todas as informações disponíveis à época, estabelecessem o que seria a estrutura tridimensional do DNA, trabalho este publicado em 1953. Figura 4 – Química Inglesa Rosalind Franklin que por meio de seus trabalhos por cristalografia e difração de raios-X, produziu imagens decisivas para elucidação da estrutura tridimensional do DNA pelos pesquisadores Watson e Crick Crédito: Yeti Crab/Shutterstock. No início dos anos 1950, logo após a publicação do trabalho de Watson e Crick e com todo o conhecimento da época mostrando que aqueles fatores de Mendel, as descobertas de Darwin, Griffith, Chargaff e tantos outros mostrando que a informação do que define o organismo é o DNA, iniciou a corrida para os trabalhos de manipulação e domínio dessas informações. O próprio Francis Crick logo após o trabalho sobre a estrutura do DNA deu continuidade aos seus estudos e em 1957 junto com seus pesquisadores do clube do RNA escreveram o Dogma Central da Biologia Molecular, publicando essa informação em 1958. Sendo assim, naquela época, tudo estava preparado havia bastante conhecimento, sabiam da estrutura do DNA e existia as explicações biológicas que somadas ao Dogma de Crick mostravam que a informação de todos os organismos estava no DNA e quem dominasse essa informação dominaria os organismos. Começa a corrida para melhor entendimento dos genomas. Figura 5 – Dogma Central da Biologia Molecular: A informação contida no DNA é transcrita em RNA e traduzida em Proteína. Os organismos funcionam porque produzem proteínas, sendo a construção destas proteínas, dependente do que está escrito no DNA Crédito: Fancy Tapis/Shutterstock. TEMA 2 – OS AVANÇOS E AS PRINCIPAIS TÉCNICAS O que faz um organismo funcionar é a interação entre suas proteínas/enzimas com diversos elementos químicos, ocorrendo assim eventos bioquímicos dentro e fora das células. De uma célula procarionte (bactérias e algas unicelulares) a eucariotos, a informação contida no DNA determina se ela vai funcionar bem ou não, se será alguma vantagem ou desvantagem, sehá uma doença genética ou não. Logo, conhecer como se organiza e o que expressa a informação genética dos organismos e do homem é (de acordo com o pensamento da época) ter domínio sobre o organismo. Muito se falava a época sobre a cura de todas as doenças. 2.1 SEQUENCIAMENTO DE PROTEÍNA E DNA POR FREDERICK SANGER: 2 NOBEL Obviamente, existem diversas técnicas. Por exemplo, em 1961, Marmur e Doty descobriram a renaturação do DNA, estabelecendo de vez a especificidade e viabilidade de reações de hibridização de ácidos nucleicos; em 1962, Arber e seus colaboradores apresentaram ao mundo a existência das enzimas de restrição e a possibilidade de seu uso para caracterizar diferentes DNAs de diferentes organismos (princípio da genotipagem); em 1966, Niremberg, Ochoa e Khorana elucidaram o código genético (importante na compreensão final do dogma central da Biologia molecular); em 1967, Gellert e seus colaboradores descobriram a DNA Ligase, a enzima que liga fragmentos de DNA; em 1972, técnicas de clonagem e de recombinação de DNAs são apresentadas por Boyer, Cohen e Berg. São só algumas das ferramentas de Biotecnologia que foram estudadas e desenvolvidas antes dos anos 1980. Mas ganha destaque mesmo, neste momento, apresentar Frederick Sanger, bioquímico inglês que ganhou dois prêmios Nobel. O primeiro, quando descreveu a metodologia para sequenciar uma proteína e determinar a sequência de aminoácidos da insulina, o que nunca havia sido feito antes, porém foi apresentado por ele em 1955. Usando química e cromatografia e misturando técnicas padrão com novas, ele desenvolveu um método para ler a sequência de aminoácidos da insulina e descobriu que essa proteína é na verdade composta de duas cadeias de aminoácidos unidas por ligações dissulfeto. Ele usou uma metodologia de hidrólise ácida da proteína de forma controlada, observando os aminoácidos que eram separados por cromatografia. Ganhou o primeiro Nobel em 1958. Figura 6 – A estrutura básica das proteínas é essa organização linear dos aminoácidos conhecida como estrutura primária. O trabalho de Sanger mostrou como separar os aminoácidos e entender a ordem na proteína insulina. Metodologia importantíssima, que impulsionou a Biotecnologia moderna Crédito: TATLE/Shutterstock. O segundo feito importantíssimo para Biotecnologia realizado por Sanger foi a metodologia de sequenciamento do DNA. Sanger desenvolveu o processo de incorporação seletiva de “didesoxinucleotídeos” (dNTP) pela DNA polimerase durante a replicação in vitro do DNA. Esses didesoxinucleotídeos são nucleotídeos modificados quimicamente que não possuem a hidroxila no carbono 3 da pentose e recebem um fluoróforo como marcação. À medida que os nucleotídeos estão sendo incorporados pela DNA polimerase, no momento que um didesoxinucleotídeo é incorporado, outros não serão, produzindo então vários fragmentos com tamanhos diferentes com um dNTP no final dos fragmentos, sendo então todos esses separados por eletroforese. Figura 7 – Antes do surgimento dos sequenciadores de DNA por eletroforese capilar, esse era o modo de análise dos DNAs sequenciados. Sequenciamento de até 5.000 pares de base, com destaque para o DNA mitocondrial Humano Crédito: Gopixa/Shutterstock. TEMA 3 – ERA PRÉ-GENÔMICA E PÓS-GENÔMICA NA VISÃO DA SAÚDE A Biotecnologia é muito mais que discutirmos aqui os trabalhos com ácidos nucléicos. Ela mudou para melhor a indústria e os agronegócios, mas nosso foco aqui, para futuros biomédicos, é a parte do impacto para ciências da saúde: a era pré e pós-genômica. Após diversas informações, dados e desenvolvimento de técnicas para análise e melhor compreensão da informação e formação fenotípica dos organismos, iniciou-se obviamente uma corrida para de alguma forma ter vantagens comerciais. Sim, infelizmente o que move a ciência não é necessariamente a curiosidade natural do cientista, e sim, a economia, o poder militar e uma necessidade pós-catástrofe. No caso do período pré e pós‑genômico havia sim uma ambição em ganhar muito com meios supostamente fáceis de curar doenças e produzir medicamentos mais eficientes e personalizados. Após o conhecimento obtido pelo Dogma Central da Biologia Molecular, a confirmação do poder transformante do DNA, e que, quando transferido, transformava o organismo que o recebia, além das técnicas de manipulação do DNA, fragmentando-o e colando esses pedaços, deixando-o funcional em outro organismo (Boyer, Cohen e Berg em 1972, com a técnica de clonagem), foram elaboradas estratégias para sequenciar o genoma de organismos. TEMA 4 – ERA PRÉ-GENÔMICA Vamos organizar essa apresentação das ciências ômicas em dois momentos: era pré-genômica, até o momento da publicação do Genoma do Haemophilus influenzae em 1995, e era pós-genômica de 1995 até os dias atuais. 4.1 O CAMINHO ATÉ O PRIMEIRO GENOMA COMPLETAMENTE SEQUENCIADO O objetivo agora, após o acúmulo de conhecimento já citado, era sequenciar o genoma humano. Nos anos 1970 muita coisa importante aconteceu, e iniciou-se o desenvolvimento e aplicação desse conhecimento. Por exemplo, já haviam sido realizadas as primeiras expressões heterólogas culminando no surgimento da primeira empresa de Biotecnologia a Genetech, inc. em 1976. Em 1982, após aprovação pelo FDA, começou a comercializar o produto Humulin (primeira insulina humana geneticamente modificada). Muitos outros produtos biotecnológicos foram produzidos. A década de 1970 mostrou que era possível manipular o DNA, fazê-lo ser expresso em outro organismo e até mesmo sequenciar o DNA, lendo a ordem de seus nucleotídeos. Começou então o sequenciamento de pequenas informações genéticas, de microrganismos, até que começaram a ousar mais: começaram a almejar o genoma humano. A primeira parte do genoma humano a ser sequenciado foi o DNA mitocondrial, devido ao seu pequeno tamanho (16.569 pares de base); esforços foram realizados até que em 1981 foi publicado o fim do sequenciamento do DNA mitocondrial. Nos anos 1980, houve mais descobertas (destaque para desenvolvimento da técnica de PCR) e o surgimento do NCBI (National Center for Biotechnology Information), organizando e tornando pública informações sobre o desenvolvimento da Biotecnologia. Porém, o mais importante foram todas as negociações para que o maior de todos os projetos fosse inicializado, o Projeto Genoma Humano (PGH). Pensado e planejado ao longo dos anos 1980, confirmado em 1988, foi iniciado após o financiamento do departamento de energia dos Estados Unidos. Inicialmente, imaginava-se que duraria 15 anos até a conclusão do sequenciamento e organização da informação. Todos esses trabalhos exigiram que fossem desenvolvidos equipamentos para fins biotecnológicos, como por exemplo, termocicladores, os primeiros sequenciadores de DNA e também, acompanhando todo esse desenvolvimento, os avanços naturais da informática eram naturalmente incorporados. Chegou a um ponto em que perceberam que a quantidade de dados e de informação era tão grande que, se não houvesse um sistema computadorizado para analisar e guiar os cientistas na análise e montagem das sequências, o trabalho ficaria tão difícil que os 15 anos previstos poderiam facilmente se tornar (devido à tecnologia à época) 50 anos. Figura 8 – Projetos genoma são ricos em informação. Hoje nós sabemos que sem o uso de computadores o trabalho seria impossível Crédito: Majcot/Shutterstock. Por necessidade, surgiram melhores equipamentos, um uso mais eficiente do sistema de informática, softwares específicos para análise das sequencias (BLAST, principal software de Bioinformática, criado e publicado em 1990 por Stephen Altschul). Iniciado o trabalho de sequenciamento, havia a dificuldade de entender o tamanho do volume de informação contida ali. Eram centenas de milhares de GCTA (guanina, citosina, timina e adenina). Para organizar, era necessário elaborar uma estratégia de montagem das informações do DNA sequenciado e isso exigia mais poder de processamentodos computadores, mais armazenamento de dados e um genoma menor para testar essa nova metodologia de sequenciar genomas. A ideia era fragmentar o genoma, pegar esses pedacinhos de DNA e cloná‑los em bactérias (técnica de 1970), criando assim uma biblioteca, sequenciar os pedacinhos e por meio de programas especiais de computador ir montado o genoma como se fosse um quebra-cabeça. Essa metodologia recebeu o nome de “Shotgun”: o DNA era extraído, fragmentado por sonicação (fragmentar através de ondas sonoras), organizada a biblioteca genômica por clonagem em bactérias e sequenciamento dos fragmentos clonados. Como ponto de partida escolheram pela simplicidade e escolheram a bactéria Haemophilus influenzae. A união dessas estratégias biotecnológicas, mais o poder de processamento dos computadores à época permitiu concluir o sequenciamento inteiro do genoma desta bactéria. O mundo conhecia em 1995 o primeiro genoma completamente sequenciado pelo homem. A partir desse ponto, entenderam a importância da análise de dados genômicos por computador e nascia oficialmente a Bioinformática. Além disso, houve a necessidade de mais avanços nos equipamentos utilizados. Inicia-se uma era em que o mundo sabe sequenciar genomas, inicia-se então a era pós-genômica. TEMA 5 – ERA PÓS-GENÔMICA Em 1995, o mundo aprendeu por meio da publicação do genoma do Haemophilus influenza a sequenciar um genoma completo. Imagine o potencial de tudo isso: ter a informação genética a serviço da saúde, da indústria farmacêutica, melhorando alimentos. Com tamanho potencial a partir de 1995 explodiram os projetos genoma e paralelamente, à medida que os avanços iam acontecendo, o projeto genoma humano. Nosso genoma é gigantesco e complexo, e fomos descobrindo isso à medida que ia sendo sequenciado. E aí veio um detalhe importante: Como saber que o que estava sendo sequenciado estava realmente certo? Bioquimicamente, sabemos que proteínas com estrutura e sequência de aminoácidos similar, muito similar entre si, indicam que possuem mesma função bioquímica. Por exemplo: a insulina bovina, suína, canina e a humana possuem uma estrutura tridimensional e a sequência de aminoácidos tão parecida, mas tão parecida, que sabemos que elas possuem a mesma função. A insulina humana, tem a mesma função biológica da insulina do cão, a mesma função da insulina do porco e do boi por exemplo. Se elas possuem mesma função devido a essa similaridade é porque a informação genética para construir essa proteína em diferentes organismos deve ser a mesma. O conhecimento que temos de que a informação contida no DNA expressa uma RNA que é traduzida em proteína vale para todos os organismos. Então os cientistas pensaram: “Se nós conseguirmos sequenciar organismos mais simples, e começarmos a identificar esses genes, podemos ir avançando no sequenciamento de organismos mais complexos, validando a identificação desses genes por comparação em Bioinformática até termos informação suficiente para identificarmos com segurança, genes humanos”. E assim foi feito, vários e vários organismos foram sequenciados na segunda metade dos anos 1990. 5.1 NASCE A GENÔMICA COMPARATIVA A quantidade de organismos sequenciados foi enorme. A quantidade de projetos genoma nos cinco continentes (O Brasil participou do consórcio internacional de sequenciamento do Genoma Humano e também possuía seus próprios projetos, sendo o maior e mais importante o sequenciamento da Xylella fastidiosa) foi gigantesca se comparada com os dias atuais. Na época houve uma corrida pela obtenção dessa informação com intenções econômicas (claro) e com intenções de melhorias na saúde e nos agronegócios. A comparação entre diferentes genomas ajudou muito na identificação de genes. Nós humanos temos informações genéticas encontradas em outros organismos. Sequenciando outros organismos, ficou fácil confirmar que o que sequenciamos em nosso DNA estava certo. Isso também ajuda a explicar por que podemos e devemos usar organismos modelos em diferentes tipos de experimentos relacionados a pesquisa em ciências da saúde, sendo esses organismos, desde de uma simples mosca das frutas (Drosophila melanogaster) até o cão (Canis lupus familiaris). Com tanta informação, final dos anos 1990 (por volta de 1998) os primeiros sequenciadores de DNA com vários capilares (o que acelera o processo de sequenciamento) impulsionou melhorias e a obtenção de mais dados. Por conta das melhorias, mais informações, avanços tecnológicos da informática e “concorrência” (na metade dos anos 1990, o PGH ganhou um concorrente o Craig Venter Institute) o que estava previsto no início, finalizar o genoma humano em 15 anos, diminuiu para 13 anos. Em 14 de abril de 2003 foi anunciado a conclusão do Projeto Genoma Humano. Figura 9 – Com a conclusão do projeto genoma humano e de tantos outros, começaram as pesquisas para o uso dessas informações Crédito: Eetu Mustonen/Shutterstock. Os impactos foram imensos. Melhoria nos diagnósticos de patógenos, testes e diagnósticos de inúmeras doenças genéticas, começo da farmacogenômica e estabelecimento definitivo das ciências ômicas. Genômica, transcriptômica e proteômica, cada uma dessas estudando uma parte específica do Dogma Central da Biologia Molecular. Houve uma expansão e mais estudos que levaram à interatômica, metabolômica e farmacogenômica, entre outras. De fato, com o conhecimento que temos hoje, sabemos que o que se imaginava nos anos 1980 não é tão fácil, não é tão simples. Ter a informação genômica não é suficiente; entender quando uma informação é expressa, com quem interage, qual a ação em outras células é muito importante. Saber como realmente funcionam as células, os tecidos e o organismo. Figura 10 – Temos muito trabalho pela frente. O Projeto Genoma Humano foi apenas o início. Tem muito a ser estudado ainda para real compreensão do funcionamento bioquímico da vida Crédito: Meletios Verras/Shutterstock. NA PRÁTICA A melhor compreensão de tanta revolução é você perceber como a medicina mudou tanto, principalmente na área genética ou em áreas que se relacionam com a Genética. Tente listar quantos exames genéticos estão disponíveis no laboratório mais próximo da sua casa. FINALIZANDO Esse pequeno histórico mostra como o acúmulo de conhecimento é importante para o desenvolvimento de tudo que usamos hoje. BIOTECNOLOGIA E BIOINFORMÁTICA AULA 5 Prof. Benisio Ferreira da Silva Filho CONVERSA INICIAL CIÊNCIAS ÔMICAS – APENAS SEQUENCIAR DNA NÃO É SUFICIENTE. SABER COMO FUNCIONA A VIDA É O OBJETIVO Com tanta informação disponível, o que fazer? Surgiram novas áreas de estudo, todas elas com um volume de informação tão grande que, mesmo que você esteja discutindo dados biológicos, precisará de um recurso computacional que permita analisar de forma organizada tudo isso. Sem computadores não há biotecnologia moderna, nem chegaríamos ao fim do Genoma Humano. Antes de apresentar a Bioinformática, vamos estabelecer a definição das diferentes áreas de estudo que compõem as ciências ômicas, que só existem devido ao desenvolvimento da Bioinformática. TEMA 1 – DOGMA CENTRAL DA BIOLOGIA MOLECULAR IN SILICO O Dogma Central da Biologia Molecular é analisado em ambiente virtual, seus dados sendo analisados por computadores. Essa análise por computadores, simulações biológicas em ambiente virtual, é a definição de análises in silico. Temos os testes in vivo (realizados em organismos modelo), in vitro (simulações em ambiente controlado, em laboratório, com metodologias controladas em escalas menores) e agora as simulações por meio de softwares, experimentos virtuais, modelagem computacional; isto, é o trabalho in silico. Figura 1 – Fluxo da informação de todo organismo. A informação do DNA, contida nos genes, é expressa em RNA mensageiro que é traduzida em Proteína. E o DNA é replicado para duplicar células Cada uma das partes é estudada e uma complementa a outra. Vamos apresentar de forma organizada. 1.1 GENÔMICAFigura 2 – Informação do Genoma do organismo. Sequenciamento de todos os cromossomos, ou do único DNA (ou RNA no caso de alguns vírus) A genômica estuda o genoma, faz identificação e localização das ORFs (Open Read Frames – sequências de DNA que possuem estrutura de genes, mas não são consideradas genes até ficar provado que é), procura confirmar genes por comparação com outros já bem conhecidos, inferindo assim possíveis funções. Genômica Comparativa: tem por objetivo comparar todo conteúdo do DNA com outros já conhecidos e, assim identificar diferenças, que podem ser responsáveis por propriedades fenotípicas ou evolutivas, como patogenicidade, reações a condições ambientais... Porque é importante comparar com outros organismos, DNA sendo comparado com DNA? Porque se uma sequência A é muito parecida com B e eu sei a função de A, devido à similaridade eu posso inferir que B tem a mesma função de A. Revise o que você aprendeu em genética sobre a sequência dos genes e o código genético. Figura 3 – O primeiro e mais simples nível dos estudos das ômicas Crédito: Ktsdesign/Shutterstock. 1.2 TRANSCRIPTÔMICA Figura 4 – Análise do que é expresso, sequenciamento dos RNA mensageiros Também chamada de “genômica funcional”. É o estudo de todo RNA mensageiro. Informação em constante mudança, não é fixa e pode ser rapidamente reestruturada pela mudança no nível de síntese de RNAm específicos. Porém, é a parte que apresenta para diferentes células em diferentes situações expressões de diferentes genes. É uma forma de entender como uma célula responde a estímulos, aumentando a expressão de genes, diminuindo a expressão ou mantendo a expressão. Logo, quando uma célula é de qualquer forma estimulada, seja por exposição a algo ou estímulo físico, sabe-se como a célula muda a expressão de genes. Essa informação é muito importante. Doenças apresentam mudanças de expressão gênica, doenças genéticas. Células neoplásicas possuem mudanças significativas de expressão de genes. Figura 5 – A fita simples do RNA mensageiro fala muito sobre o funcionamento de uma célula, consequentemente de um organismo Crédito: Soleil Nordic/Shutterstock. 1.3 PROTEÔMICA Figura 6 – O que faz um organismo funcionar é a interação e trabalho de suas proteínas com outras proteínas e com outros compostos presentes no meio. Saber a origem e como elas são constituídas é importantíssimo Investigação do que torna um organismo funcional. A proteômica tenta descrever o conjunto completo de proteínas, fornecendo informações importantes para complementar os estudos de transcriptômica e principalmente da metabolômica. Se as proteínas são sintetizadas no ribossomo de acordo com a informação que chega pelo RNA mensageiro, a confirmação delas é importante para identificar também os pseudogenes. Uma sequência de DNA transcreve um RNA e esse RNa pode dar origem a uma proteína? Então é um gene. Uma sequência de DNA parece um gene (tem uma sequência parecida com outro gene) mas não transcreve um RNA funcional ou nem transcreve nada? Não é um gene, devido à similaridade com outra sequência que é um gene, ele é chamado de pseudogene. Figura 7 – A forma de uma proteína e sua função dependem da sequência de aminoácidos, que depende da sequência de nucleotídeos do RNAm, que vem do DNA Crédito: Designua/Shutterstock. TEMA 2 – A EXPANSÃO DAS CIÊNCIAS ÔMICAS Saber quantos são os genes, onde eles estão, identificar os RNAs mensageiros e identificar as proteínas não é suficiente para compreender como funcionam os organismos. Existem centenas de interações entre as proteínas e isso precisa ser identificado e compreendido. Das informações das interações entre as proteínas e suas consequências, surgiu primeiro a interatômica, que quando comparada com a metabolômica é vista como algo mais simples. Na interatômica você analisa de forma pontual uma ou duas interações, a quantidade de interações é muito menor quando comparada a metabolômica, que constrói mapas metabólicos com todas as interações possíveis de um determinado tipo celular em diferentes situações (investigando a resposta celular em diferentes situações). Figura 8 – Interação e resultado de proteínas, uma pequena parte de vias metabóticas ou mesmo a interação de proteínas receptoras com proteína sinalizadora. Essa é a interatômica A produção de dados e descrição dos eventos em larga escala de interações proteicas é um desafio. Mesmo que o projeto Genoma Humano tenha sido finalizado, ainda há muito para estudarmos. A quantidade de informação é tão grande que a metabolômica será a área das próximas décadas. É, por conta de seus dados que estão sendo gerados algumas subáreas como a farmacogenômica surgem. Uma vez que há a possibilidade de entender e obter dados da transcriptômica e proteômica, direcionar o tratamento de forma específica é uma realidade. A dose de um medicamento pode ser ajustada de acordo com a resposta específica e pessoal ao medicamento. A dose de 100 mg pode ser eficiente para uma pessoa, enquanto que apenas 80 mg seria igualmente eficiente para outra. Essa precisão pode ser obtida por meio do estudo e desenvolvimento da interatômica, metabolômica culminando na especificidade de aplicação dos dados na farmacogenômica. A possibilidade de usar a evolução genômica para a identificação de novos genes que são regulados por drogas é o próximo passo. Figura 8 – Obtenção da informação de todo o mecanismo de funcionamento celular Figura 9 – Futuro próximo, em breve, nossos medicamentos serão personalizados, serão produzidos de acordo com nossas informações genéticas Crédito: Gorodenkoff/Shutterstock. TEMA 3 – ALÉM DA SAÚDE, A MANIPULAÇÃO GENÉTICA Mais um ponto a ser discutido aqui. Começando nos anos 1970, a clonagem, a produção de “DNA recombinante” e com os devidos avanços das técnicas permitindo que o gene do organismo A, foi adicionado ao genoma do organismo B e foi expresso. Essa recombinação de DNA é uma metodologia importantíssima e utilizada de diferentes formas. Para que isso ocorra, a forma mais simples é estabelecer qual o seu gene (que é uma sequência de DNA) e onde ele será inserido. O DNA recombinante é justamente esse DNA montado. Quimicamente não há diferença; tanto faz para célula: se ela for estimulada e esse estímulo acionar a maquinaria nuclear para expressar o gene que foi inserido, ele será transcrito em RNA mensageiro e em seguida traduzido em proteína. Veja bem, a célula que recebeu esse “DNA recombinado” não sabe que ele é recombinado, então vai expressar sempre que houver estímulo. 3.1 MONTANDO O DNA RECOMBINANTE A forma mais simples de realizar esse tipo de procedimento é usando um dos DNA mais simples, o plasmídeo. O plasmídeo é um DNA circular, pequeno (com poucos pares de base), encontrado em bactérias e de fácil extração e manipulação. Ele é um DNA extra, separado do DNA cromossomal da bactéria. Figura 10 – Estrutura de uma bactéria. Observe que além do DNA cromossomal, há ali em amarelo um DNA circular extra – aquele é o plasmídeo Crédito: Mallymoya/Shutterstock. Os plasmídeos possuem um pequeno número de genes, e boa parte destes está associada à resistência a antibióticos, além de serem compartilhados entre as bactérias (isso mesmo, as bactérias trocam informações entre si, passando plasmídeos de uma para outra). Existe também um mecanismo que faz o plasmídeo ser duplicado de forma independente, fazendo com que uma bactéria multiplique esse plasmídeo dentro dela, podendo compartilhar e ficando com alguns. Por conta dessa simplicidade e possibilidade de compartilhamento, o plasmídeo foi utilizado como um vetor para receber um fragmento de DNA contendo um gene (gene de outro organismo, não o da bactéria) e ser expresso pela bactéria. Imagine o seguinte: um gene humano sendo recombinado com um plasmídeo bacteriano e logo em seguida sendo inserido na bactéria. A bactéria com o plasmídeo recombinado vai expressar o gene humano, produzindo então uma proteína humana.Usa-se os plasmídeos como ferramentas para clonar, transferir e manipular genes. Os plasmídeos usados experimentalmente para esses fins são chamados de vetores. Os pesquisadores podem inserir fragmentos de DNA ou genes em um vetor de plasmídeo, criando o chamado plasmídeo recombinante. Esse plasmídeo pode ser introduzido em uma bactéria por meio do processo denominado transformação. Então, como as bactérias se dividem rapidamente, elas podem ser usadas como fábricas para copiar fragmentos de DNA em grandes quantidades. Figura 11 – Processo de fissão bacteriana, consequentemente multiplicação do plasmídeo também Crédito: Aldona Griskeviciene/Shutterstock. Explicando melhor, pequenos pedaços de DNA, como o DNA humano, podem ser anexados a plasmídeos. Cada célula bacteriana normalmente produz muitas cópias de um plasmídeo, em contraste com a produção de apenas uma cópia de seu próprio cromossomo. O fato de os plasmídeos serem menores e em maior número do que o cromossomo hospedeiro torna mais fácil isolar os plasmídeos na forma pura, motivo pelo qual os pesquisadores costumam usá‑los para estudar DNA em laboratório. Os plasmídeos são, portanto, uma ferramenta fundamental da tecnologia do DNA recombinante. Veja abaixo o passo a passo de como realizar a recombinação. Figura 12 – Tecnologia do DNA Recombinante. 1 – O DNA carregando os genes desejados é isolado com um plasmídeo bacteriano; 2 – Corte do plasmídeo bacteriano com enzima de restrição gênica (endonuclease); 3 – O DNA recombinante é obtido pela colagem do gene cortado com a enzima ligase e o DNA do plasmídeo; 4 – O DNA do plasmídeo recombinante é transferido para a célula bacteriana; 5 – As bactérias são multiplicadas. As bactérias que proliferam produzem a proteína de interesse Crédito: Why Design/Shutterstock. Os plasmídeos bacterianos não são os únicos vetores para expressão de DNA recombinante. Existem outros. Os plasmídeos apresentam uma limitação e recebem um fragmento de até 15kpb (15 mil pares de base). Para inserir fragmentos maiores, usa-se outros vetores, como o DNA do bacteriófago lambda (recebe entre 10,4 a 20 kbp), BAC Bacterial Artificial Chromosomes (300 kbp), YAC Yeast Artificial Chromosomes (600kb), e de acordo com os avanços, vetores para inserções maiores como o HACs (Human Artificial Chromosomes), que recebem inserções maiores. A tecnologia de DNA recombinante foi muito útil para saúde, e nos anos 1980 começou a produção de Insulina Humana, por exemplo. Isso mesmo, insulina humana produzida por bactérias. A síntese em grande escala de insulina útil para uso médico e terapia trouxe conforto para muito diabéticos insulinodependentes. Essa tecnologia, que se desenvolveu a partir de décadas de pesquisa básica sobre a natureza do DNA, ofereceu os meios para sintetizar virtualmente qualquer proteína, como a insulina, e fornece uma ferramenta vital para estudar a atividade de genes em laboratório. Figura 13 – Estrutura da Insulina. O que importa é a função biológica da insulina, não a origem. Sua sequência de aminoácidos determina sua forma tridimensional, e consequentemente sua função. Não importa onde ela foi sintetizada, se foi numa célula eucarionte ou numa célula procarionte. O que importa é sua função bioquímica Crédito: Juan Gaertner/Shutterstock. Células de mamíferos e bactérias sintetizam proteínas de formas semelhantes. DNA é transcrito por um polimerase complexa em RNA (RNA Polimerase). Esse princípio permite a realização dos trabalhos de produção dos transgênicos, afinal, como já dito anteriormente, pouco importa como foi feito o DNA recombinado, importa se ele será expresso ou não. TEMA 4 – ORGANISMOS MODELO: USO COM SABEDORIA Ao longo dos anos 1990, muitos outros genomas foram sendo finalizados para auxiliar o sequenciamento do genoma humano. Isso trouxe uma riqueza de informações de diversos organismos, possibilitando um aumento significativo do uso de organismos modelo de forma mais precisa, sem sacrifícios desnecessários, com razão e justificativa. Toda genômica, transcriptômica e proteômica desses outros organismos também foi sendo conhecida, logo, estudos in vivo, que exigem avaliações com organismos modelo, passaram a ganhar mais relevância. O que são esses organismos modelo? Quais foram sequenciados? Quando você discute os experimentos de Mendel, você está discutindo o uso de ervilhas e flores como organismos modelo na compreensão da transmissão de características ao longo das gerações. Você deve saber que o Mus musculus (digite no Google e descubra que animal é esse) é muito utilizado. Outros organismos também possuem seu genoma completamente sequenciado e disponível para análise da comunidade científica gratuitamente. Alguns deles abaixo: Escherichia coli Saccharomyces cerevisae l bacteriophage T4 Danio rerio Bos taurus Pan troglodytes Pan paniscus Oryctolagus cuniculus Macaca mulata Canis lupus familiaris Arabidopsis thaliana Drosophila melanogaster Periplaneta americana Felis silvestres catus Estes aqui apresentados são só alguns exemplos. Muitos outros possuem seu genoma sequenciado e são utilizados devido a suas similaridades bioquímicas e fisiológicas com nós humanos (sim, temos similaridades genéticas, consequentemente, bioquímicas e funcionais com plantas e insetos também). Pense bem, não iremos agir como nazistas, realizando todo e qualquer tipo de experimento com humanos. Usamos organismos modelos nas fases iniciais das pesquisas para encontrar valores e forma seguras de expor humanos a pesquisas científicas. Existem regras muito rígidas para o uso de organismos modelo. Você não pode pegar qualquer animal, nem determinar aleatoriamente a quantidade de animais que você deseja para realizar pesquisas científicas. Existem milhares de comitês de ética em pesquisa que controlam e determinam como poderá ser utilizado o animal e até mesmo determina (quando necessário) o sacrifício correto do animal. Sem sadismo e irresponsabilidade, existem normas, existe treinamento para manipular e usar os animais. Figura 14 – Este na foto é um camundongo C57BL, muito utilizado em pesquisas, assim como outros organismos-modelo. Todos possuem seu genoma sequenciado Crédito: Anyaivanova/Shutterstock. Essa similaridade genética, e consequentemente bioquímica é o que justifica o uso desses organismos modelo. Existem alternativas? Podemos substituir animais na pesquisa científica, já que muitos discutem ter sentimentos e se incomodam com o uso de animais? A resposta é “ainda não”. Não conseguimos substituir o que é observado in vivo por testes in vitro e in silico. Algumas coisas podem ser utilizadas e raros são os testes que não necessitam mais do uso de organismos modelo. Vamos discutir o futuro. TEMA 5 – BIOTECNOLOGIA E A EVOLUÇÃO DA PESQUISA EM CIÊNCIAS DA SAÚDE Usar um organismo modelo é uma ferramenta de observação. Você usa um fármaco, realiza exposição a um composto químico, muda a dieta, cria situações para observar como o organismo desses animais vai reagir. Baseado nisso, você pode substituir o uso de animais por algo que biologicamente te traga a mesma segurança na observação. Atualmente, foi abolido o teste em animais de produtor cosméticos, fármacos dermatológicos e produtor que podem ser desenvolvidos sem o uso de animais, substituindo-os por cultivo celular. Figura 14 – Um biomédico olhando seu cultivo celular em microscópio invertido Crédito: Anamaria Mejia/Shutterstock. Alguns experimentos podem ser realizados diretamente em cultivo celular para observação da resposta celular e estudos de viabilidade que avaliam se a célula sofreu alguma consequência que caracterize uma citotoxicidade, diminuição das condições de manutenção do cultivo celular e problemas na proliferação, dentre outros. É possível até com o conhecimento e tecnologia que temos hoje criar in vitro cultivos celulares com duas ou três linhagens celulares diferentes e observar a interação e a resposta após o estímulo, exposiçãoetc. Temos também hoje em dia um comércio que permite que o grupo de pesquisa compre diferentes tipos de células para realização de seu trabalho, realizando a manutenção dessas células. São centenas de linhagens diferentes, sendo comercializadas no mundo. No Brasil, temos o maior banco de células da América do Sul, o BCRJ, Banco de Células do Rio de Janeiro (http://bcrj.org.br/). Figura 15 – Células endoteliais do cérebro humano (células hCMEC / D3) foram capturadas por microscópio de luz (40x) Crédito: Waruto_Sama Studio/Shutterstock. Figura 16 – Células são cultivadas nessas garrafas e o meio nutritivo é adicionado para manter as células vivas. Esse meio contém tudo que a vida precisa: água, aminoácidos, carboidratos, gorduras, vitaminas e minerais Créditos: Jens Goepfert/Shutterstock; Unol/Shutterstock. Acreditamos que no futuro o uso de animais será substituído por técnicas de cultivo celular e órgãos artificiais, no momento nossa tecnologia não consegue simular um organismo, não conseguimos reproduzir o que acontece entre células. Ainda precisamos observar in vivo e in vitro (de forma limitada, ainda se restringe a avaliações epidérmicas). NA PRÁTICA Ainda há muito a se discutir sobre biotecnologia. Já conversou com seus professores sobre transgênicos? Já parou para pensar que muito da sua vida confortável se deve pelo desenvolvimento e avanços da biotecnologia? Faça uma busca e veja quantas coisas na sua casa são fruto dos avanços biotecnológicos. FINALIZANDO Faça uma pesquisa sobre como eram os tratamentos e a vida dos diabéticos insulinodependentes antes do desenvolvimento da insulina humana produzida pela biotecnologia. Pesquise também sobre outros produtos humanos produzidos por biotecnologia. BIOTECNOLOGIA E BIOINFORMÁTICA AULA 6 Prof. Benisio Ferreira da Silva Filho CONVERSA INICIAL Em 1969 o homem pisou na lua. Para esse grande passo da humanidade foram necessários desenvolvimentos de equipamentos, modos de navegação, compostos químicos para uso em equipamentos e inúmeras inovações incluindo os computadores que precisaram ser otimizados para auxiliar em inúmeros cálculos. Mas você sabia que os computadores utilizados na Apollo 11 que chegou à Lua tinham menos capacidade de processamento que o celular que está no seu bolso agora? Se os computadores daquela época fossem utilizados para auxiliar nos projetos genoma, ainda estaríamos analisando vários genomas e o humano ainda não teria terminado. Falar da era pós- genômica (após a divulgação do genoma completo do Haemophilus influenzae em 1995), sem falar que definitivamente o termo “Bioinformática” começou a ser usado e tratado como mais uma área das ciências biológicas é grave. Não existe a evolução pós-genômica sem a Bioinformática. Vamos falar do seu surgimento, sua importância, como funciona e seu principal objetivo, que é a busca por comparações. Existem outras atividades hoje em dia na Bioinformática, além da comparação entre sequências, que serão citadas, mas vamos exercitar a principal delas. TEMA 1 – EVOLUÇÃO E ACÚMULO DE CONHECIMENTO TAMBÉM NA INFORMÁTICA Na década de 1940 surgiram os primeiros computadores, com destaque para o “pequenino” (sim isso é uma ironia do professor) ENIAC (Eletronic Numerical Integrator and Computer). Esse computador digital e eletrônico não deve ser comparado aos atuais. Deve ser visto como o início e aprendam a exercitar a visão científica desta forma, foi a partir dele que os computadores ganharam importância e desde então começaram a ganhar poder de processamento e diminuir de tamanho. Para um grande volume de dados, mais processamento significa mais velocidade de análise e obtenção de respostas. Quanto mais rápido, melhor para repetir e solucionar problemas sempre que possível, logo, faça o seguinte exercício mental. Qual o genoma mais fácil de ser sequenciado? De um vírus ou do chimpanzé? Figura 1 – O computador ENIAC foi o primeiro computador digital eletrônico de uso geral. “Integrador Numérico Eletrônico e Computador” tinha 150 pés de largura com 20 bancos de luzes piscando foto de 1946 Créditos: Collection/Shutterstock. 1.1 BIOINFORMÁTICA Com o passar dos anos a computação foi evoluindo (assim como já discutimos aqui, houve evolução e avanços na área biológica também, tanto em técnicas quanto em conhecimento). Os computadores foram ficando mais rápidos (maior poder de processamento), armazenavam cada vez mais informações, estavam ficando menores até o ponto da possibilidade de serem portáteis, pois antes computadores como o ENIAC ficavam em uma sala só deles e pesavam literalmente toneladas de equipamentos (toneladas para apenas 1 único computador). Os computadores e a internet mudaram de forma rápida toda a situação da pesquisa e aplicação do conhecimento biológico. Antes dos projetos genoma a “biologia computacional” era algo que estava sendo descoberto como parte importante do processo de desenvolvimento. Antes as pesquisas costumavam ser iniciadas exclusivamente no laboratório com o in vitro e o in vivo, mas, hoje, em dia elas podem começar com o in silico por meio de pesquisas em bancos de dados para elaborar e sugerir novas hipóteses. A Bioinformática é o uso dos recursos computacionais para gerenciar, armazenar e analisar dados biológicos. A análise de dados oriundos de sequenciamento do DNA, RNA e Proteína realizado por meio de softwares específicos com objetivos de compreensão biológica de um organismo, via metabólica específica, transgenia, comparação entre organismos é o que define a Bioinformática. Esse tipo de estudo e análise de grande quantidade de dados que só é possível devido a informática e faz da Bioinformática uma ferramenta para o nosso desenvolvimento. Figura 2 – Mesmo conhecendo a organização do DNA, do RNA e da proteína o volume de informação é tão grande que só com recursos computacionais para organizar e analisar tudo isso Créditos: unoL/Shutterstock. 1.2 EM ÁREA DO CONHECIMENTO ESTÁ A BIOINFORMÁTICA? O mapeamento físico de uma ampla variedade de genomas ocorreu com uma incrível rapidez. Já existe uma ampla variedade de meios de manipulação e análise juntamente com periódicos especializados e uma linguagem específica. É muito difícil você, futuro Biomédico, futura Biomédica, que está entrando na área de biologia molecular ou genética e não ter contato com a Bioinformática. Hoje em dia isso é impossível. A Bioinformática é uma parte do conhecimento em biotecnologia, que exige conhecimentos em genética, bioquímica, biologia molecular, matemática, física e química. É de fato a união de conhecimentos consolidado na era pós-genômica. TEMA 2 – DO ORGANISMO PARA OS BANCOS DE DADOS O caminho para que as informações genéticas de um organismo seja ele qual for é: extração do DNA, purificação do DNA extraído, metodologia de fragmentação e organização, finalizando esta primeira parte no sequenciamento. Um sequenciador de DNA está inevitavelmente conectado a um computador, portanto a leitura que ele realiza envia para o sistema a sequência de nucleotídeos. Essa é a passagem do biológico para o virtual. A partir desse momento as informações biológicas são analisadas em ambiente virtual. A quantidade de informação é muito grande como já foi dito, surge então a necessidade de armazenar e analisar aos poucos. Como armazenar tanta informação? Obviamente você deve ter pensado em armazenamento comum, em hard discs (HD), mas o necessário é algo com maior poder de armazenamento. Existem hoje em dia locais com poder de armazenamento físico, os chamados bancos de dados. É muita informação e o mundo envia seus dados (grande volume de dados) pela internet. Os grupos que sequenciam amostras de DNA submetem via internet essas informações para os bancos de dados biológicos. O principal deles é o GenBank que pertence ao NCBI (National Center for Biotechnology Information). O GenBank é um banco de dados que armazena principalmente sequência de nucleotídeos (DNA ou RNA), tambémpossui informações sobre sequências peptídicas (informações proteicas) e representa hoje o principal repositório de informações genéticas e moleculares do mundo. Os trabalhos e esforços internacionais por exemplo de monitoramento genético de microorganismos envolvem os serviços do GenBank. Por exemplo, durante a Pandemia (2020-2021) o mundo inteiro submeteu sequências do novo coronavírus SARS-CoV-2 diariamente para o NCBI para que fossem realizados alinhamentos na busca de encontrar mutações. Esse serviço de monitoramento genético internacional não aconteceu pela primeira vez na pandemia do coronavírus, aconteceu também na época do H1N1 e de outros vírus. Figura 3 – O trabalho do sequenciamento além de muito importante representa a passagem das informações biológicas para ambiente virtual onde elas poderão ser melhor analisadas Créditos: BlurryMe/Shutterstock. 2.1 ARMAZENAMENTO DOS DADOS E A INTERNET Auxiliando no surgimento da Bioinformática e sua importância, uma peça-chave para que tenhamos hoje em dia, um grande fluxo de informações sendo depositadas em bancos de dados, a transmissão de dados a distância, a internet. Bioinformática sem internet existe, mas é algo local. Entenda, um grupo realiza o sequenciamento e localmente analisa os dados, armazena os dados também localmente. A disseminação da informação e das descobertas ficam limitadas, o mundo só saberá quando esse grupo divulgar por meio de publicações. Agora imagine se os grupos realizam tudo isso e divulgam, compartilham todas essas informações com o mundo. Aumenta a possibilidade de que algum grupo realize uma abordagem de análise diferente e descubra algo a mais. O compartilhamento é possível devido à internet. Ela permite que os dados sejam compartilhados e, melhor, organizados a distância em grandes bancos de dados. Temos vários espalhados pelo mundo, mas merecem destaque aqui os três maiores e mais importantes, todos públicos em com acesso facilitado a todos pela internet, formando então a Colaboração Internacional de Análise de dados de Sequências Nucleotídicas, do inglês (INSDC – International Nucleotide Sequence Database Collaboration, informações que podem ser acessadas em http://www.insdc.org/). Fazem parte do INSDC temos os três principais bancos de dados: O NCBI, onde encontra-se o GenBank entre outros bancos mais específicos, o DDBJ (DNA Data Bank of Japan – Banco de dados de DNA do Japão) e o EMBL-EBI que faz parte do ENA (Arquivos de Nucleotídeos Europeu do inglês – European Nucleotide Archive data discovery and retrieval). Esses três repositórios de informações compartilham informações entre si e disponibilizam gratuitamente tudo, possibilitando o crescimento do conhecimento em Biotecnologia, permitindo avanços rápidos em todas as áreas incluindo a saúde humana. TEMA 3 – CONTEÚDO DOS BANCOS DE DADOS Antigamente, bem no início da Bioinformática e consolidação dos bancos de dados, era possível definir que existiam três tipos de bancos de dados biológicos: Bancos primários – com sequências de nucleotídeos (DNA e RNA). Bancos secundários – com sequências de aminoácidos (proteínas). Bancos terciários – com informações de interações, informações de vias metabólicas. Houve obviamente uma expansão devido a quantidade de informações e especificidade, portanto, hoje em dia, você encontra todo tipo de banco de dados com informações ômicas, por exemplo, banco específico para determinado tipo de organismo, bancos específicos para genomas completos, bancos com informações metabólicas, estruturas proteicas entre outros. Dentro dos bancos você encontrará informações sobre a sequência (seja ela de nucleotídeos ou aminoácidos), informando seu tamanho (em pares de bases ou quantidade de aminoácidos), grupo que realizou o sequenciamento, qual o projeto de pesquisa ou iniciativa que justificou a realização, qual o organismo em questão, regiões importantes da sequência caso exista (o posicionamento da área de um gene, por exemplo) e, por fim, a sequência em questão. Então, que fique claro, quando você acessa essas informações você não verá só a sequência, você terá todo acesso a informações que auxiliam na compreensão da informação biológica e permite que sejam realizadas outras análises com esses dados biológicos. 3.1 OUTRAS INFORMAÇÕES E FERRAMENTAS ENCONTRADAS NOS BANCOS DE DADOS Existem muitas outras informações que serão exploradas ao longo das aulas com o professor. Hoje no NCBI (onde encontra-se o GenBank), que é o principal banco e o que estudaremos mais, você encontra outras informações logo após você digitar no campo de busca o nome científico do organismo que você deseja estudar, você será apresentado a diferentes bancos de informações (veja que neste momento falo “informações). Bancos de literatura, bancos relacionados exclusivamente com informações gênicas, com informações proteicas, banco com informações nucleotídicas, informações sobre a relação com a saúde humana e um banco com informações sobre a química. Com tantas informações disponíveis, diversas ferramentas também são encontradas para facilitar a análise dos dados. Por exemplo, comparando as sequências você pode, por meio de algoritmos, estabelecer uma relação entre elas, estabelecendo uma relação evolutiva entre elas (análise filogenética), algoritmos para desenhos de primers (elemento fundamental na PCR, consequentemente para diagnóstico molecular) e também recursos para visualização de estruturas proteicas 3D. Como dissemos, a quantidade de informação é tão grande e as ferramentas e programas de Bioinformática tão diversificados, que tornam possível, em um curtíssimo espaço de tempo, identificar um patógeno, por exemplo, sequenciar seu material genético. E, a partir daí, começar a realizar diagnóstico molecular para confirmação do patógeno em amostra biológica. A Bioinformática acelerou esse processo que poderia durar 2 ou 3 anos para semanas. Veja como foi rápido no caso do SARS-CoV-2. Em pouquíssimo tempo sabíamos como era seu material genético e em semanas já tínhamos meios de detectar seu material genético em amostras coletadas com Swab. Figura 4 – Coleta com Swab de amostra orofaríngea, material levado para o laboratório par ao teste de RT-PCR. Por que conseguimos detectar a presença do vírus? Porque conhecemos o seu material genético e desenvolvemos primers para teste de reação em cadeia da polimerase Créditos: okan celik; Ks Ks/Shutterstock. A principal ferramenta de Bioinformática (sim existem outras) é o algoritmo de comparação entre sequências BLAST. A comparação entre sequências é um procedimento muito utilizado e útil para compreensão do que está sendo estudado. Vamos detalhar mais sobre o BLAST. TEMA 4 – BLAST Grave essa simples explicação antes dos detalhes. Dadas duas ou mais sequências, nós inicialmente pretendemos: Medir as suas similaridades. Determinar as correspondências entre pares de resíduos (nucleotídeos ou aminoácidos). Observar, por meio dessas comparações, padrões de conservação e variabilidade. Inferir relações evolucionárias ou possíveis funções biológicas. O BLAST (Basic Local Alignment Search Tool – Ferramenta de Procura e Alinhamento Local Básica) é o algoritmo desenvolvido e publicado em 1990, por Stephen F. Altschul e colaboradores, cuja função é comparar uma sequência com outra e baseado nessa comparação ele vai estabelecer por meio de valores o quão “similar” é uma sequência em relação a outra. Ele é importante pois, se você possui informação genética ou proteica conhecida, pode usar as que são conhecidas como referência. No momento que você compara outras que apresentam alta similaridade com as suas que você conhece, você estabelece uma relação entre elas. Bioquimicamente essa similaridade é importantíssima. O alinhamento de sequências é a ação mais importante de toda a bioinformática (biologia computacional), dado o número e diversidade de sequências existentes e dada a frequência com que ele precisa ser resolvido diariamentepelo mundo a fora. Em outras palavras: se “a” é muito parecido com “b” e se sei a função de “b”, então com grande probabilidade “a” terá a mesma função. Em sequências de DNA, RNA e proteínas alta similaridade implica em alta similaridade estrutural e consequentemente funcional. Não podemos confundir e misturar similaridade com homologia. O alinhamento entre sequências indica o grau de similaridade entre elas, isto é, a quantidade de nucleotídeos iguais na mesma posição em ambas as sequências (ou mais de uma) ou entre sequências de aminoácidos. Homologia é uma hipótese de cunho evolutivo e não possui gradação. O algoritmo BLAST é extremamente simples e se baseia no conceito de “par de segmentos”. Dada duas sequências, um par de segmentos é definido como um par de subsequências de mesmo comprimento que forma um alinhamento sem gap. A ideia é analisar se essa comparação identifica se elas são muito parecidas e dessa comparação, receberemos um resultado que significa o quão similar elas são. Figura 5 – Uma comparação simples entre 3 sequências. A é nossa sequência de referência, nós sabemos sua função biológica, o que ela irá expressar. Quando compramos ela com a sequência B, observamos 2 mudanças de nucleotídeos, logo elas não são iguais, mas, muito parecidas. Comparando com a comparação entre A e B, a comparação entre A e C mostra uma diferença maior entre as sequências. Por conta dessa simples comparação eu posso inferir o seguinte: B é tão similar a A que ele possui mesmo função biológica que a de A. C é tão diferente de A que não possui a mesma função biológica Fonte: Silva, 2020. 4.1 ALINHAMENTO DE SEQUÊNCIAS – MODALIDADES DE ALINHAMENTO A comparação entre duas sequências pode ser entre toda sua extensão (uma sequência inteira contra toda extensão de outra) ou apenas um trecho de uma contra outra sequência. Temos então o alinhamento global e o alinhamento local. Alinhamento global: similaridade considerada ao longo de toda extensão da sequência. Alinhamento local: as regiões de similaridade consistem em uma fração da extensão da sequência. Figura 6 – Modalidades de alinhamento e análise entre sequências Fonte: Silva, 2020. É possível, por meio do BLAST, realizar um alinhamento entre duas sequências ou um alinhamento múltiplo. É possível também realizar um alinhamento entre sequências de aminoácidos. Com os conhecimentos do Dogma Central da Biologia Molecular, é possível também realizar uma comparação entre sequências de DNA e obter informações de comparação baseadas no que seria uma expressão gênica, ou seja, o algoritmo entende que é uma sequência de nucleotídeo, organiza em códons e cada códon traduzido em um aminoácido a resposta final seria qual a sequência de aminoácido mais próxima da sequência de DNA que você apresentou ao BLAST. Tudo isso será explicado pelo professor em sua prática de Bioinformática. Figura 7 – O fluxo de informação do DNA até a proteína pode ser analisado pela bioinformática Crédito: udaix/Shutterstock TEMA 5 – AINDA HÁ MUITO O QUE FAZER E A BIOINFORMÁTICA ESTARÁ LÁ AJUDANDO Temos a informação do genoma humano, sua organização, posição dos genes, mas conhecer o gene e sua expressão é apenas uma parte da informação, é preciso entender o funcionamento da informação. Há maneiras de regular a expressão dos genes, quando metilados, por exemplo, há uma interrupção da expressão e isso acontece sem alterar a sequência de nucleotídeos. Logo, é importante entender o processo de metilação concorda? Outros projetos surgiram ao final do PGH com o intuito de compreender o funcionamento do uso de informações genéticas pelas células, dando origem a diferentes funções e tecidos. O ENCODE (Encyclopedia of DNA Elements – Enciclopedia de Elementos do DNA) tem como objetivo estudar e catalogar toda informação funcional do genoma. O que está sendo transcrito, quando e onde, informações essas importantíssimas para medicina. É uma versão mais robusta da ideia geral do projeto transcriptoma, mais detalhado. O Projeto Epigenoma Humano (PEH) objetiva estudar o funcionamento dos processos epigenéticos que regulam a expressão dos genes. Padrões de metilação implicam por exemplo, na idade de início de uma doença e até seu nível de gravidade de sintomas como por exemplo nas síndromes de Angelman e Prader-Willi (imprinting genômico). Esses padrões são herdáveis, além do fato de que o processo de metilação das sequências impede que os fatores de transmissão se liguem a região reguladora. A síntese de micro RNAs (miRNA) também é uma forma pós- transcricional de regulação e conhecer as formas de regulação gênica é de extrema importância, não é só a sequência do gene. O Projeto HapMap (Mapa de Haplótipos) tem uma importância especial, como parte dos estudos de doenças multifatoriais. Nesse projeto são estudados SNPs (single nucleotide polymorphism) para genética de populações, mas ganhou destaque após os esforços do WTCCC (wellcome trust case control consortium) que comparou padrões de SNP de 14 mil pacientes com sete tipos de doenças multifatoriais e comparou com 3 mil indivíduos controle. Como resultado, alguns desses SNPs apresentaram, estatisticamente, relação com determinadas doenças, mas por encontrarmos alguns SNPs estatisticamente relacionados em regiões intergênicas e até em íntrons, torna-se difícil validá-los com testes biológicos. Essa iniciativa continua e o objetivo é ao final ter respostas como temos para doenças monogênicas. Um outro projeto que merece nossa atenção é o projeto Microbioma Humano, que visa a identificação dos microrganismos e a relação exata deles conosco. Informações obtidas até o momento mostram que esse microbioma residente faz parte da nossa fisiologia e mudanças implicam em respostas do nosso organismo podendo facilmente relacionar essas mudanças com doenças e condições desfavoráveis. Esse estudo envolve também a análise entre as diferenças do microbioma encontrado em adultos e crianças. Figura 8 – Microbioma humano, material genético de todos os micróbios que vivem no corpo humano e dentro dele Crédito: Design_Cells/Shutterstock Figura 9 – Microbioma do recém-nascido, o microbioma intestinal infantil, material genético de todos os micróbios sendo analisado por bioinformática. Estudo para melhor compreensão da saúde e desenvolvimento humano Crédito: Design_Cells/Shutterstock A Farmacogenômica outra área que surgiu com esses avanços é o estudo da interação de moléculas/fármacos com proteínas de uma dada via metabólica, bem como com possíveis isoformas. De forma mais específica veio a Toxicogenômica. Todos esses avanços abriram espaço para o crescimento de novas terapias, como a terapia gênica e a interferência por RNA (RNAi). Essas pesquisas têm como objetivo recuperar determinado fenótipo ou interromper a expressão de um gene. Existem resultados positivos nesse momento e muitos outros que ainda estão sob análise. Inevitavelmente novas questões éticas surgiram. Com tantas promessas iniciais, os avanços tecnológicos que acompanharam tal esforço surgiram as dúvidas e preocupações. Como essas informações biológicas serão utilizadas? Poderia ocorrer uma separação de etnias? Quanto a última pergunta o próprio projeto genoma já nos respondeu que somos 99,9% similares, esse 0,1% de diferença explica nossas diferenças fenotípicas que hoje sabemos ocorrem devido a adaptações ao meio. No início do PGH parte do financiamento foi direcionado ao HUGO (Human Genome Organization) para criar um grupo que cuidasse das questões éticas do programa e assim surgiu o ELSI (Ethical, Legal and Social Implications – Implicações Éticas, Legais e Sociais). A finalidade era analisar as possibilidades de uso dessas informações sem interferir na ética e legalidade. O ELSI trabalhou com professores e alunos universitários na época (anos 1990) gerando conhecimento sobre as possíveis aplicações, visando sempre a manutenção de ações éticas quanto ao uso dessas informações. Baseado nessasrecomendações do ELSI vários países incluindo o Brasil criaram legislações ou atualizaram suas leis para esta nova realidade, temos agora informações genéticas humana, mas nunca iremos usá-la contra a humanidade nem para distorcer o que define o Homo sapiens. Em 2008, por exemplo, um médico chinês realizou alterações genômicas em 2 bebês que nasceram imunes ao vírus HIV. Modificações genéticas não são permitidas e o governo chinês prendeu o médico e ainda exigiu pagamento de multa. Casos similares não serão tolerados. Outro detalhe ético discutido é o uso de tais informações genéticas do indivíduo por parte de seguros ou planos de saúde, tornando-se uma preocupação. Pessoas tem culpa de possuírem informações genéticas que do ponto de vista de mercado são desfavoráveis? Uma pessoa que nasceu com alterações genéticas que a predispõe a uma ou duas doenças já merecem receber um valor mais alto de planos de saúde ou pelos serviços de saúde? Isso é uma forma de discriminação? Essa preocupação também impulsionou cuidados com o uso das informações dos projetos genoma. NA PRÁTICA Sem dúvidas os avanços da informática e a união com o conhecimento em ciências biológicas, a química e a física permitiram os projetos genoma e todos os avanços biotecnológicos vistos hoje em dia. Toda informação genética é de interesse dos profissionais de saúde, pois alterações, sejam elas estruturais ou pontuais, implicam a gênese de doenças. Tais informações, hoje, são conhecidas e mais estudos estão sendo realizados com o uso das tecnologias desenvolvidas durante a era pós- genômica. FINALIZANDO A melhor forma de fixar todo esse conhecimento é praticando, visite agora mesmo o portal do NCBI ( <https://www.ncbi.nlm.nih.gov/>) e faça os exercícios que o professor realizou com você. Faça uma expansão desse conhecimento realizando buscas do que mais te interessa no curso, área, microrganismo, doença ou gene na página e veja as informações apresentadas. São informações oficiais e reais, o maior laboratório biotecnológico virtual do mundo. REFERÊNCIAS ALBERTS, B., et al. Biologia molecular da célula. 6. ed. Porto Alegre: Artmed, 2017. LEHNINGER, A. L.; NELSON, D. D.; COX M. M. Lehninger Princípios de Bioquímica. 7. ed. São Paulo: Sarvier, 2019. LESK, A. M. Introdução à Bioinformática. Tradução Ardala Elisa Breda Andrade, et al. Oxford: Oxford University Press, 2008. https://www.ncbi.nlm.nih.gov/ https://www.ncbi.nlm.nih.gov/ https://www.ncbi.nlm.nih.gov/ https://www.ncbi.nlm.nih.gov/