Baixe o app para aproveitar ainda mais
Prévia do material em texto
4 Biotecnologia Ciência & Desenvolvimento - nº 29 ENTREVISTA TerapiaCelular Brasil sai na frente na terapia celular em humanos em todo o mundoBrasil sai na frente na terapia celular em humanos em todo o mundoBrasil sai na frente na terapia celular em humanos em todo o mundoBrasil sai na frente na terapia celular em humanos em todo o mundoBrasil sai na frente na terapia celular em humanos em todo o mundo Entrevista concedida a Edmilson Silva 4 Biotecnologia Ciência & Desenvolvimento Quatorze pacientes ficaram livres da fila de transplantes e voltaram a ter vida normal, depois de receberem células-tronco, injetadas diretamente no coração, em terapêutica revolucionária conduzida por pesquisadores do Pró-Cardíaco, da UFRJ e do Texas Heart Institute Um grupo de brasileiros colocou o País à frente no que há de mais revolucionário em termos da chamada medicina regenerativa , ao utilizar, em 14 pacientes - todos portadores de doenças coronarianas crônicas- , células-troncopara recuperar as áreas lesadas de seus corações. O sucesso da terapia celular foi tanto que os pacientes, todos com idades entre os 50 e 80 anos e para os quais a única alternativa médica seria apenas a realização de transplante, já após a 5ª semana da intervenção, recuperaram o tão sonhado bem-estar roubado pela doença. Dessemodo, voltaram a fazer coisas simples, masmuito significativas, tais como fazer uma caminhada,morar sozinho de novo, ou tomar um banho sem precisar parar no meio para descansar ou ter alguémpara enxugá-lo. Os resultados dessa bem-sucedida empreitadamédico-científica, que abre uma fronteira no tratamento do coração, ao injetar diretamente nomúsculo cardíaco 30milhões de células-tronco, retiradas damedula óssea dopróprio paciente, serão publicados, em breve, na mais conceituada revista da área, a Circulation. Prova de que, quando se tem um objetivo comum, é possível somar esforços entre duas áreas tidas, até então, pelos profissionais do setor, como incompatíveis, a terapia celular é fruto de três anos de trabalho conjunto entre pesquisa básica e clínica. Nesta entrevista para Biotecnologia, um dos principais integrantes desse grupo de cientistas, o jovemHans FernandoDohmann, coordenador do Laboratóriode InternaçõesCardiovascularesdoHospital Pró-Cardíaco, de apenas 37 anos, 13 dos quais dedicados à Cardiologia, dá detalhes sobre essa terapêutica pioneira e revolucionária, feita emparceria compesquisadores da Universidade Federal do Rio de Janeiro (UFRJ) e do Texas Heart Institute. Dohman prevê que a terapia celular estará disponível para ser empregada em hospitais universitários, em breve, e representará uma revolução principalmente no tratamento da Doença de Chagas. Biotecnologia Ciência & Desenvolvimento - nº 29 5 BC&D - Como começou o seu inte- resse pela terapia celular ? Hans Dohmann - Na verdade já tínhamos uma linha de pesquisa que trabalhava com o sistema de catéteres usado agora para implantar as células- tronco. E o começo de tudo se deu com o desenvolvimento desse catéter especial, em uma parceria com o Te- xas Heart, do estado do Texas, nos EstadosUnidos. BC&D - Que catéter é este ? Hans Dohmann - É um catéter com- pletamente diferente do que se usa hoje em Medicina, pelo fato de dispor de um pequeno sensor na ponta que nos dá uma localização muito precisa, espacialmente falando. E ele foi espe- cialmente desenvolvido, justamente pensando em se tratar o coração com a injeção de células, gens ou substân- cias. Com a qualidade do equipamen- to, poderíamos acertar o tratamento de forma muito melhor do que com a tecnologia disponível hoje. Com a téc- nica dos catéteres convencionais, não haveria como fazer a injeção no mús- culo endocárdico (parte interna do coração). BC&D - Quando é que vocês deci- diram injetar células-tronco para recuperar as áreas lesadas do co- ração ? Hans Dohmann - No início da pes- quisa, há quatro anos, a gente pensava em trabalhar com fator de crescimen- to, terapia gênica na verdade. Uma apresentação sobreperspectiva douso desse catéter especial na terapia celu- lar, realizadaemumencontro emHam- burgo, na Alemanha, nos empolgou a usá-lo para a injeção das células. Daí, passamos a estudar e nos preparar para fazer isso, uma vez que naquela época não havia praticamente nada sobre terapia celular. Sobre medula óssea, então, é que não havia nada mesmo. Tinha alguma coisa sobre o uso de células-satélite de músculo es- quelético. BC&D - E como é que se deu o desenvolvimento da tecnologia propriamente dita ? HansDohmann - Emerson Perin, um brasileiro radicadonos EstadosUnidos e que trabalha no Texas Heart, come- çou a estabelecer contatos com o De- partamento de Pesquisa de lá e eu, à procura de alternativas de pesquisa básica, acabei chegando a Radovan Borojevic e Antonio Carlos Paes de Carvalho, ambos pesquisadores da Universidade Federal doRiode Janeiro (UFRJ). Para nossa grata surpresa, a competência desses colegas está aci- ma de qualquer suspeita, além do fato de os interesses científicos terem se reunido: tínhamos como colocar as células, todo o know-how clínico, e eles o conhecimento sobre células- tronco. A partir dessa conjunção de interesses, fomos convidados a integrar o Instituto do Milênio de Bioengenharia Tecidual e neste projeto ficou determinado que caberia ao Hospital Pró-Cardíaco de- senvolver o uso da terapia celular em doenças coronarianas, dentro das di- versas perspectivas que aquele Insti- tuto têm. BC&D - Uma queixa freqüente é a de que pesquisa básica e clínica estariam em campos opostos. Não foi o que aconteceu neste caso. Hans Dohmann - No nosso caso, além do resultado científico, uma das grandes coisas boas é a demonstração clara de que a relação entre pesquisa clínica e básica é necessária, simples. As necessidades entre as duas são, na verdade, complementares. A ciência básica nos dá condição de trabalhar, mas há o nosso papel, que é o de fazer chegar as células-tronco ao coração, via implante, e, além disso, desenhar o cenário clínicopara encontrar amelhor formadedemonstrar o resultado. E isto é umprocessomuito complexo. Como escolher o modelo que primeiramente beneficie o paciente, que esse benefí- cio ocorra com o menor risco possível e, terceiro, que dentro da rigorosidade metodológica, você consiga, de forma efetiva, demonstrar algum resultado, científicamente falando. BC&D - Mas apesar de toda essa complexidade, a terapia celular é um sucesso. Hans Dohmann - Acabamos deci- dindopela criaçãode vascularização e, com isso, conseguimos identificar e submeter ao transplante uma parcela de doentes da população que não tinha outro tratamento convencional a receber. Portanto, tudo que eles tives- sem de efeito, seria, efetivamente, decorrente do uso das células-tronco. Escolhemos pacientes para os quais a medicina não tinha mais nada a ofere- cer, a não ser o transplante cardíaco. BC&D - De que doenças esses pa- cientes eram portadores ? Hans Dohmann - De doença coro- nariana crônica, tipo angina, com as artérias coronárias entupidas, coração grande, já dilatado caracterizando a insuficiência cardíaca junto.Decidimos trabalhar com esses 14 pacientes, pri- meiro porque foi o melhor modelo para o uso da terapia celular; segundo, porque a doença coronária é a que a equipe do Hospital Pró-Cardíaco tem mais experiência, e, terceiro, pelo fato de essa doença ser a mais comum, a quemais mata as pessoas. Outra razão principal é a de que o modelo é socialmente justificável, ao provocar um impacto positivo muito grande na recuperação da qualidade de vida de muitas pessoas. Havia um grupo-controle, constituído por seis pacientes, que apenas foram acompanhados,duranteaprimeira fase, para servir de parâmetro, mas dentro de um mês ou dois meses, eles tam- bém serão submetidos à terapia celu- lar. BC&D - Quando foi feito o primei- rocaso e quais foram os resulta- dos obtidos ? Hans Dohmann - Há mais de um ano: exatamente no dia 16 de dezem- bro de 2001. O mais importante de tudo foi a demonstração da segurança do procedimento, e já que o protocolo desenhado se pautou em exeqüibili- dade e segurança, conseguimos pro- var que dá para fazer. Não houve nenhumadificuldadedentrodoque foi planejado, no que diz respeito à retira- da, transporte e separação de células. Biotecnologia Ciência & Desenvolvimento 5 O principal gol é que aonde antes o sangue chegava com dificuldade - o que caracteri- za a angina nessa coronária- passou a ser melhor irrigada. Em alguns casos, a melhora da irrigação foi de 100% 6 Biotecnologia Ciência & Desenvolvimento - nº 29 Apesar de ser muita coisa nova ao mesmo tempo, tudodeu certo, quando poderia alguma coisa sair errada. Gra- ças a Deus, tudo funcionou bem. A informaçãomais importante de todas é que a terapia celular não fez mal a ninguém, aindamais se considerar que os doentes submetidos à terapia esta- vam em estado muito grave, alguns dos quais já em filas de transplante. BC&D - Do ponto de vista fisiológi- co, como poderia ser descrito esse bom funcionamento da terapia ? Hans Dohmann - O principal gol é que aonde antes o sangue chegava com dificuldade - o que caracteriza a angina nessa coronária - passou a ser melhor irrigada. Em alguns casos, a melhora da irrigação foi de 100%, em outros parcial e em apenas dois casos ela não ocorreu. E para estes casos, há explicações técnicas possíveis. Obvia- mente que se aprende fazendo. Em suma, a célula-tronco tem capacidade de melhorar a perfusão sanguínea de determinada área do coração. Em de- corrência dessamelhorada chegadado sangue, a força do coração também melhorou. Onde havia isquemia, dei- xou de ter, e, com isso, o coração passou a contrair com mais força. O tamanhodo coraçãodiminuiu, aumen- tou a força,melhorou a perfusão, dimi- nuíram as arritmias, quando havia o medo de que elas aumentassem. En- fim, com o uso das células-tronco, a fisiologia do tecido cardíaco se dá com mais facilidade. BC&D - E sob a ótica da qualidade de vida, quais foram os ganhos que os pacientes obtiveram ? HansDohmann - Seja por protocolos de cunho científico, que avaliam a qualidade de vida, seja pela própria conversa comos indivíduos, amelhora foi enorme. Muito além do que, since- ramente, se poderia esperar. Um paci- ente que tinha que parar no meio da refeição para descansar e que no final do banho a esposa tinha que ajudar a enxugá-lo, porque ficava muito cansa- do, me liga determinado dia, todo feliz da vida, para contar que havia acabado de dar uma caminhada em volta do Maracanã - cuja área do entorno próxi- mo é de 1.700 metros de comprimen- to. Isto apenas oito semanas depois da realização da terapia. Alguns pacientes já voltaram a trabalhar, quando não faziam isto antes, devido aos proble- mas cardíacos. Um outro paciente, de seus 50 anos, passou a morar com a mãe, porque não se sentia bem, mas como agora está recuperado, decidiu voltar a morar sozinho, e a senhora ficou chateada com isso. Para mim, o mais fascinante é a vida humana que está por trás disso. BC&D - Quando será feita a publi- cação dos resultados dessa expe- riência bem-sucedida ? Hans Dohmann - Os resultados já vem sendo apresentados em congres- sos nacionais ou internacionais, desde meados de 2002. Com relação à publi- cação em revista científica, posso adi- antar que os dados já seguiram para a Circulation. BC&D - Passo a passo, como é que as células-tronco são injetadas no coração do paciente ? Hans Dohmann - O paciente chega às 7h no hospital, às 7:15h está deitado no leito, monitorado, sedado. Faz-se, então, umapunção na crista ilíaca pos- terior, de onde se retira entre 40 ml a 50 ml de aspirado medular, produto queéencaminhadoao laboratóriopara o processo de separação de células. Basicamente, células mononucleares de medula óssea. Nesse meio tempo, o paciente é submetido a um cateteris- mo, para que seja feito o mapeamento em que escolhemos as áreas para inje- ção das células. As injeções são feitas com a ajuda desse catéter especial, que, na verdade, foi adaptado para funcionar como uma fina e enorme seringa móvel. Com as 20 ou 25 inje- ções, espalhamos as células em toda a área lesada, da forma mais uniforme- mente possível. Em cada um desses pontos, injetamos 0,2 ml de células- tronco, porque foi verificado no es- tudo com animais (porcos, devido ao fato de que a biomecânica circu- latória é muito parecida com a de humanos) que se essa quantidade for maior, as células são rejeitadas. Ao todo, portanto, injetamos 4ml a 5ml de concentrado celular. BC&D - Essa técnica está sendo usada em outro lugar do Brasil, ou mesmo do mundo ? Hans Dohmann - Sob forma de pesquisa sim, mas sempre visando o uso de células de músculo esque- lético. Depois de nossos comunica- dospioneiros emcongressosnoano passado, grupos da Coréia, Estados Unidos e Europa estão começando a anunciar seus resultados. BC&D - Além das doenças coro- narianas, em que outras doen- ças os pacientes podem ser be- neficiados com essa técnica ? Hans Dohmann - A Doença de Chagas, e graças ao trabalho que vem sendo desenvolvido pelo Ins- tituto do Milênio de Bioengenharia Tecidual, através da equipe de Ri- cardo dos Santos, do Centro de Pes- quisasGonçaloMoniz, da Fundação Oswaldo Cruz (Fiocruz) em Salva- dor,Bahia. BC&D - Há algum limite etário para o uso da terapia celular ? Hans Dohmann - Ainda não te- nho essa resposta final, mas posso dizer que o nosso protocolo limita em 80 anos de idade e os resultados são bons. A grandedúvida é a quan- tidadedecélulas-troncoque sepode encontrar em indivíduos mais ve- lhos e quanto elas ainda poderão se tornar ativas, em comparação com células-tronco encontradas em um adulto jovem ou em uma criança. Na minha opinião, funciona igual- mente tanto em jovens quanto em adultos.Tantoque, nopróximopro- tocolo, pretendodeixar a idade libe- rada. Se o indivíduo está ativo, lúci- do e tem condições clínicas de se submeter ao procedimento cirúrgi- co, não vejo porque não fazê-lo. A minha sensação é de que não deve ter um efeito tão pleno quanto o de uma célula jovem, mas elas ainda têm algo a oferecer. 6 Biotecnologia Ciência & Desenvolvimento - nº 29 Um paciente que tinha que parar no meio da refeição para descansar, me liga determinado dia para contar que havia acabado de dar uma caminhada em volta do maracanã Biotecnologia Ciência & Desenvolvimento - nº 29 7 BC&D - E no outro extremo, as crianças, principalmente as que nascem com problemas cardíacos, podem ser beneficiadas pela técni- ca ? Hans Dohmann - Acho que no futuro haverá alguma aplicabilidade,mas aí já é um campo bastante diferente, visto que as doenças congênitas, na maioria das vezes, são de mal-formação. Próteses que se usamhoje, tais comoos homoen- xertos, usados para substituir válvulas cardíacas, por exemplo, passarão a ser produzidas tambémcomcélulas-tronco, para ficar um tecido mais apropriado. Entretanto, desconheço qualquer pes- quisa nessa área. BC&D - Você falou em desenho de protocolos novos, mas na verdade o que vocês fizeram foi a produção de conhecimento e isto dá muito trabalho. Hans Dohmann - É verdade. Cada método utilizado o foi pela primeira vez neste cenário clínico de transplantes autólogos de células de medula óssea para coração. Portanto, não havia base alguma sequer para raciocinar a partir daquilo. Você tem que sentar, repetir, imaginar, raciocinar; às vezes as coisas são diretas, outras nem tanto assim. Às vezes, os resultados são diferentes dos que você estava acostumado a ver. E você se pergunta: meu Deus, o que foi que aconteceu aqui, até receber outras informações e concluir umaoutra idéia e aí, então, propô-la à comunidade cientí- fica,que é o ponto que a gente - uma equipe de, no mínimo 40 pessoas - chegou. Nós partimos do zero e estamos fazendo tudo obedecendo aos rígidos padrões internacionais de realização de pesquisa. Quando se está abrindo uma fronteira do conhecimento, você não pode vender gato por lebre, nem passar por santo milagreiro. BC&D - A experimentação direta em humanos não envolve mais riscos ? Hans Dohmann - Para nós clínicos, esta fase que estamos fazendo é justa- mente a de testar a segurança da técnica. Tanto é que agora em 2003, ou 2004, pretendemos ampliar a quantidade de pacientes, para ver se os resultados encontrados se confirmam na fase em que testaremos a eficácia. Temos que lembrar quenós estamos aqui animados, felizes, mas são apenas 14 doentes. Temos que ter responsabilidade com isso e é essa a razão de ampliarmos o número de pacientes. Não acredito que isso vá acontecer com a nossa pesquisa não, mas há vários relatos na medicina completamente diferentes dos pioneiros. BC&D - Pelo que vem sendo obser- vado, , em quanto tempo a terapia celular estaria disponível à popu- lação? Hans Dohmann - Acho que será rápido: dois anos, dois anos e pouco, até porque os resultados têm sidomais animadores do que normalmente são. Tem despertado interesse planetário. Há muita gente se mexendo para pes- quisar nessa área. E se nos novos estu- dos com os grupos ampliados de paci- entes, em breve, os resultados forem tão bons quanto os que temos registra- do até agora, não vejo qualquermotivo bioético razoável para a Associação Nacional de Vigilância Sanitária (Anvi- sa) não liberar o emprego da terapia celular para uso clínico. Temos que lembrar que ela será usada em indiví- duos que não têm outra perspectiva clínica, a não ser o transplante. E o transplante, todos nós sabemos, não é um problema apenas brasileiro, não vai, nunca, atender às necessidades da população como um todo. Acredito honesta e sinceramente que, em bre- ve, a terapia passará a ser realizada pelo menos nos hospitais universitári- os, ou naqueles que disponham de laboratórios de hemodinâmica, e que tenhaprofissionais comconhecimento suficientes para separar células-tronco. BC&D - Já dá para imaginar quanto custaria a terapia celular ? Hans Dohmann - Se levarmos em consideração apenas o catéter especi- Biotecnologia Ciência & Desenvolvimento - nº 29 7 al, não daria para ser feita por menos de R$ 40 mil. Isto sem falar nos vários anticorpos, todos importados, usados para a separaçãodas células-tronco. Evi- dentemente, que quando você passa a fabricar uma maior quantidade de caté- teres, a tendência do preço é cair. A parte hospitalar não é cara. BC&D - Qual é o tempo de interna- ção do paciente para a realização da terapia ? Hans Dohmann - Os doentes ficam internados 48 horas, até por uma ques- tão de segurança, mas acho que esse tempo poderá ser reduzido, uma vez que nenhum problema foi constatado. Depois disso, o paciente retorna três dias depois e após esse período, vem ao hospital de semana em semana. BC&D - Poderia especificar a quan- tidade, mesmo que aproximada, de células tronco empregadas no tra- tamento? Hans Dohmann - Isso dá em torno de 30milhões de células. Este foi o número máximocomoqual decidimos trabalhar. BC&D - Vocês pretendem usar mais células nas próximas terapias ? Hans Dohmann -Uma de nossas futu- ras linhas de pesquisa é aumentar a quantidade de células-tronco, para ver se tudo funcionará como até agora. BC&D - As células-tronco, poderão ser retiradas somente da própria pessoa ou de terceiros? Hans Dohman - Neste estágio de pesquisa clínica, estamos trabalhando comcélulas autólogas. Parautilizaçãode células de terceiros, ainda temos que aprender algo sobre a imunologia das células-tronco. BC&D - No caso de terceiros, al- guém mais jovem? E nesse caso, haveria possibilidade de rejeição? Hans Dohman - Realmente trabalha- mos com o conceito de que células mais jovens podem ter uma capacidade re- constitutiva maior. No entanto, a confir- mação deste conceito sob o ponto de vista de impacto clínico ainda está por se dar. Por outro lado, sempre a principal questão que norteará a utilização de células de terceiros será o risco de rejei- ção, que não está descartado de forma alguma e só será corretamente avaliado com o avanço do conhecimento das propriedades imunológicas destas célu- las. Temos que lembrar que ela será usada em indiví- duos que não tem outra perspectiva clínica a não ser o transplante 10 Biotecnologia Ciência & Desenvolvimento - nº 29 Carta ao Leitor BIOTECNOLOGIA Ciência & Desenvolvimento KL3 Publicações Fundador Henriqueda Silva Castro Direção Geral e Edição Ana Lúcia deAlmeida Diretor de Arte HenriqueCastro Fº Projeto Gráfico Agência deComunicação IRIS E-mail biotecnologia@biotecnologia.com.br Home-Page www.biotecnologia.com.br Os artigos assinados são de inteiraresponsabilidade de seus autores. ISSN 1414-4522 Nota: Todas as edições da Revista Biotecnologia Ciência & Desenvolvimento estão sendo indexadas para o AGRIS (International Information System for the Agricultural Sciences andTechnology)daFAOepara aAGROBASE (BasedeDadosda AgriculturaBrasileira). PrezadosLeitores, A revista Biotecnologia está sendo reestruturada, e será, daqui por diante, eletrônica. Pretendemos automatizar cada vez mais oferecendomaior agilidade e intercâmbio. Comunicamos tambémque estamos disponibilizando, no site, todosos artigos anteriores aos nossosusuários. Por enquanto, estamos fazendoos ajustesnecessários. Atenciosamente RevistaBiotecnologia Biotecnologia Ciência & Desenvolvimento - nº 29 11 Conselho Científico Dr. Aluízio Borém - Genética e Melhoramento Vegetal Dr. Henrique da Silva Castro - Saúde; Dr. Ivan Rud de Moraes - Saúde - Toxicologia; Dr. João de Deus Medeiros - Embriologia Vegetal; Dr. Naftale Katz - Saúde; Dr. Pedro Jurberg - Ciências; Dr. Sérgio Costa Oliveira - Imunologia e Vacinas; Dr. Vasco Ariston de Carvalho Azevedo - Genética de Microorganismos; Dr. William Gerson Matias - Toxicologia Ambiental. Conselho Brasileiro de Fitossanidade - Cobrafi Dr. Luís Carlos Bhering Nasser - Fitopatologia Fundação Dalmo Catauli Giacometti Dr. Eugen Silvano Gander - Engenharia Genética; Dr. José Manuel Cabral de Sousa Dias - Controle Biológico; Dra. Marisa de Goes - Recursos Genéticos Instituto de Pesquisas Energéticas e Nucleares - IPEN Dr. José Roberto Rogero Sociedade Brasileira de Biotecnologia - SBBiotec Dr. Luiz Antonio Barreto de Castro - EMBRAPA Dr. Diógenes Santiago Santos - UFRGS Dr. José Luiz Lima Filho - UFPE Dra. Elba P. S. Bon - UFRJ EntrevistaEntrevistaEntrevistaEntrevistaEntrevista HansDohmann 04 PesquisaPesquisaPesquisaPesquisaPesquisa Bioinformática:ManualdoUsuário 12 Chagas - Fenômeno da Resistência 26 O Contexto Brasileiro para a Bioprospeção 32 Ectomicorrizas: A Face Oculta das Florestas 38 HPV e Câncer 48 MarcadoresMolecularesDominantes (RapdeAflp) 56 MicrorganismosEndofíticos 62 MicropropagaçãodeParicá 78 Milho: Teor de umidade x Atividade de água 84 ÁrvoresGeneticamenteModificadasnaSilvicultura Intensiva 92 Otimização do Processo de Embriogênese Somática em Cacau 100 Fluxo Gênico: Análise do caso de Algodão no Brasil 104 BioconservaçãodeAlimentos 114 Geração de Eletricidade com Biogás de Esgoto: Uma Realidade 120 SeleçãodeLinhagensEnvolvidasnaBiodegradaçãodePesticidas 124 Avaliação da Genotoxicidade em Planta do Cerrado 128 CFLAE: Detector de Aflatoxinas em Milho 134 BiomassaResidual Proveniente da Indústria Viti-Vinicola 142 MarcadorMicrossatélite na Conservação de Germoplasma Vegetal 146 HidrolisadoenzimáticoparadietoterapiadeFenilcetonúricos 152 Proteoma 158 Propagação de CAMU-CAMU 166 12 Biotecnologia Ciência & Desenvolvimento - nº 29 Pesquisa Um guia básico e amplo sobre os diversosaspectos dessa nova ciência Bioinformática: Manual do Usuário Ilustrações cedidas pelos autores Figura 1: O Dogma Central da BiologiaMolecular Francisco Prosdocimi Mestrando emGenética e Especialista em Bioinformática UniversidadeFederaldeMinasGerais franc@icb.ufmg.br Gustavo Coutinho Cerqueira Bacharel emCiência da Computação e Especialista em Bioinformática UniversidadeFederaldeMinasGerais cerca@csr.ufmg.br Eliseu Binneck Doutor em Ciência e Tecnologia de Sementes e Especialista em Bioinformática Embrapa Soja binneck@cnpso.embrapa.br Acácia Fernandes Silva Mestre em Agronomia e Especialista em Bioinformática EmpresaPernambucanadePesquisa Agropecuária acacia@ipa.br Adriana Neves dos Reis Bacharel em Informática e Especialista em Bioinformática Universidade do Vale do Rio dos Sinos adriana@exatas.unisinos.br Ana Carolina Martins Junqueira Mestre emGenética e Biologia MoleculareEspecialistaem Bioinformática Universidade de Campinas anacmj@unicamp.br Ana Cecília Feio dos Santos Mestranda emGenética e Biologia MoleculareEspecialistaem Bioinformática Universidade Federal doPará cecifeio@ufpa.br Antônio Nhani Júnior Doutor em Bioquímica e Especialista em Bioinformática UniversidadeEstadualPaulista nhani@fcav.unesp.br Charles I. Wust Mestrando em Ciências da Computa- ção e Especialista em Bioinformática Universidade Federal de Santa Catarina wust@inf.ufsc.br Fernando Camargo Filho Mestrando em Biotecnologia Vegetal e Especialista em Bioinformática Universidade de Ribeirão preto camargo@odin.unaerp.br Jayme Lourenço Kessedjian Analista de sistemas e Especialista em Bioinformática Embrapa Agrobiologia jayme@cnpab.embrapa.br Jorge H. Petretski Prof. Associado e Especialista em Bioinformática Universidade Estadual doNorte Fluminense jhpetretski@uenf.br Luiz Paulo Camargo Analista de Sistemas e Especialista em Bioinformática Universidade de Ribeirão Preto luizpcam@uol.com.br Ricardo de Godoi Mattos Ferreira Bacharel emCiênciasBiológicas e Especia- lista em Bioinformática UniversidadedeSãoPaulo ricgmf@lineu.icb.usp.br Roceli P. Lima Mestrando em Informática e Especialista em Bioinformática Universidade do Amazonas rossi@horizon.com.br Rodrigo Matheus Pereira Mestrando emMicrobiologia e Especialista em Bioinformática UniversidadeEstadualPaulista rodrigus@fcav.unesp.br Sílvia Jardim Mestre emFarmacologia e Especialista em Bioinformática Embrapa Milho e Sorgo silviajardim@yahoo.com.br Vanderson de Souza Sampaio Mestrando emGenética e Biologia MoleculareEspecialistaem Bioinformática Universidade Federal doPará vander@ufpa.br Áurea V. Folgueras-Flatschart Doutora emMicrobiologia e Especialista em Bioinformática UniversidadeFederaldeMinasGerais folguera@bol.com.br INTRODUÇÃO Do início até meados do século passado os geneticistas e químicos se questionaram sobre a natureza química domaterial genético. Das pes- quisas desenvolvidas, surgiu a conclusãodeque o DNA era a molécula que armazenava a infor- mação genética e, em 1953, sua estrutura quí- mica foi desvendada no clássico trabalho de Watson e Crick. Com a posterior descoberta do código genético e do fluxo da informação bioló- gica, dos ácidos nucléicos para as proteínas, tais polímeros passarama constituir os principais objetos de estudo de uma nova ciência, a Biolo- giaMolecular. Logo surgirammétodos de se- qüenciamentodesses polímeros, principalmente do DNA, que permitiam a investigação de suas seqüênciasmonoméricas constituintes.Desde então, mais de 18 bilhões dessas seqüências já foramproduzidas e estão disponíveis nos ban- cos dedadospúblicos. Na segunda metade da década de 90, com o surgimento dos seqüenciadores automáticos de DNA, houve uma explosão na quantidade de seqüências a seremarmazenadas, exigindo recur- soscomputacionais cadavezmaiseficientes.Além do armazenamento ocorria, paralelamente, a ne- cessidade de análise desses dados, o que tornava indispensável a utilizaçãodeplataformas compu- tacionais eficientespara a interpretaçãodos resul- tadosobtidos. Assimnascia abioinformática. Essanova ciên- ciaenvolveria auniãodediversas linhasdeconhe- cimento a engenharia de softwares, a matemá- tica, a estatística, a ciência da computação e a biologiamolecular.Osprimeiros projetos na área eram compostos por profissionais de diferentes Biotecnologia Ciência & Desenvolvimento - nº 29 13 áreas da biologia e informática e percebia-se uma certa dificuldade de comunicação: enquantoobiólo- go procurava uma solução que le- vasseemconsideraçãoas incertezas e erros que ocorrem na prática, o cientista da computação procurava uma solução eficiente para umpro- blemabemdefinido.Assim, surgiua necessidade de um novo profissio- nal, que entendesse bem ambas as áreas e fizesse a ponte entre elas: o Bioinformata. Esse profissional de- veria ter o conhecimento suficiente para saberquais eramosproblemas biológicos reais e quais seriam as opções viáveis dedesenvolvimento e abordagem computacional dos problemas emquestão. Dado o sucesso e a importância que alcançaram os projetos Geno- ma e seus desmembramentos, o bioinformata temsidoumprofissio- nal requisitado e raro. No exterior, podemser encontradospelomenos 122cursosde formaçãoembioinfor- mática, em sua grandemaioria cen- tradosnaAméricadoNorteeEuropa (http://linkage. rockefeller.edu/wli/ bioinfocourse/).NoBrasil, entretan- to, até o início deste ano, não existi- am cursos que formassem tais pro- fissionais especializados. Políticas científicas governamentais têmpro- curado incentivara formaçãodegru- pos de pesquisa e de pessoal nessa área, financiandoprojetos e criando cursos depós-graduação. Em2002, foi implantado o primeiro Curso de Especialização (pós-graduação lato sensu) do LNCC (http://www. lncc.br/~biologia) - do qual forma- mos a segunda turma. Ainda neste ano foi autorizada pela CAPES a criaçãodedois cursosdedoutorado em Bioinformática, um na USP e outro na UFMG (http://www. capes.gov.br/). Parece-nos que cada vez mais a bioinformáticavaisernecessáriapara a análise de dados embiologiamo- lecular e, nesse sentido, o presente artigo foi escrito com o intuito de conter as informaçõesmais relevan- tes para quem deseja começar a trabalhar na área. Assim, tentamos apresentar os principais conceitos relacionadosàbiologiaeàcomputa- ção, os softwaresmais utilizados, os sitesmais freqüentados e asprincipais áreas de interesse. Sistemasoperacionais O sistema operacional (SO) é o principal programa de um computa- dor. Ele é responsável pelo gerencia- mento da memória, pelo acesso aos discos e também intermedeia todo acesso aos componentes físicos da máquina(hardware). Os SOs mais conhecidos e utiliza- dossãoaquelesbaseadosnoWindows, Unix e MacOS. Muitas das aplicações utilizadas embioinformática são com- piladas e distribuídas para a execução em plataformas derivadas do Unix, portanto o conhecimento desse siste- maoperacional édegrande importân- ciapara aquelesquedesejamaprofun- dar-se na área. Apreferência por siste- masbaseadosemUnixdeve-se ao fato de que tais sistemas são normalmente mais confiáveis, gerenciam melhor o trabalho comgrandes quantidades de dadosequealgumasdesuasvariantes, comooLinux,possuemcódigoaberto edistribuiçõesgratuitas. Linguagens de programação Umprofissionalembioinformática, além de saber utilizar os programas produzidosporoutrosprogramadores, deve também ser capaz de desenvol- ver programas aplicativos para lidar com os mais diversos problemas en- contrados durante a análise de dados embiologiamolecular. Paradesenvol- ver, portanto, tais programas, o bioin- formata deve ter conhecimento sobre algum tipo de linguagem de progra- mação. As Linguagensdeprogramação fo- ram criadas para facilitar a especifica- çãode tarefas a umcomputador. Exis- temmilharesde linguagensdeprogra-mação e cada uma delas possui um conjuntodecomandosespecíficosque criamesta interfacehomem-máquina. Das linguagens de programaçãomais utilizadas,podemoscitar:basic,pascal, C, C++, java, cobol e fortran. Entretan- to, a linguagem mais utilizada pelos bioinformatas é, sem sombra de dúvi- da, o PERL. O PERL (Practical Extract andRe- port Language) é uma linguagem de programação, simples e muito rica, alémdedisponível gratuitamente. Foi criada por Larry Wall, originalmente para produzir relatórios de informa- ções de erros, que a disponibilizou na Internet no espírito freeware, pensan- doquealguémpudesseachá-laútil.Ao longo dos anos esta linguagem con- quistoumilhares de adeptos e, através de várias colaborações recebidas para seu aprimoramento, o PERL é hoje conceituado como uma linguagem sofisticada, que possui como ponto forte amanipulaçãode texto,masque, alémdisso,possui todasas característi- cas de uma linguagem de alto-nível genérica. Éessagrande facilidadepara a manipulação de texto que fez do PERL a linguagem mais utilizada no tratamentodedadosde seqüências de DNA e proteínas. OPERLpode ter suas funcionalida- des acrescidas através de módulos, que são distribuídos gratuitamente. Existem módulos para uma gama de aplicações, desdemétodosestatísticos clássicos, aplicações gráficas em 3D, até acesso a internet via programação PERL. O site CPAN (Comprehensive Perl Archive Network http://www. cpan.org) éoprincipalpontodedistri- buiçãodemódulos e de suas respecti- vas documentações. Alguns destes módulos são especialmente dirigidos para aplicações em Bioinformática, destacando-se os módulos bioperl e biographics,queapresentamferramen- tas bastanteúteis para asmais diversas aplicações nesta área. Umaboa interconectividade com bancos de dados é outra característi- ca desejada em uma linguagem de programação.A linguagemPERL atende muito bem a esta demanda através da biblioteca PERL-DBI, um conjunto demódulos que fornece uma interface consistente para solu- ções de integração com bancos de dados. Bancos de dados Emconseqüência da grande quantidade de informações de se- qüências de nucleotídeos e de ami- noácidosque sãoproduzidas atual- mente, principalmente em projetos Genoma, TranscriptomaeProteoma, o uso dos bancos de dados vem as- 14 Biotecnologia Ciência & Desenvolvimento - nº 29 sumindouma importância crescente nabioinformática. Um banco de dados pode ser consideradoumacoleçãodedados inter-relacionados,projetadopara suprir as necessidades de um grupo específico de aplicações e usuários. Um banco de dados organiza e es- trutura as informações demodo a facilitar consultas, atualizações ede- leções de dados. A grandemaioria dos bancos de dados é atrelado a um sistema deno- minado SGBD (Sistema de Gerencia- mento de Banco de Dados). Este sistema é responsável por intermedi- ar os processos de construção,mani- pulação e administração dobanco de dados solicitadospelosusuáriosou poroutras aplicações. Existem vários sistemas de geren- ciamento de banco de dados, sendo que cada sistema possui seus prós e contras. Omysql é um sistema muito utilizadopela comunidadeacadêmica e em projetos genoma por ser gratui- to, possuir código aberto e acesso veloz aos dados,mas apresenta certas limitações em suas ferramentas. O postgreSQL também é um SGBD gra- tuito, com ferramentasmuitopodero- sas, entretanto não é muito utilizado pela dificuldadeno seugerenciamen- to.Os SGBDsOraclee SQLServer são robustos e sofisticados,masdevidoao alto custo de suas licenças possuem seuuso limitadoàsgrandes empresas. Bancos de dados públicos embioinformática O investimento contínuo na cons- trução de bancos de dados públicos é um dos grandes motivos do sucesso dos projetos genoma e, em especial, doProjetogenomaHumano.Devidoà magnitudedoconjuntodedadospro- duzidos torna-se fundamental a orga- nização desses dados em bancos que permitamacessoon-line. Os bancos de dados envolvendo seqüências de nucleotídeos, de ami- noácidos ou estruturas de proteínas podemser classificados embancosde seqüências primários e secundários. Osprimeiros são formadospeladepo- sição direta de seqüências de nucleo- tídeos, aminoácidosouestruturaspro- téicas, sem qualquer processamento BOX1 - Exemplo de programa PERL para obter a fita reversa- complementar a partir de uma seqüência de DNA desejada. #!/usr/bin/perl # Seqüência que se deseja utilizar $meuDNA= TTCCGAGCCAATTGTATCAGTTGCCAATAG; # Inverte a ordem da seqüência de DNA $RevCom = reverse $meuDNA; # Troca as bases produzindo a fita complementar $RevCom =~ tr/ACGT/TGCA/; print Minha seqüência invertida é: \n $RevCom; A primeira linha é obrigatória e diz ao programa o caminho onde se encontra o interpretador PERL para que o programa possa achá-lo na hora de sua execução. As linhas seguintes que se iniciam com o sinal de # representam linhas de comentário. As variáveis em PERL são sempre seguidas do sinal de $ e não precisam ser declaradas, cabe ao programador saber como e em que contexto devem ser utilizadas. Os comandos terminam sempre com ponto-e-vírgula e o sinal de =~ está relacionado àutilizaçãodeumaexpressão regular. BOX2 - Principais Sistemas de Gerenciamento de Bancos de dados MySQLhttp://www.mysql.org Acesso livre para download do gerenciador MySQL, como também a várias ferramentasdeconexãocomo:DBI, Java,ODBCeetc.Apresentadocumentação completa. PostgreSQLhttp://www.pgsql.com/ Acesso livre para download do gerenciador PostgreSQL, como também algumas ferramentas. Apresenta documentação completa. ORACLEhttp://www.oracle.com Informações comerciais sobre obancodedados. MicrosoftSQLServerhttp://www.microsoft.com/sql/ Informações comerciais sobre obancodedados. BOX3 - Bancos de Dados mais utilizados em bioinformática Genbankhttp://www.ncbi.nlm.nih.gov/ Banco de dados americano de seqüências de DNA e proteínas. EBIhttp://www.ebi.ac.uk/ Banco de dados europeu de seqüências de DNA. DDBJhttp://www.ddbj.nig.ac.jp/ Banco de dados japonês de seqüências de DNA. PDBhttp://www.rcsb.org/pdb Armazenaestruturas tridimensionais resolvidasdeproteínas. GDBhttp://gdbwww.gdb.org/ Banco de dados oficial do projeto genoma humano. TIGRDatabaseshttp://www.tigr.org/tdb/ Banco com informações de genomas de vários organismos diferentes. PIRhttp://www-nbrf.georgetown.edu/ Bancodeproteínas anotadas. SWISS-PROThttp://www.expasy.ch/spro/ Armazena seqüências de proteínas e suas respectivas características moleculares, anotadomanualmente por uma equipe de especialistas. INTERPROhttp://www.ebi.ac.uk/interpro/ Bancode dados de famílias, domínios e assinaturas de proteínas. KEGGhttp://www.genome.ad.jp/kegg/ Banco comdados de seqüências de genomas de vários organismos diferen- tes e informações relacionadas às suas viasmetabólicas. Biotecnologia Ciência & Desenvolvimento - nº 29 15 ou análise. Os principais bancos de dadosprimários sãooGenBank, oEBI (European Bioinformatics Institute), o DDBJ (DNA Data Bank of Japan) e o PDB (Protein Data Bank). Os três primeiros bancos são membros do INSDC (International Nucleotide Se- quenceDatabaseColaboration)ecada umdessescentrospossibilita a submis- são individual de seqüências deDNA. Eles trocam informações entre si diari- amente, de modo que todos os três possuem informações atualizadas de todas as seqüências deDNAdeposita- das em todo o mundo. Apesar disso, cada centro apresenta seus dados de forma particular, apesar de bastante semelhante. Atualmente amaioria das revistas exige que as seqüências iden- tificadaspelos laboratórios sejamsub- metidas a um destes bancos antes mesmodapublicação do artigo. Os bancos de dados secundários, como o PIR (Protein Information Re- source)ouoSWISS-PROT, sãoaqueles que derivam dos primários, ou seja, foram formados usando as informa- ções depositadas nos bancos primári- os. Por exemplo, o SWISS-PROTéumbanco de dados onde as informações sobre seqüências de proteínas foram anotadas e associadas à informações sobrefunção,domíniosfuncionais,pro- teínas homólogas e outros. Os bancos de seqüências também podemser classificados comobancos estruturais ou funcionais. Os bancos estruturais mantêm dados relativos à estrutura de proteínas. Embora a se- qüência de nucleotídeos, a seqüência de aminoácidos e a estruturadeprote- ína sejam formas diferentes de repre- sentar o produto de um dado gene, esses aspectos apresentam informa- ções diferentes e são tratadospor pro- jetos diferentes, que resultamemban- cos específicos. Dos bancos funcionais, o KEGG (Kyoto Encyclopedia of Genes and Genomes) é um dos mais utilizados. Disponibiliza links para mapas meta- bólicos de organismos com genoma completamente ou parcialmente se- qüenciados apartir de seqüências ede busca atravéspalavras-chave. Comocrescentenúmerodedados biológicos que vem sendo gerados, vários bancos de dados têm surgido e anualmente a revista Nucleic Acids Figura 2 Alinhamento de duas seqüências de proteínas Research(http://www3.oup.co.uk/nar/ database/)publicauma listaatualizada comaclassificaçãode todososbancos dedadosbiológicosdisponíveis. Alinhamento de seqüências Oalinhamentode seqüênciaspos- sui uma diversidade de aplicações na bioinformática,sendoconsideradauma dasoperaçõesmais importantes desta área.Estemétododecomparaçãopro- curadeterminarograude similaridade entre duas ou mais seqüências, ou a similaridade entre fragmentos destas seqüências. No caso de mais de duas seqüências oprocesso édenominado alinhamentomúltiplo. É bom lembrar que similaridade e homologia sãoconceitosdiferentes.O alinhamento indica o graude similari- dadeentre seqüências, já a homologia é uma hipótese de cunho evolutivo, e nãopossui gradação: duas seqüências são homólogas caso derivem de um ancestral comumou, casoesta hipóte- se não se comprove, simplesmente nãosãohomólogas. Existemvários programasde com- putador que realizam esta tarefa e a grandemaioria deles pode ser utiliza- do on-line, sem a necessidade de ins- talação. Comoexemplo temosospro- gramas: ClustalW, Multialin, FASTA, BLAST 2 sequences, etc. Oprocesso consiste em introduzir espaços (gaps) entre os monômeros de uma ou mais seqüências a fim de obter omelhor alinhamento possível. A qualidade de um alinhamento é determinada pela soma dos pontos obtidos por cada unidade pareada (match) menos as penalidades pela introdução de gaps e posições não pareadas (mismatch). Matrizesdesubstituição Matrizes de substituição são uma alternativa aos valores fixos depontu- ação paramatches emismatches. Es- Figura 3. Parte de uma matriz de substituição BLOSUM62, utilizada em alinhamentos de seqüências de proteínas. As letras representam os aminoácidos e os números indicam os pontos a serem contabilizados na ocorrência de match (diagonal principal) ou mismatch tas matrizes indicam os diferentes va- lores a seremcontabilizadospara cada par deunidades. Asmatrizesdesubstituiçãosãonor- malmente utilizadas no alinhamento de seqüênciasprotéicas.Assimovalor de cada uma de suas células indica a chance da ocorrência da substituição correspondente ao par de aminoáci- dos destemismatch. As matrizes de substituição mais utilizadas são aquelas pertencentes às famílias de matrizes PAM (Point Ac- ceptedMutation) eBLOSUM.Amatriz PAM1 foi construída atravésda análise demutações entre proteínas homólo- gas com 1% de divergência (1% dos aminoácidos diferentes). As outras matrizes, PAM50, PAM100, PAM250 são extrapolações damatriz PAM1.As matrizes BLOSUM foram construídas tendo como base os alinhamentos do banco demotivos BLOCKS. Umama- triz BLOSUM62 é definida através da análisedas substituiçõesnas seqüênci- as de BLOCKS que possuem menos 16 Biotecnologia Ciência & Desenvolvimento - nº 29 que62%de similaridade.As seqüênci- as que ultrapassam este limite são mescladas, e participam da definição da matriz como se fossem uma única seqüência. Alinhamento global e local Quantoàregiãoanalisada,oalinha- mentode seqüênciaspodesergrossei- ramente classificado em dois tipos, o alinhamento global e o alinhamento local. No alinhamento global, as se- qüênciasenvolvidasdevemseralinha- das de um extremo ao outro, dando origem a apenas um resultado. Já no alinhamento local, procura-se alinhar apenas as regiões mais conservadas, independente da localização relativa decada regiãoemsuaseqüência.Con- sequentemente, este alinhamento tem como resultado uma ou mais regiões conservadas entre as seqüências. Oalinhamento global é freqüente- mente utilizado para determinar regi- ões mais conservadas de seqüências homólogas. Exemplo de programas queutilizamestealinhamentosãoClus- talWeMultialin.Oalinhamento local é geralmente utilizado na procura por seqüências homólogas ou análogas (funcionalmente semelhantes) em bancodedados.Oalgoritmoutilizado pelo programa BLAST (Basic Local Alignment Search Tool) realiza este tipode alinhamento. Figura 4: Exemplos de alinhamento global e local. No alinhamento global as seqüências são alinhadas do início ao fim, já no alinhamento local alinha-se as subseqüências conservadas BOX4-Softwaresmaisutilizadosparaoalinhamentodeseqüências ClustalWhttp://www.ebi.ac.uk/clustalw/index.html Versãowebdeumdosprogramasde alinhamentomúltiplomais utilizados (Clustal). Fornece ao usuário uma grande quantidade de parâmetros e de saídas diferentes. Possui interface gráfica ondeos alinhamentospodemser visualizados de forma agradável e alterados. Multialinhttp://prodes.toulouse.inra.fr/multalin/multalin.html Programade alinhamentomúltiplo bastante conhecido. Fácil e rápido. Fastahttp://www.ebi.ac.uk/fasta33/ Precursor dosprogramasdealinhamento. Promove serviço de busca em banco de dados de ácidos nucléicos e proteínas. BLAST,BLAST2sequenceshttp://www.ncbi.nlm.nih.gov/BLAST/ BLAST é o programa de alinhamento mais utilizado no mundo. Realiza a buscapor seqüências homólogas embancodedadosde ácidosnucléicos e proteínas.OprogramaBLAST2sequencesconsistenoalgoritmoBLASTpara alinhamentodeduas seqüências. Projetos genoma e transcriptoma Grande parte dos bioinformatas modernos trabalha comdadosdepro- jetos genoma ou transcriptoma. Em projetos genoma adota-se a aborda- gemde fragmentar todo o genoma de umorganismoempequenos pedaços e de seqüenciar tais pedaços, utilizan- do programas computacionais para montá-los e reconstituir a informação genômica inicial. Essaestratégiaéado- tadaprincipalmentedevidoà restrição do tamanho da seqüência que pode ser lidanos seqüenciadores.Mesmoos maismodernos conseguem ler apenas cerca de 1000 pares de base em cada corrida. Emprojetos genomasdeprocario- tos, normalmente realiza-se a quebra doDNAinteirodoorganismodesejado em fragmentos pequenos (através da técnica de shotgun) que são clonados em vetores plasmidiais que serão se- qüenciados em suas extremidades. Após uma primeira etapa de monta- gemdesse genoma, fragmentosmaio- res são clonados em cosmídeos e se- qüenciados. Essa segunda etapa é im- portantepara amontagemdogenoma completo do organismo, já que a pri- meira normalmente produz uma se- qüência incompleta, apresentandoal- guns buracos de seqüência (gaps). Já em projetos genomas de orga- nismos eucariotos, que possuem fre- qüentemente uma enorme quantida- de de DNA, normalmente prefere-se adotar uma técnica conhecida como shotgun hierárquico. Nessa técnica, o DNA inteiro doorganismoéprimeira- mente inserido emgrandes vetores de clonagem,comocromossomosartifici- ais de bactérias (BACs) ou de levedu- ras (YACs). Depois então é realizado um shotgun desses grandes fragmen- tos dos vetores, gerando fragmentos menores que são agora clonados em vetores plasmidiais para o sequencia- mento. Portanto, tais projetos consis- tem de duas etapas, a montagem decada um dos grandes fragmentos clo- nadosnosBACseYACseamontagem final que reunirá as seqüências com- pletas dos BACs e YACs montados para a reconstituição da informação genômica inicial. Biotecnologia Ciência & Desenvolvimento - nº 29 17 Figura 5. a) Na estratégia de shotgun, todo o DNA genômico de um organismo é fragmentado em pequenos pedaços (1), que são clonados em vetores de pequeno porte, como plasmídeos, para o posterior se- qüenciamento. b) Na estratégia de shotgun hierárquico, normalmente utilizada para grandes genomas, realizam-se dois passos. (1) Primei- ramente fragmenta-se o genoma em grandes pedaços, que são clona- dos em vetores de grande porte, como BACs ou YACs. (2) Posterior- mente realiza-se uma segunda etapa de shotgun, onde as seqüências contidas nesses vetores são fragmentadas em pequenos pedaços e clo- nadas em vetores de pequeno porte, que serão sequenciados Muitas vezes, ao invés de ser reali- zado o seqüenciamento genômico de um organismo eucarioto, prefere-se realizar o seqüenciamento sódas regi- ões gênicas, utilizando informações oriundasdeRNAmensageiro (mRNA). Dessa formaérealizadaumabiblioteca de cDNA, representando o conjunto de mRNAs de uma célula, que são clonados em vetores plasmidiais. Os insertos de cDNA presentes em tais vetores são então seqüenciados apar- tir de suas extremidades 5 ou 3, produzindopequenas seqüênciasque irão representar pedaços dos genes expressosnomomentodaextraçãodo mRNA da célula em questão. Esses pedaços seqüenciados representam etiquetas degenes expressos, ouESTs (ExpressedSequenceTags) e umaaná- lise dos genes expressos é uma abor- dagem bastante utilizada na tentativa de entender o funcionamento dome- tabolismo dos mais diversos organis- mos.Comoexemplo,noBrasil aborda- gens transcriptômicas já foramutiliza- dasem largaescalanoprojetodacana- de-açúcar e vêm sendo utilizados em organismos parasitas, como é o caso dos projetos de seqüenciamento de ESTs de SchistosomamansoniemSão Paulo e emMinas Gerais. Como já foi mencionado anterior- mente, normalmente adota-se a estra- tégia de seqüenciamento genômico em organismos cujo genoma é peque- no e que contém baixa quantidade de seqüências repetitivas. Entretanto, a estratégia de seqüenciamentodo trans- criptoma, ouaproduçãodeESTs, nãoé utilizada apenas quando o genoma do organismoémuitogrande.Essaestraté- gia é importante tambémparaestudaro desenvolvimentodosorganismos, pro- duzindobibliotecas de diferentes fases dedesenvolvimentoeobservandoquais genes são expressos em cada momen- to. Tal abordagem tambémé importan- te para estudarmos como ocorre a ex- pressão diferencial de genes em dife- rentesórgãosdeummesmoorganismo, para que possamos entender a função desses órgãos ou como eles realizam funçõesconhecidas. Portantopodemos dizer que as estratégias de seqüencia- mento de genomas e transcriptomas são complementares e ambas devem ser realizadas, quando possível, para que possamos obter informações rele- vantes sobre os organismos que esta- mosestudando. Base calling Os dados brutos provenientes do seqüenciadordeDNAsãonormalmente submetidos diretamente a algum pro- grama de base calling. O base calling consiste no processo de leitura dos da- dos do seqüenciador e identificaçãoda seqüência de DNA gerada, atribuindo ainda um valor de qualidade para cada posição nucleotídica identificada. Nor- malmente cada seqüenciador apresenta umprogramadebasecallingassociado. Entretanto, o programa mais utilizado nessa etapa é o PHRED. O PHRED reconhece dados de se- qüências a partir de arquivos SCF (Stan- dard Chomatogram Format), arquivos decromatogramadosanalisadoresauto- máticosdeDNAABIearquivosMegaBA- CE ESD. Este software reconhece a se- qüência de nucleotídeos a partir do ar- quivodedadosbrutosdo seqüenciador, atribui valores de qualidade às bases constituintesdaseqüêncianucleotídicae gera arquivos de saída contendo infor- mações sobre o basecall eos valores de qualidade.O valor de qualidade das se- qüênciasanalisadaspodeserencontrado nos arquivos FASTA e PHD. De acordo comEwing etal (1998) as atribuiçõessegurasdevaloresàs seqüên- cias nucleotídicas são proporcionadas pela implantação de um algoritmo que tem como base os métodos de Análise deFourier.Oalgoritmoanalisa asquatro bases e prediz a provável região central dospicoseasdistâncias relativasentreos picos da seqüência de DNA. O valor de qualidadeatribuídoacadabaseéobtido pela fórmula a seguir, que calcula a probabilidadedeerronobasecall, onde oPeéaprobabilidadedeumabaseestar errada. PHRED Quality = -10 log (Pe) Aspontuações inseridasnosarquivos de saída do PHRED representam a pro- babilidade logarítmicanegativaemesca- la de erro de um base call; portanto, quanto maior o valor de qualidade do PHRED, menor a probabilidade de ter ocorridoumerro. Sócomoexemplo,um valordePHRED20paraumadetermina- daposiçãonucleotídica significaqueela apresenta uma chance em 100 de estar errada. Já um valor de PHRED 30 signi- fica que determinada base apresenta uma chance em 1000 de ter havido um erro no base calling. Esses valores são importantes para determinar se uma re- giãoprecisa ser resseqüenciada. Mascaramento de vetores A estratégia freqüentemente adota- da após a realização do base calling é a 18 Biotecnologia Ciência & Desenvolvimento - nº 29 procurapor regiõesde contaminantes na seqüênciaproduzida. Regiões con- taminantes são partes da seqüência obtidaquenão representamoDNAou o cDNA que se deseja analisar. Tais regiões representam, normalmente, partes dos vetores de clonagem onde as seqüências de interesse foram inse- ridasoupedaçosdeDNAadaptadores utilizados durante a construção das bibliotecas. Como essas regiões não representam as seqüências que se deseja analisar, elas devem ser retira- dasoumascaradasporumprograma.E aqui, o programa mais utilizado é o Cross_match. Esse é, na verdade, um programapara a comparação de duas seqüências e é preciso utilizar como entrada um arquivo apresentando a seqüência dos vetores que se deseja mascarar. O que o Cross_match faz é comparar a seqüência desejada como arquivo de seqüências de vetores e, ondeoprogramaencontrar similarida- deentreas seqüências, ele irámascarar (acrescentando letras X) a seqüência deentrada.Assim,osnucleotídeosdas seqüênciasdeentrada similares a regi- ões de vetores de clonagem serão alteradosparaXenão atrapalharãoos processosposteriores de análise com- putacional. Agrupamento de seqüências Após a geração de arquivos sem contaminantes, contendoa identifica- çãodasbaseseaqualidade, todasessas informações são repassadas a um sof- twaredemontagemcomooPHRAP,o CAP3ouoTIGRAssembler.O softwa- remaisutilizadonessaetapa,oPHRAP (Phragment Assembly Program) é o programa responsável pela leitura das informações do basecall emontagem dos pequenos fragmentos de DNA seqüenciadosemseqüênciasmaiores, os contíguos (contigs). Este programa possui diversos pontos chaves para a obtençãoderesultado final satisfatório, como: construção de seqüência do contíguo através de um mosaico de partes das seqüências com alta quali- dade; utilização de informações da qualidade dos dados computados in- ternamente e de implementações fei- tas pelos usuários para aumentar a qualidadedamontagem;apresentaex- tensivas informações sobre a monta- gem realizada (incluindo valores de qualidadesparaa seqüênciadoscontí- guos). Emprojetos genomaespera-se obter, na saídadoPHRAP, a seqüência montadadocontíguogenômico. Jáem projetos trancriptoma esperamos ob- ter as seqüências de cada dos genes expressos após a execução deste sof- tware de montagem. Avisualizaçãoeediçãodasseqüên- cias geradas após a montagem são realizadas normalmente através do programaPhrapviewouConsed. Figura 6: Interface do programa Consed BOX5-Programasmaisutilizadosemprojetosgenomaetranscriptoma PHREDhttp://www.phrap.orgSoftware para a realização do base calling e a produção do cromatograma processado. CROSS-MATCHhttp://www.phrap.org Software para a comparação entre duas seqüências de DNA. Normalmente utilizadopara omascaramentode regiões representando vetores em seqüên- cias genômicas ou de cDNA. Distribuído juntamente com o PHRAP. PHRAPhttp://www.phrap.org Software mais utilizado para a realização do agrupamento de seqüências (clustering analysis) e montagem de contíguos genômicos. CAP3http://genome.cs.mtu.edu/cap/cap3.html Software utilizado para o agrupamento de seqüências e montagem de contíguos genômicos. Utiliza umalgoritmodiferente doPHRAP. CONSEDhttp://www.phrap.org Softwaremaisutilizadoparaavisualizaçãodos resultadosobtidospor softwares deagrupamentodeseqüências.Permiteaediçãodasbases seqüenciadas, além dediversos outros recursos. O processo de anotação gênica Uma vez obtidos os dados do seqüenciamento dasmoléculas deDNA é preciso saber o que representa cada umadas seqüênciasnucleotídicasprodu- zidas.Aanotaçãoconsiste simplesmente no processo de identificação dessas se- qüências. Emprojetos genoma, estepro- cesso normalmente é realizado em três etapas: anotação de seqüências de nucleotídeos, de seqüências protéicas e deprocessosbiológicos. Biotecnologia Ciência & Desenvolvimento - nº 29 19 Figura 7: Etapas da anotação em projetos genoma e as perguntas que se deseja responder em cada uma delas Apartir da anotaçãode seqüências nucleotídicasprocura-se,primeiramen- te, identificar anaturezadeumadeter- minada seqüência. Devemos desco- brir se tal seqüência está inserida em uma região gênica, se representa uma molécula de RNA transportador ou RNAribossômico, sepertenceaalgum tipo de região repetitiva já descrita ou seapresenta algummarcadorgenético conhecidoemseu interior.Oprincipal objetivo dessa etapa é construir um mapadogenomadoorganismo, posi- cionandocadaumdospossíveisgenes e caracterizando as regiões não-gêni- cas. Nesta fase, alguns programas de predição gênica são usados para a localização depossíveis genes nas se- qüências de DNA. A procura por ele- mentos comoocódonde iniciaçãode proteínas (a trinca de nucleotídeos ATG)e códonsde terminaçãonames- ma fase de leitura são utilizados por alguns desses programas. O tamanho delimitado por esta janela de leitura é freqüentemente utilizadopara definir uma determinada região como sendo gênica ou não. Alguns outros progra- mas sãocapazesde identificar, depen- dendo do genoma analisado, regiões gênicas codificadoras (éxons) e não codificadoras (íntrons). Alguns exem- plos são oGenomeScan e oGenScan. Em projetos de trancriptômica, onde se utiliza a abordagem de seqüencia- mento de ESTs, essa etapa não é realizada, uma vez que todas as se- qüências produzidas se restringem a regiões gênicas. Mapeados os genes, a etapa se- guinte consiste em identificar quais proteínas são codificadas, enisso con- siste o processo de anotação das se- qüências protéicas. Nessa etapa, pro- cura-semontarumcatálogodosgenes presentesnoorganismoestudado,dan- do-lhes nomes e associando-os a pro- váveis funções. No caso de projetos genoma, deseja-se identificar onúme- ro total degenespresentesnoorganis- mo seqüenciado, já que há informação da seqüência de DNA de todo o geno- ma. Já em projetos transcriptoma, a tarefa consiste em identificar os genes expressosnoorganismoemumadeter- minada condição. Apesar de não ser capaz de identificar todos os genes de umdeterminadoorganismo,osprojetos de transcriptômica podem permitir a identificação de genes expressos em diferentes tecidos e fases de desenvol- vimento, alémdepermitir a observação daqueles que apresentam variantes de splicing. Portanto,nessaetapadaanota- ção, o principal objetivo é identificar e caracterizar cadaumadasproteínas co- dificadas pelos mRNAs presentes no organismo estudado em determinada condição. A parte mais interessante e desafia- dora dosprocessos de anotaçãogênica é relacionar, finalmente, a genômica comos processos biológicos, e essa é a etapadeanotaçãodosprocessosbioló- gicos. Essa etapa é comum a projetos genomae transcriptoma. Identificados os genes, devemos agora tentar relaci- oná-losdemodoaobtermosummapa funcionaldoorganismoestudado.Nes- se pontodeve-se identificar quais vias bioquímicas estão completas ou in- completas no organismo e quais vias alternativas ele possui. Aqui é funda- mental a participação de biólogos es- pecialistas emdiversas áreas para que se possa descobrir como ometabolis- modoorganismopode influenciar seu modo de vida e seu comportamento. Esse é o momento onde é possível levantar várias hipóteses que relacio- nemo funcionamentodosorganismos comseusdadosgenômicos.Taishipó- teses devem ser testadas experimen- talmente, por pesquisadores que tra- balhemcomoorganismoestudado. Como é realizada a anotação Até aqui foi mostrado o que é normalmente feito em um processo de anotação gênica. Vejamos agora como tal processoé realizado. Lincoln Steindefiniumuitobemcomoaconte- ce a sociologia dos projetos de anota- ção gênica. Ele dividiu o processo de anotação de genomas em três etapas: a fábrica, o museu e a festa. BOX6 Principais softwares utilizados durante a anotação gênica RepeatMaskerhttp://repeatmasker.genome.washington.edu/ Utilizado para a identificação e omascaramento de regiões repetitivas freqüentemente encontradas em genomas. Genscanhttp://genes.mit.edu/GENSCAN.html Utilizado para a predição de genes em genomas eucarióticos. Seu método de predição é baseado em cadeias escondidas deMarkov. tRNAscan-SEhttp://www.genetics.wustl.edu/eddy/tRNAscan-SE/ Utilizado para encontrar genes de tRNA em uma seqüência genômica. BLASThttp://www.ncbi.nlm.nih.gov/BLAST Utilizadopara encontrar similaridades entre seqüências denucleotídeos e proteínas contra bancos de dados com grande número de seqüências dos mais diversos organismos. É umdosprincipais programas utilizados na identificaçãodos genes. Interprohttp://www.ebi.ac.uk/interpro Utilizadopara realizar buscas contra diferentes bancos dedados dedomínios e famílias de proteínas. Integra os serviços do Pfam, PRINTS, ProDom, PROSITE, SMART, TIGRFAMs e SWISS-PROT. GeneOntologyhttp://www.geneontology.org Consórcio destinado a produzir umvocabulário comuma ser aplicado para a classificação dos genes presentes em organismos eucarióticos. Cada gene é classificado em três níveis: funçãomolecular, processos celulares e localizaçãocelular. 20 Biotecnologia Ciência & Desenvolvimento - nº 29 Na primeira etapa trabalham ape- nas as ferramentas de bioinformática, funcionando em larga escala, como umafábrica.Assim,as seqüênciasobti- daspassamporumagrandediversida- dedeprogramas,quedevemajudaros anotadoresa identificá-laseagrupá-las para a próxima fase. A segunda etapa necessita de es- pecialistas que observem os dados obtidos na primeira etapa pelas ferra- mentas automáticas eque, comocura- dores de um museu, identifiquem as seqüências de acordo com critérios pré-definidos. Após a identificação dos genes, é feita a anotação dos processos. Nesse momento deve-se promover a intera- ção entre vários anotadores, bioinfor- matas ebiólogosespecialistas emdife- rentes áreas enoorganismoestudado. Nessa festa deve-se discutir como as informaçõesobtidasnas etapas anteri- ores podem estar relacionadas com a biologia doorganismoemquestão. A era pós-genômica Umadas característicasmais fasci- nantes da explosão, ocorrida nos últi- mos 10 anos, de projetos e consórcios destinados a compor o genoma com- pletodosmaisdiversosorganismos, foi o estabelecimento de abordagens e tecnologias que permitiram um estilo linha-de-montagemnaobtenção,em temposcadavezmais curtos, dequan- tidades industriais de seqüências de ácidos nucleicos (DNAeRNA). Agora começamosaenfrentaroproblemade interpretar e adicionar significado a essas seqüências. Temos agoraque, a partir dos bancos dedados existentes, processarecorrelacionarosdadosbru- tos transformando-oseminformaçãoe apartir desta informaçãogerar conhe- cimento, que é a informação testada experimentalmente.Nofinal, estanova etapa promete ser uma jornada, pro- vavelmente sem fim, através das pro- teínas, suas estruturas e funções, vias metabólicase interaçõescelulares.Esta mudança do foco de atenção, dos áci- dos nucleicos para as proteínas, tem sido utilizada para batizar esta nova etapa da pesquisa biológica em larga escalacomoEraPós-Genômica.Con- tudo, trata-se apenas de mais uma etapa e, certamente, não aúltimapara que os frutos dos programas de se- qüenciamento de genomas possam ser colhidos. Etapas estas que foram previstas pelo Projeto do Genoma Humano. Das cinco metas a serem atingidas, o estudo da expressão de proteínas e a obtenção de mapas de interaçãoproteína-proteínaocupamo segundoe terceiro estágios, dos quais seesperaomaior impactoeconômico, levandoàdescoberta denovasdrogas e reduzindo o seu tempo de entrada nomercado. Resumidamente,naEraPós-Genô- mica procura-se estudar a expressão dos genes codificados pelo genoma dos organismos, tecidos, células ou compartimentos celulares em deter- minadas condições fisiológicas (por exemplo, uma doença, uma situação de estresse ou ainda a administração de uma droga). Tentando entender a resposta a essas condições, são alvos deestudos: a ativaçãoou repressãode determinados genes, a indução de mudanças no estado pós-traducional dasproteínasequalquerprocessoque resulte na modificação do número e/ ou da composição das proteínas exis- tentes. Análise da Expressão Gênica Lembrando do dogma central da biologia (DNA→mRNA→Proteína), é facil perceberquepodemosavaliar a expressãogênica atravésdaanálisede transcritos (mRNA). Emorganismoseucariotos, a facili- dadede isolamentodosmRNAs (usan- dooligonucleotídeospoli-T para cap- turar os mRNAs pela cauda poli-A), a possibilidadeda transcrição reversado mRNA para cDNA (usando a técnica de RT-PCR) e o domínio das técnicas de seqüenciamento emmassa de cD- NAs tornarampossível a análise quali- tativa e quantitativa, em larga escala, dos genes transcritos em organismos, tecidos e células. Desta forma, nos projetos Transcriptoma, como já co- mentado, é feito o seqüenciamento parcial de cDNAs representativos da população de mRNA de maneira a permitir a identificação de diferentes transcritos (pela comparação das se- qüências do cDNA) e sua abundância na população (pelo número de vezes em que cada transcrito é seqüencia- do). As técnicasmais usadas são as de ESTs e SAGE (Serial Analysis of Gene Expression).Nestaúltima técnica,mais recente, são gerados e seqüenciados concatâmeros de fragmentos de cD- NAs com apenas 10 ou 17 nucleotíde- os de cada mensageiro, respectiva- mentedenominadosSAGEtagseSAGE long tags. DNA chips e Microarrays Uma outra forma de análise de transcritos, que permite a busca de transcritos de genes específicos na populaçãodosmRNAsexpressos, usa o já conhecidoprincípiodahibridação deDNAasondasmoleculares.Asmais novas versões da técnica são os DNA chips eosmicroarrays, quepermitem a análise simultânea da expressão de milhares de genes. Nestas duas técni- cas, respectivamente,oligonucleotíde- osou fragmentosdecDNAconhecidos são ligados a uma lâmina de vidro e, em cada experimento de hibridação, osmRNAsdedois tipos celulares dife- rentes ou de células em duas condi- ções patológicas ou tratamentos são analisados. As duas populações de mRNAs são amplificadas e marcadas comdiferentes corantes fluorescentes (cianinas ou Cys), um verde e outro vermelho. Ao hibridarem com cada gene (oligo ou cDNA) aplicado sobre a lâmina de vidro, a cor verde ou vermelha de cada ponto (ou spot) indicaráqueessegeneestá sendomais transcrito em um tipo ou condição celular doquenooutro. A cor amarela indicará que o gene é transcrito igual- mente em ambos os tipos ou condi- ções celulares. Alémdisso, amaior ou menor intensidadedecadacor indicará maioroumenornível deexpressãodo gene. A enorme quantidade de dados geradanosexperimentosdeDNAchips emicroarrays são analisados por sof- twares específicos que envolvem métodosde inferência estatística.Uma etapa bastante importante na fase de análise dos resultados é a que chama- mos de normalização. Usando como referência os spots de genes controles (sabidamente expressos ou reprimi- dosnos tecidosoucélulas estudados), o que se busca é, basicamente, retirar dosvaloresdecada spota influênciade Biotecnologia Ciência & Desenvolvimento - nº 29 21 manchas espúrias (background) e de variações do processo de hibridação. Desta forma, apósanormalização, tor- na-se possível a comparação de spots de uma mesma lâmina ou de experi- mentosdiferentes. Emumaetapapos- terior, programasde clusteringprocu- ram identificar e agrupar os spots su- per-expressos, reprimidosouquenão temexpressão alteradanos tecidos ou célulasanalisadas.Apesardosmétodos de análise empregados, a falta de re- produtibilidadedos resultados aindaé umaqueixabastantecomum.Ousode maior númerode réplicas de cada spot e/ouabuscademétodosde inferência estatística mais adequados parecem ser úteis para a validaçãodestes resul- tados. Mais recentemente, comnovas téc- nicas para isolamento de mRNA de procariotos, projetos de ESTs e de microarray também têm sido desen- volvidosparaestesorganismos.Vários grupos de pesquisa em todo o Brasil estão iniciando projetos nesta área. Apenas como exemplo, entre os vári- osprojetosbrasileirosnestaárea temos o projeto Cooperation for Analysis of Gene Expression (CAGE) (http:// bioinfo.iq.usp.br/ehttp://www.vision. ime.usp.br/~cage/) e oProjetoGeno- ma Raízes da Embrapa Soja (http:// www.cnpab.embrapa.br/pesquisas/ gp.html). Projetos Proteoma Um problema que surge com a abordagem descrita acima, de avalia- ção da expressão gênica a partir da análise dos mRNAs transcritos, é que nemsempreaquantidadedeummRNA reflete a quantidade da proteína cor- respondente expressa na célula e, as- sim, não podemos relacionar direta- mente essa proteína a uma funçãonas células.Por isto,umaoutraabordagem, embora muito mais trabalhosa, tem sido usada para avaliar a expressão gênica: a análisedasproteínas expres- sas. Esta contrapartida protéica do genomaéconhecida comoproteoma. Por permitir relacionar diretamente a umaproteínadeterminada função,esta abordagem constitui um instrumento particularmente poderoso para eluci- darosmecanismoscelulares relaciona- BOX7 Exemplos de Projetos Transcriptoma: Procuram avaliar quais são os genes expressos, e quanto deles é expresso, a partir do seqüenciamento parcial dosmRNAs transcritos. Dadosobtidospela técnicadeSAGEpodemser consultadosnapáginahttp:/ /www.ncbi.nlm.nih.gov/SAGE/. JánobancodbESTestãodepositadasESTs dediversosProjetosTranscriptomadesenvolvidos em todoomundo (http:/ /www.ncbi.nlm.nih.gov/dbEST/). Mais informações sobre DNA Chips eMicroarrays Nestas técnicas, a verificação da expressão de genes específicos é feita em experimentos de hibridação em lâminas de vidro contendo milhares de fragmentos de DNA. Na página http://cmgm.stanford.edu/pbrown/, do pioneiro da técnica de microarray,Dr. PatrickBrown,hámais explicações, um forumdediscussão e bancos de dados demicroarrays. Na página http://ihome.cuhk.edu.hk/ ~b400559/array.html há informações sobre os equipamentes necessários, uma tabeladecomparaçãodosprogramasdeanálisemaisusados,noçõesde estatística aplicadas amicroarrays, sugestões de bibliografia, etc. Programa gratuíto para análise demicroarrays ScanAlyse: escrito porMichael Eisen, o programa pode ser obtido gratuita- mente napágina http://rana.lbl.gov/EisenSoftware.htm.Assinandoum ter- mo de compromisso, o autor permite, inclusive, o acesso ao código-fonte. dos ao desenvolvimento de doenças, ao mecanismo de funcionamento decompostos químicos (por exemplo, fármacos) e identificar novos alvos terapeuticos. As bases experimentais daproteô- mica não são novas e pertencem ao arsenal clássico da bioquímica, mas houve, nos últimos anos, um salto qualitativo e quantitativo sem prece- dentes.Esse salto foi resultadodegran- des investimentos privados na busca de abordagensmais agressivas e rápi- das no isolamento, identificação e ca- racterização de proteínas, no mesmo estilo industrial que caracterizou a era genômica.O isolamentodeprote- ínas em grande número, inicialmente repousavanas técnicaseletroforéticas, comoaeletroforesemonoebi-dimen- sional em géis de poliacrilamida. Em- bora tais técnicas certamente sempre venhama ter umpapel importante em qualquer laboratório de proteômica, nota-se hoje uma tendência cada vez maior nousoda cromatografia líquida dealtaeficiência, comousodecolunas capilares, no desempenho desta tare- fa.A identificaçãoecaracterizaçãodas proteínasdependedeumconjuntode tecnologias (com certeza as que mais sofreram incrementonodesempenho) envolvendo a espectrometria de mas- sa, a ressonância magnética nuclear, alémde recursos computacionais para aarmazenagem,análise e compartilha- mento dos diversos tipos de dados geradosporestas tecnologias (imagens degéisbidimensionais, sequênciaspro- téicas, estruturas protéicas, espectros de massa, etc.). Nos últimos anos a espectrometria demassa, emconjunto comacromato- grafia líquidadealtaperformance, vem se tornando a abordagem preferida para identificarecaracterizarproteínas, devido essencialmente a três motivos. O primeiro é o desenvolvimento de novosmétodospara ionizaçãodepro- teínas e peptídeos, especialmente o MALDI e o ESI (Matrix-Assisted Laser Dessorption-IonizationeElectroSpray Ionization). O segundo é o desenvol- vimentode recursosdabioinformática, permitindo a análise de dados obtidos por espectrometria demassas emban- cos genômicos ede sequências protéi- cas. Eo terceiro éque a espectrometria demassas fornece informaçãodetalha- da de modificações pós-traducionais, emparticular as fosforilações e glicosi- lações. 22 Biotecnologia Ciência & Desenvolvimento - nº 29 BOX8 MALDI e ESI MALDI - Matrix-Assisted Laser Desorption-Ionization Umaamostra deproteína oupeptídeo émisturada comum largo excesso de umamatriz, formadaporumasubstânciaqueabsorvenoultra-violeta, eposta para secar. Um laser comumcomprimento de onda que seja absorvido pela matriz, em um compartimento sob vácuo, incide sobre a amostra seca e fragmentos ionizadosda amostra são carreadospela vaporizaçãodamatriz e capturados por um campo elétrico do analisador demassas. ESI - ElectroSpray Ionization Umvoltagemaplicada emuma fina agulha contendo uma solução protéica, gera uma névoa de pequenas gotículas da solução, contendo pequeno número de moléculas protéicas. A redução das gotículas por evaporação acaba colocando em fase gasosa as proteínas ionizadas. Elas são então capturadas pelo analisador de massas. A grande vantagem desta técnica é permitir oacoplamentodiretodeumsistemacromatográficodealtaeficiência ao espectrômetro demassas, possibilitando a análise em fluxo contínuo de misturas protéicas complexas. No Brasil, apenas agora começa- mos a montar grupos de pesquisa nesta área. Merecem destaque as re- desdeproteômicaemSãoPaulo, sedi- ada no Laboratório Nacional de Luz Síncrotron (http://www.lnls.br/), eno Riode Janeiro (http://www.faperj.br/ interna. phtml?obj_id=219). As técnicas experimentais expos- tas acima, alémdeofereceremrespos- tas à curiosidadehumana, constituem formas inovadoras napesquisa para o combate de problemas globais como diabetes, câncer, hemofilia, etc... Na prática, independentemente do nú- BOX9 - Links interessantes Eletroforese bi-dimensional em géis de poliacrilamida (PAGE-2D) http://us.expasy.org/ch2d/protocols/ http://www.aber.ac.uk/parasitology/Proteome/Tut_2D.html Cromatografia líquida de alta eficiência, com o uso de colunas capilares (HPLC) http://www.ionsource.com/tutorial/chromatography/rphplc.htm http://www.ionsource.com/tutorial/capillary/introduction.htm Espectrometria deMassas (MS) http://ms.mc.vanderbilt.edu/tutorials/ms/ms.htm Software gratuíto para análise de PAGE-2D - Melanie DesenvolvidonoSwissProt, estádisponíveldiretamentenapáginadoSwiss Prot, http://www.expasy.org/ ou num link na página http:// www.science.gmu.edu/ ~ntongvic/Bioinformatics/software.html, que dá acesso amuitos outros programas debioinformática. mero de proteínas codificadas pelo genoma da espécie humana (o que ainda hoje é discutido), é previsível que em alguns anos possamos co- nhecer de 4000 a 10000 proteínas- alvo, sobre as quais medicamentos poderão agir. Para termos uma idéia da grandeza destes números, todo o arsenal terapêuticoqueconhecemos hoje atua sobre apenas 500 delas. O número de drogas disponíveis hoje nosEUA,derivadasdestasnovas tec- nologias, chegoua103noanopassa- do (21 delas foram aprovadas em 2000). Modelagemmolecular Aindaneste sentido, procurando associar proteínas a suas funções, a bioinformáticapodeedeverá trazer, nas próximasdécadas, suasmaiores contribuições àbiologia.Oconheci- mento da estrutura terciária de uma proteína constitui uma informação valiosa para determinação de sua função,poispodepermitir a identifi- caçãodedomíniosconhecidos,como sítios catalíticos, sítios de modifica- ção alostérica e outros. Além disso, tendo as estruturas tridimensionais das proteínas deter- minadas, podemos então realizar pesquisasmais direcionadasno sen- tidodeencontrar inibidores, ativado- res enzimáticos eoutros ligantesque permitam a produção de fármacos mais eficientes eespecíficos: o alme- jado Desenvolvimento Racional de Fármacos (RationalDrugDesign). Atualmente a abordagem mais eficaznadeterminarçãodaestrutura terciáriadeproteínaséaquelaque se utiliza de técnicas experimentais comoNMR (RessonânciaMagnética Nuclear) e cristalografiapordifração de raios-X. Dezenas de milhares de protéinas tiveramsuasestruturas ter- ciáriasconhecidasatravésdestesmé- todos e têm fornecido dados para o desenvolvimento de programas de modelagem e para a modelagem por homologia. Entretanto osméto- dos experimentais são, frequente- mente,procedimentosdispendiosos e de difícil execução. Além disso, existem limitações técnicas quedifi- cultamadeterminaçãodeváriaspro- teínas. A obtenção de cada proteína pura é um desses fatores limitantes. Outro fator é a dificuldade de crista- lizaçãodasproteínas, etapanecessá- ria para a determinaçãode estrutura por difração de raios-X. Este é um problema comum em proteínas de membrana ou glicosiladas. Mesmo usandorobôsparaaceleraroproces- so experimental, estas e outras difi- culdades fazem com que a determi- nação de novas estruturas protéicas nãoconsigaacompanhar avelocida- de de obtenção de dados dos proje- tos genoma. Biotecnologia Ciência & Desenvolvimento - nº 29 23 Figura 8: Estrutura terciária e quaternária daDeoxi- hemoglobinahumanaobtida por Difração de Raios X e depositada no PDB. A molécula é um tetrâmero, composta por 4 cadeias, e ligada a 4 átomos de ferro A modelagem molecular é um método alternativo, não experimental, que permite, com base nos conheci- mentos da estereoquímica dos amino- ácidos e nas informaçoes adquiridas das estruturas terciárias já resolvidas, prever a conformação de proteínas a partir da seqüência primária dos ami- noácidos. Uma das formas de se realizar a modelagem de proteínas é utilizar como referência uma ou mais protéi- nas homólogas e de estrutura terciária já conhecida. Este tipo de modelagem é conhecido como modelagem por homologia ou modelagem comparati- va, e, por enquanto, é a abordagem que obtém melhores resultados. O primeiro passo do processo é a pequi- sa de proteínas homólogas em bancos de dados de estruturas terciárias de proteínas. O PDB (Protein
Compartilhar