Buscar

ARTIGOAlterações genéticas em bactérias para a inserção de dados

Prévia do material em texto

Alterações genéticas em bactérias para a inserção de dados 
Ana Karolinne Anastácio de Sousa1, Francisco Gerson Amorim de Meneses1, 
Ricardo Martins Ramos2 
1Instituto Federal de Educação, Ciência e Tecnologia (IFPI) - Campus Parnaíba, CEP 
64215-000 - Parnaíba - PI - Brasil 
2Instituto Federal de Educação, Ciência e Tecnologia (IFPI) - Campus Teresina Central, 
CEP 64000-040 - Teresina - PI - Brasil 
anakarolinneanastacio@gmail.com, franciscogerson10@gmail.com, 
ricardo@ifpi.edu.br 
Abstract. Based on the principle that a cell can replicate or even copy its DNA 
with great accuracy and transmit this information to a following generation, 
some studies have been performed with microorganisms, like bacteria, for the 
transmission of information inserted in its DNA. The proposition of this study 
is to analyze the conditions that make it possible the storage of data in 
bacteria, aiming at a safe, robust and long-term available storage, besides 
that, some advantages and disadvantages of this kind of data storage will be 
presented, and also, some of the more common methods used for the 
manipulation of the information inside the DNA of these beings. 
Resumo. Baseado no princípio de que uma célula pode replicar ou até mesmo 
copiar seu DNA com grande exatidão e transmitir esta informação para uma 
geração seguinte, alguns trabalhos vem sendo realizados com 
microrganismos, como as bactérias, para a transmissão de informações 
inseridas em seu DNA. A proposta deste trabalho é analisar as condições que 
possibilitam o armazenamento de dados em bactérias, visando um 
armazenamento seguro, robusto e que esteja disponível por um longo período 
de tempo, além disso, serão apresentadas algumas vantagens e desvantagens 
deste tipo armazenamento de dados e, também, alguns dos métodos mais 
utilizados para manipulação das informações contidas no DNA destes seres. 
1. Introdução 
As informações hoje certamente estão sendo um dos bens mais preciosos e críticos das 
organizações mundiais. Estas informações podem estar sujeitas a danos, sendo por isso 
necessário um maior cuidado e segurança nos meios de armazenamento. De acordo com 
Almeida (2006), as organizações empresariais precisam armazenar, organizar, gerenciar 
e disponibilizar dados de uma forma global, além de garantir sua integridade durante 
todos os processos, em alguns casos, mantê-los por vários anos por razões legais. Os 
meios de armazenamento mais utilizados (ópticos e magnéticos) estão susceptíveis a 
vários fatores externos, que podem danificar e impossibilitar a recuperação dos dados. 
A necessidade de uma solução confiável e de longo prazo para o armazenamento da 
informação é ainda agravada pelo fato de que a previsão atual de armazenamento 
 
magnético e óptico irá se tornar irrecuperável dentro de um século ou menos (Bancroft 
et al 2001). 
 Baseado nas propriedades biológicas de uma molécula de DNA, técnicas de 
armazenamento estão sendo aperfeiçoadas, com o objetivo de diminuir o risco de danos 
ou perdas totais de informações, ao tempo que procuram maior capacidade de 
armazenamento. As seqüências destas moléculas estão sendo utilizadas para armazenar 
e manipular informações. 
Quando sua replicação é precisa, o ácido desoxirribonucléico (DNA) presta-se a 
levar a informação genética de célula a célula e de geração a geração (Burns e Bottino 
1991), podendo garantir o acesso a informação por um longo período de tempo. 
A técnica que será abordada neste trabalho envolve o armazenamento de dados 
em um microrganismo simples, as bactérias, unicelular, mas com capacidade de 
armazenamento surpreendente e que pode garantir a durabilidade das informações, por 
um processo biológico denominado reprodução. 
 Uma célula bacteriana em crescimento ativo contém mais de uma cópia do seu 
cromossomo e garante uma cópia completa quando doada a uma célula filha, pois 
rodadas de duplicação ocorrem antes que a rodada anterior tenha sido completada 
(Barbosa e Torres 2005). Alguns trabalhos já foram realizados, como o de Yachie et al 
(2007), que propuseram um método de recuperação de dados baseado em alinhamento 
de seqüências do DNA genômico de organismos vivos que copia e cola dados no 
genoma seqüenciado de uma bactéria, Bacillus subtilis, adquirindo um armazenamento 
de dados versátil que garante a robustez da herança de dados. 
Com o objetivo de mostrar às condições sobre as quais é realizado o 
armazenamento de dados em organismos vivos como as bactérias, será analisada as 
condições biológicas que possibilitam este meio de armazenamento, que vem 
despertando um enorme interesse em toda comunidade científica, desde que foi 
descoberta a existência de um material genético que armazena e comanda todas as 
informações necessárias para o complexo desenvolvimento de um ser vivo. 
2. Dispositivos de Armazenamento de dados convencionais 
Os computadores são os grandes responsáveis pela existência dos dispositivos de 
armazenamento de dados. Desde a sua invenção houve a necessidade de armazenar 
dados. Os dispositivos de armazenamento de dados dos sistemas computacionais podem 
ser classificados de acordo com o tipo de dados que eles armazenam, podendo ser: 
dados on-line, dados off-line, dados transientes ou dados persistentes (Almeida 2006). 
Sabendo-se que a memória do computador é limitada, viu-se a necessidade de 
dispositivos de armazenamento que funcionasse como uma memória auxiliar. 
 Algumas tecnologias importantes são usadas para armazenar dados, o 
armazenamento magnético, óptico (Norton 2005), e outros (pendrive, cartão de 
memória), cuja confiabilidade e a durabilidade variam de acordo com o material 
utilizado para o armazenamento dos dados. 
Segundo Andrade, Freitas e Geronimo (2008) a instabilidade e os avanços 
tecnológicos são as duas principais ameaças a contínua acessibilidade da informação 
digital: 
 
 Com relação aos suportes magnéticos: 
- a camada magnética (aonde as informações ficam armazenadas) pode tornar-se 
instável, encaminhando assim para uma perda gradual da qualidade do suporte e o 
principal, a perda da informação; 
- altos níveis de temperatura e umidade podem causar a separação da camada magnética 
da fita, além disso, altas temperaturas também pode debilitar o sinal magnético e, em 
última instância, desmagnetizar a fita totalmente; 
- a exposição da superfície da camada magnética a partículas de poeira, sujeiras e 
poluentes químicos pode resultar na condensação de umidade e oxidação. Podendo 
então interferir no contato com o cabeçote, dificultando a gravação ou uma má leitura. 
Com relação aos suportes ópticos: 
- a corrosão da base plástica pode ocorrer devido ao contato com alguma substância 
química; 
- a união das camadas pode ser fraca, conduzindo à separação; 
- pode ocorrer a corrosão da camada reflexiva de alumínio devido à existência de bolsas 
de ar ou água entre as duas camadas. 
 Como a informação armazenada em algum dispositivo está propensa a falhas, é 
necessário que programas e dados importantes sejam armazenados em mais de um local, 
diminuindo as chances de perdas de informações, os chamados backups. 
3. Armazenamento e reprodução biológica do material genético 
Parte das informações genéticas de uma célula bacteriana está contida em unidades 
genéticas (cromossomo e plasmídios) que apresentam capacidade de auto-replicação. 
De acordo com a literatura de Barbosa e Torres (2005), os genes cromossômicos 
contêm as características essenciais ao desenvolvimento microbiano, enquanto que os 
plasmídios (DNA extracromossomais) conferem características associadas a funções 
especializadas, como a resistência aos antimicrobianos ou expansão de atividades 
metabólicas, e que podem ser transferidos de bactéria a bactéria, levando as 
informações genéticas às bactérias receptoras. Entretanto o DNA é a principal estruturade armazenamento das informações genéticas. 
 O DNA pode ser considerado um polinucleotídeo, uma fita ou uma seqüência de 
letras. Fitas de DNA podem ser muito longas e armazenar um número imenso de bits, 
servindo como portadores de informações (ver Tabela 1) (Siewicz et al 2001). Em 
bactérias o DNA é uma macromolécula em forma de fita circular, empacotada e dobrada 
para se manter na célula (Trabulsi et al 2005). Por ser maior que a célula que a contém, 
a molécula de DNA fica superenrolada de modo que sua extensão total possa caber 
(Winn 2005). 
 A síntese do DNA se faz a partir de uma fita simples (DNA molde) e da regra de 
pareamento de bases complementares, adenosina pareada com timina e guanina pareada 
com citosina, de onde uma nova é gerada a partir do encadeamento dos nucleotídeos 
com base complementar aos nucleotídeos da fita molde (Okura 2002). A única cadeia 
dessas bases é chamada de oligonucleotídeo. Geralmente as bactérias se reproduzem por 
 
divisão binária, em que uma célula divide-se em duas células idênticas (Tortora, Funke 
e Case 2005), e as informações serão passadas e a sua identidade mantida. 
 
Tabela 1. Genoma de Bactérias Sequenciados 
Espécie Tamanho * N° de genes previstos 
Archaeoglobulus fulgidus 2,18 2.407 
Methanobacterium thermoautotrophicum 1,75 1.869 
Methan5ococcus jannaschii 1,66 1.715 
Thermoplasma acidophilum 1,56 1.478 
Bacillus subtilis 4,21 4.100 
Bordetella parapertussis 4,75 - 
Espécies de Burchnera 0,64 564 
Campylobacter jejuni 1,64 1.654 
Escherichia coli 4,64 4.289 
Haemophilus influenzae 1,83 1.709 
Mesorhizobium loti 7,04 6.752 
Mycobacterium turbeculosis 4,41 3.918 
Mycoplasma genitalium 0,58 480 
Staphylococcus aureus 2,88 2.697 
Treponema pallidum 1,14 1.031 
Ureaplasma urealyticum 0,75 611 
Vibrio cholerae 4,03 3.828 
 * milhões de pares de bases 
 
Fonte: Dados de Genome Atlas of the Center for Biological Sequence 
Analysis,http://www.cbs.dtu. dk/servises/ GenomeAtlas Apud Pierce 2004. 
4. Técnicas de manipulação do material genético 
4.1. Reação de Polimerase em cadeia (PCR) 
Descrita originalmente por Kary Mullis em 1983, a reação de polimerase em cadeia 
(PCR) explora a bioquímica básica da replicação do DNA, com o objetivo final de 
amplificar uma porção específica desta molécula (Winn 2008). Para ser feita a análise é 
necessário uma quantidade razoável do mesmo material, que é conseguido pelo 
processo chamado de amplificação de DNA, em que são produzidas cópias de uma 
 
molécula ou fragmento do mesmo (Okura 2002). A grande quantidade de fragmentos 
gerados pela técnica de PCR garante aos manipuladores uma verificação mais precisa 
do material em estudo. 
 
4.2. Seqüenciamento do DNA 
A biologia molecular tem direcionado seus esforços para obter a sua seqüência de 
nucleotídeos ou a sua seqüência de bases. Determinar cada uma das bases de uma 
molécula de DNA é o processo chamado seqüenciamento (Okura 2002). O 
seqüenciamento é uma das técnicas mais poderosas e eficazes na identificação pontual e 
específica de seqüências nucleotídicas de diversos organismos. 
 O método de seqüenciamento mais utilizado é o didesoxi. É um método que faz 
uso de inibidores que terminam a cadeia recém sintetizada a resíduos específicos usando 
DNA polimerase (Sanger, Nicklen e Coulson 1977). Outro método também utilizado é 
o pirosequenciamento, um método de seqüenciamento por síntese. O método baseia-se 
na incorporação de nucleotídeos ao filamento de DNA recém sintetizado, o pirofosfato, 
um subproduto desta incorporação é convertido em luz, que é registrada pelo 
instrumento e a seqüência é determinada (Winn 2008). 
 Junto com os seqüenciadores foram desenvolvidos programas de montagem 
chamados em inglês de Assemblers que permitem a “montagem” deste “quebra-cabeça” 
(Weiss 2010): Phred/Phrap/Consed (http://www.pharp.org), CAP/PCAP (Huang et al 
2003), ARACHNE (Batzoglou et al 2007), Celera Assembler (http://www.celera.com), 
Illumina, Roche (Weiss 2010), entre outros. 
Dado que a seqüência completa de DNA de um cromossomo esteja determinada, 
pode-se iniciar a determinação e análise dos genes dessa seqüência. Este processo é 
conhecido como anotação (Okura 2002). “Anotar é o processo de agrupar todas as 
informações disponíveis e relacionar com as seqüências de DNA ”(Weiss 2010). 
4.3. Processos de inserção e recuperação de dados 
Para manipular uma informação ("E= mc^2 1905!") em uma bactéria Yachie et al 
(2007), precisaram converte-la em seqüências genéticas. A mensagem foi inicialmente 
convertida em seqüência binária, o código hexadecimal gerado a partir de entradas de 
teclado foi deslocado em dados, e as chaves de criptografia foram traduzidas para cada 
quatro bits do código binário em dinucleotídeos. Eles duplicaram os dados codificados 
em diferentes seqüências de oligonucleotídeos e o inseriram de forma redundante em 
múltiplos locos do genoma da Bacillus subtilis, o que estaria representando um modelo 
de backup biológico. 
 A informação foi inserida na bactéria pelo processo de transformação e os dados 
codificados foram recuperados pelo seqüenciamento completo do genoma e pela busca 
de regiões codificantes repetidas usando alinhamentos múltiplos de todos os bits de 
dados, decodificados da seqüência genômica do DNA. 
Ailenberg e Rotstein (2009), para inserir dados em uma molécula de DNA 
utilizaram um método envolvendo a criação de uma biblioteca de plasmídeo com até 
10.000 bp de informação inserida em plasmídeos. Utilizando os princípios do código de 
Huffman, definiram códon de DNA para todo o teclado, para obter informações de 
codificação (ver Figura 1). A codificação de dados como textos, imagens e músicas 
 
(Figura 2) foi feita a partir da síntese de DNA, e a recuperação das informações pelo seu 
seqüenciamento (rever tópico 4.2), utilizando primers específicos. 
 
 
Figura 1. Distribuição de códons para todo o teclado. 
Fonte: Ailenberg e Rotstein (2009). 
 
 
 
 
 
 
Figura 2. Seqüência de informações (texto, imagem e música) codificadas. 
Fonte: Ailenberg e Rotstein (2009). 
 
5. Vantagens do Armazenamento de dados em bactérias 
É possível conservar uma bactéria em laboratórios para estudos futuros, utilizando 
técnicas que resultem na redução do metabolismo, pois quanto mais o metabolismo 
bacteriano for reduzido maior será o tempo que ela permanecerá viável. (Trabulsi et al 
2005). 
 O material genético tem que ser capaz de auto-duplicar ou auto-replicar e que se 
dê corretamente a cada divisão celular (Borges-Osório e Robison 2001), com esta 
propriedade natural do material genético, pode-se garantir a integridade das 
informações a serem transmitidas. Mesmo o DNA sendo uma molécula estável, não está 
livre de mutações, porém quando detectados, os defeitos apresentados pela mutação são 
corrigidos por um exército de enzimas de reparo do DNA, cada um deles envolvidos no 
combate a um tipo particular de dano (Pierce 2004). Esses reparos são geralmente 
realizados de forma o mais eficiente possível, para garantir que as informações 
transmitidas apresentem o mínino de alterações possíveis. 
 Quando as bactérias estão crescendo em meio rico, a replicação do seu DNA 
ocorre sem parar durante o ciclo celular (Snustad e Simmons 2001), e um grande 
número de bactérias, carregando a mesma informação genética pode ser obtido em 
pouco tempo. 
 Existem bactérias como as do gênero Deinococcus, que sobrevivem em 
condições extremas, incluindo ultravioleta, dessecação, vácuo parcial, e radiação 
ionizante, de até 1,6 milhões rad, ou dose de radiação, algumas também toleram altas 
temperaturas (Adams 2000). 
 Grandes quantidades de informações podem ser armazenadas sendo possível 
abrigar 1022 moléculas de DNA, cada uma codificando 400 bits de informações,mais 
informações do que pode ser armazenada em um disco rígido de 20 GB (Isaia Filho 
2004). Em um mililitro de qualquer líquido pode conter até 109 bactérias, com potencial 
de memória enorme (Siewicz et al 2001). 
6. Desvantagens do armazenamento de dados em bactérias 
O armazenamento de informações em DNA nos organismos vivos tem como 
desvantagem a perda de informações devido a mutações, deleções e inserções de DNA 
(Yachie, Ohashi e Tomida 2008). 
 A evolução genética e a adaptação do organismo (bactérias) podem levar ao 
acúmulo de mutações que podem resultar na destruição da herança dos dados (Yachie et 
al 2007), uma mutação altera a seqüência de bases de DNA (Murray et al 2006). 
 As bactérias possuem um tempo de vida limitado, sua morte pode ser ocasionada 
principalmente pelo acúmulo excessivo de produtos tóxicos e/ou escassez de nutrientes 
(Jorge 2006), sendo necessário garantir um meio ideal para seu crescimento e 
reprodução. 
7. Considerações finais 
Este trabalho realizou um estudo sobre as condições biológicas que fazem do DNA um 
meio de armazenamento, e das bactérias os seres vivos responsáveis por conter as 
informações adicionadas, devido a sua “simplicidade”, tolerância a adição de 
 
seqüências de genes artificiais, facilidade de ser conservada e principalmente pela forma 
como as informações serão por elas transmitidas. 
 Em contraste com os dispositivos convencionais, algumas espécies de bactérias 
podem sobreviver e garantir a integridade das informações nelas armazenadas em meio 
a radiações ou a outras alterações do meio. Em caso de acidentes nucleares, por 
exemplo, uma grande massa de informações pode se tornar irrecuperável, pela 
destruição do local onde esteja armazenada ou pela falta de acessibilidade. 
Além disso, este trabalho apresentou um estudo dos métodos utilizados na 
manipulação das informações contidas no DNA, desde a amplificação até a 
identificação das seqüências. Ainda são processos limitados, demorados, com 
participação de muitas pessoas e de elevado custo, mas que vem sendo aperfeiçoados 
cada vez mais, para a obtenção e busca mais rápidas das informações. 
 
 
Referências 
 
Adams, J.C. (2000) “On the Application of DNA Based Computation”, Disponível em: 
<http://publish.uwo.ca/~jadams/dnaapps1.htm> acesso em: 17/09/2010. 
Ailenberg, M. e Rotstein, O. D. (2009) “An improved Huffman coding Method for 
Archiving text, image, and music characters in dna. Biotechiniques”, v. 47, p.747-
754. 
Andrade, A.L., Freitas, M.F e Geronimo, M.B. (2008) “Suporte de armazenamento”, 
UFFC- Faculdade de ciências UNESP. 10p. 
Almeida, A. V. (2006) “Arquiteturas de redes de armazenamento de dados. São Paulo”, 
104p. Trabalho final (mestrado profissional em computação) - Universidade 
Estadual de Campinas, Instituto de Computação. 
Barbosa, H. R. e Torres, B. B. (2005) “Microbiologia Básica”, São Paulo: Atheneu. 
196p. 
Batzoglou, S. et al. (2002) “ARACHNE: A Whole-Genome Shotgun Assembler”, 
Genome Res. v. 12, p. 177-189. 
Bancroft, C. et al. (2001) “Long-term storage of information in DNA. Science”, v. 293, 
p.1763-1765. 
Borges-Osório, M. R.e Robinson, W. M. (2001) “Genética Humana”, 2. ed. Porto 
Alegre: Artmed. 459p. 
Burns, G. W. e Bottino, P. J. (1991) “Genética”, 6. ed. Rio de Janeiro: Guanabara 
Koogan S.A., 381p. 
Isaia Filho, E. (2004) “Uma metodologia para a computação com DNA”, Porto Alegre 
(RS), 80p. Dissertação (mestrado) – Universidade Federal do Rio de Grande do Sul. 
Programa de Pós- Graduação em Computação. 
Jorge, A. O. C. (2006) “Princípios de microbiologia e Imunologia”, [S.P.:]: Santos. 
418p. 
Murray, P. R., et al. (2006) “Microbiologia médica”, 5. ed. Rio de Janeiro: Elsevier. 
979p. 
Okura, V. K. (2002) “Bioinformática de projetos Genoma de bactérias”, São Paulo, 
102p. 
Pierce, B.A. (2004) “Genética um enfoque conceitual”, Rio de Janeiro: Editora 
Guanabara Koogan S.A. 758p. 
Sanger, F., Nicklen, S. e Coulson, A.R. (1977) “DNA sequencing with chain-
terminating inhibitors (DNA polymerase/nucleotide sequences/bacteriophage 
4X174)” Biochemistry, v. 74, n. 12, p. 5463-5467. 
Siewicz, P.W. et al. (2001) “Future Generation Computer Systems”, v.17, Issue 4, 
p.361-378. 
Snustad, D.P. e Simmons, M.J. (2001) “Fundamentos de Genética”, 2. ed. Rio de 
Janeiro: Guanabara Koogan S.A. 756p. 
 
Trabulsi, L.R. e Alterthum, F. (2005) “Microbiologia”, 4. ed. São Paulo: Atheneu. 
Tortora, e.j., Funke, b.r. e Case, c.l. (2005) “Microbiologia”, 8.ed. São Paulo: Artimed 
Editora s.a. 894p. 
Yachie, N. et al. (2007) “Alignment-Based Approach for Durable Data Storage into 
Living Organisms”, Biotechnol. Prog. v. 23, p. 501 - 505. 
Yachie, N., Ohashi, Y. e Tomita, M. (2008) “Stabilizing synthetic data in the DNA of 
living organisms”, Syst. Synth. Biol, v.2, p.19-25. 
Huang, X.et al. (2003) “PCAP: a whole-genome assembly program”, Genome Res. v. 
13, p. 2164–2170. 
Norton, P. (2005) “Introdução á informática”, São Paulo: Pearson Makron Books. 
Weiss, V. A. (2010) “Estratégia de finalização da montagem do genoma da Bactéria 
Diazotrófica Endofílica Herbaspirillum seropedicae”, SmR1. Curitiba, 70p. 
Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências 
Biológicas. Programa de Pós-Graduação em Bioquímica. 
Winn Jr, W. C. et al. (2008) “Koneman, diagnosticos Microbiológicos: texto e atlas 
colorido”, 6. ed. Rio de Janeiro: Guanabara Koogan.1565p.

Continue navegando