Alterações genéticas em bactérias para a inserção de dados
Ana Karolinne Anastácio de Sousa1, Francisco Gerson Amorim de Meneses1,
Ricardo Martins Ramos2
1
2
Instituto Federal de Educação, Ciência e Tecnologia (IFPI) - Campus Parnaíba, CEP
64215-000 - Parnaíba - PI - Brasil
Instituto Federal de Educação, Ciência e Tecnologia (IFPI) - Campus Teresina Central,
CEP 64000-040 - Teresina - PI - Brasil
[email protected], [email protected],
[email protected]
Abstract. Based on the principle that a cell can replicate or even copy its DNA
with great accuracy and transmit this information to a following generation,
some studies have been performed with microorganisms, like bacteria, for the
transmission of information inserted in its DNA. The proposition of this study
is to analyze the conditions that make it possible the storage of data in
bacteria, aiming at a safe, robust and long-term available storage, besides
that, some advantages and disadvantages of this kind of data storage will be
presented, and also, some of the more common methods used for the
manipulation of the information inside the DNA of these beings.
Resumo. Baseado no princípio de que uma célula pode replicar ou até mesmo
copiar seu DNA com grande exatidão e transmitir esta informação para uma
geração seguinte, alguns trabalhos vem sendo realizados com
microrganismos, como as bactérias, para a transmissão de informações
inseridas em seu DNA. A proposta deste trabalho é analisar as condições que
possibilitam o armazenamento de dados em bactérias, visando um
armazenamento seguro, robusto e que esteja disponível por um longo período
de tempo, além disso, serão apresentadas algumas vantagens e desvantagens
deste tipo armazenamento de dados e, também, alguns dos métodos mais
utilizados para manipulação das informações contidas no DNA destes seres.
1. Introdução
As informações hoje certamente estão sendo um dos bens mais preciosos e críticos das
organizações mundiais. Estas informações podem estar sujeitas a danos, sendo por isso
necessário um maior cuidado e segurança nos meios de armazenamento. De acordo com
Almeida (2006), as organizações empresariais precisam armazenar, organizar, gerenciar
e disponibilizar dados de uma forma global, além de garantir sua integridade durante
todos os processos, em alguns casos, mantê-los por vários anos por razões legais. Os
meios de armazenamento mais utilizados (ópticos e magnéticos) estão susceptíveis a
vários fatores externos, que podem danificar e impossibilitar a recuperação dos dados.
A necessidade de uma solução confiável e de longo prazo para o armazenamento da
informação é ainda agravada pelo fato de que a previsão atual de armazenamento
magnético e óptico irá se tornar irrecuperável dentro de um século ou menos (Bancroft
et al 2001).
Baseado nas propriedades biológicas de uma molécula de DNA, técnicas de
armazenamento estão sendo aperfeiçoadas, com o objetivo de diminuir o risco de danos
ou perdas totais de informações, ao tempo que procuram maior capacidade de
armazenamento. As seqüências destas moléculas estão sendo utilizadas para armazenar
e manipular informações.
Quando sua replicação é precisa, o ácido desoxirribonucléico (DNA) presta-se a
levar a informação genética de célula a célula e de geração a geração (Burns e Bottino
1991), podendo garantir o acesso a informação por um longo período de tempo.
A técnica que será abordada neste trabalho envolve o armazenamento de dados
em um microrganismo simples, as bactérias, unicelular, mas com capacidade de
armazenamento surpreendente e que pode garantir a durabilidade das informações, por
um processo biológico denominado reprodução.
Uma célula bacteriana em crescimento ativo contém mais de uma cópia do seu
cromossomo e garante uma cópia completa quando doada a uma célula filha, pois
rodadas de duplicação ocorrem antes que a rodada anterior tenha sido completada
(Barbosa e Torres 2005). Alguns trabalhos já foram realizados, como o de Yachie et al
(2007), que propuseram um método de recuperação de dados baseado em alinhamento
de seqüências do DNA genômico de organismos vivos que copia e cola dados no
genoma seqüenciado de uma bactéria, Bacillus subtilis, adquirindo um armazenamento
de dados versátil que garante a robustez da herança de dados.
Com o objetivo de mostrar às condições sobre as quais é realizado o
armazenamento de dados em organismos vivos como as bactérias, será analisada as
condições biológicas que possibilitam este meio de armazenamento, que vem
despertando um enorme interesse em toda comunidade científica, desde que foi
descoberta a existência de um material genético que armazena e comanda todas as
informações necessárias para o complexo desenvolvimento de um ser vivo.
2. Dispositivos de Armazenamento de dados convencionais
Os computadores são os grandes responsáveis pela existência dos dispositivos de
armazenamento de dados. Desde a sua invenção houve a necessidade de armazenar
dados. Os dispositivos de armazenamento de dados dos sistemas computacionais podem
ser classificados de acordo com o tipo de dados que eles armazenam, podendo ser:
dados on-line, dados off-line, dados transientes ou dados persistentes (Almeida 2006).
Sabendo-se que a memória do computador é limitada, viu-se a necessidade de
dispositivos de armazenamento que funcionasse como uma memória auxiliar.
Algumas tecnologias importantes são usadas para armazenar dados, o
armazenamento magnético, óptico (Norton 2005), e outros (pendrive, cartão de
memória), cuja confiabilidade e a durabilidade variam de acordo com o material
utilizado para o armazenamento dos dados.
Segundo Andrade, Freitas e Geronimo (2008) a instabilidade e os avanços
tecnológicos são as duas principais ameaças a contínua acessibilidade da informação
digital:
Com relação aos suportes magnéticos:
- a camada magnética (aonde as informações ficam armazenadas) pode tornar-se
instável, encaminhando assim para uma perda gradual da qualidade do suporte e o
principal, a perda da informação;
- altos níveis de temperatura e umidade podem causar a separação da camada magnética
da fita, além disso, altas temperaturas também pode debilitar o sinal magnético e, em
última instância, desmagnetizar a fita totalmente;
- a exposição da superfície da camada magnética a partículas de poeira, sujeiras e
poluentes químicos pode resultar na condensação de umidade e oxidação. Podendo
então interferir no contato com o cabeçote, dificultando a gravação ou uma má leitura.
Com relação aos suportes ópticos:
- a corrosão da base plástica pode ocorrer devido ao contato com alguma substância
química;
- a união das camadas pode ser fraca, conduzindo à separação;
- pode ocorrer a corrosão da camada reflexiva de alumínio devido à existência de bolsas
de ar ou água entre as duas camadas.
Como a informação armazenada em algum dispositivo está propensa a falhas, é
necessário que programas e dados importantes sejam armazenados em mais de um local,
diminuindo as chances de perdas de informações, os chamados backups.
3. Armazenamento e reprodução biológica do material genético
Parte das informações genéticas de uma célula bacteriana está contida em unidades
genéticas (cromossomo e plasmídios) que apresentam capacidade de auto-replicação.
De acordo com a literatura de Barbosa e Torres (2005), os genes cromossômicos
contêm as características essenciais ao desenvolvimento microbiano, enquanto que os
plasmídios (DNA extracromossomais) conferem características associadas a funções
especializadas, como a resistência aos antimicrobianos ou expansão de atividades
metabólicas, e que podem ser transferidos de bactéria a bactéria, levando as
informações genéticas às bactérias receptoras. Entretanto o DNA é a principal estrutura
de armazenamento das informações genéticas.
O DNA pode ser considerado um polinucleotídeo, uma fita ou uma seqüência de
letras. Fitas de DNA podem ser muito longas e armazenar um número imenso de bits,
servindo como portadores de informações (ver Tabela 1) (Siewicz et al 2001). Em
bactérias o DNA é uma macromolécula em forma de fita circular, empacotada e dobrada
para se manter na célula (Trabulsi et al 2005). Por ser maior que a célula que a contém,
a molécula de DNA fica superenrolada de modo que sua extensão total possa caber
(Winn 2005).
A síntese do DNA se faz a partir de uma fita simples (DNA molde) e da regra de
pareamento de bases complementares, adenosina pareada com timina e guanina pareada
com citosina, de onde uma nova é gerada a partir do encadeamento dos nucleotídeos
com base complementar aos nucleotídeos da fita molde (Okura 2002). A única cadeia
dessas bases é chamada de oligonucleotídeo. Geralmente as bactérias se reproduzem por
divisão binária, em que uma célula divide-se em duas células idênticas (Tortora, Funke
e Case 2005), e as informações serão passadas e a sua identidade mantida.
Tabela 1. Genoma de Bactérias Sequenciados
Espécie
Tamanho *
N° de genes previstos
Archaeoglobulus fulgidus
2,18
2.407
Methanobacterium thermoautotrophicum
1,75
1.869
Methan5ococcus jannaschii
1,66
1.715
Thermoplasma acidophilum
1,56
1.478
Bacillus subtilis
4,21
4.100
Bordetella parapertussis
4,75
-
Espécies de Burchnera
0,64
564
Campylobacter jejuni
1,64
1.654
Escherichia coli
4,64
4.289
Haemophilus influenzae
1,83
1.709
Mesorhizobium loti
7,04
6.752
Mycobacterium turbeculosis
4,41
3.918
Mycoplasma genitalium
0,58
480
Staphylococcus aureus
2,88
2.697
Treponema pallidum
1,14
1.031
Ureaplasma urealyticum
0,75
611
Vibrio cholerae
4,03
3.828
* milhões de pares de bases
Fonte: Dados de Genome Atlas of the Center for Biological Sequence
Analysis,http://www.cbs.dtu. dk/servises/ GenomeAtlas Apud Pierce 2004.
4. Técnicas de manipulação do material genético
4.1. Reação de Polimerase em cadeia (PCR)
Descrita originalmente por Kary Mullis em 1983, a reação de polimerase em cadeia
(PCR) explora a bioquímica básica da replicação do DNA, com o objetivo final de
amplificar uma porção específica desta molécula (Winn 2008). Para ser feita a análise é
necessário uma quantidade razoável do mesmo material, que é conseguido pelo
processo chamado de amplificação de DNA, em que são produzidas cópias de uma
molécula ou fragmento do mesmo (Okura 2002). A grande quantidade de fragmentos
gerados pela técnica de PCR garante aos manipuladores uma verificação mais precisa
do material em estudo.
4.2. Seqüenciamento do DNA
A biologia molecular tem direcionado seus esforços para obter a sua seqüência de
nucleotídeos ou a sua seqüência de bases. Determinar cada uma das bases de uma
molécula de DNA é o processo chamado seqüenciamento (Okura 2002). O
seqüenciamento é uma das técnicas mais poderosas e eficazes na identificação pontual e
específica de seqüências nucleotídicas de diversos organismos.
O método de seqüenciamento mais utilizado é o didesoxi. É um método que faz
uso de inibidores que terminam a cadeia recém sintetizada a resíduos específicos usando
DNA polimerase (Sanger, Nicklen e Coulson 1977). Outro método também utilizado é
o pirosequenciamento, um método de seqüenciamento por síntese. O método baseia-se
na incorporação de nucleotídeos ao filamento de DNA recém sintetizado, o pirofosfato,
um subproduto desta incorporação é convertido em luz, que é registrada pelo
instrumento e a seqüência é determinada (Winn 2008).
Junto com os seqüenciadores foram desenvolvidos programas de montagem
chamados em inglês de Assemblers que permitem a “montagem” deste “quebra-cabeça”
(Weiss 2010): Phred/Phrap/Consed (http://www.pharp.org), CAP/PCAP (Huang et al
2003), ARACHNE (Batzoglou et al 2007), Celera Assembler (http://www.celera.com),
Illumina, Roche (Weiss 2010), entre outros.
Dado que a seqüência completa de DNA de um cromossomo esteja determinada,
pode-se iniciar a determinação e análise dos genes dessa seqüência. Este processo é
conhecido como anotação (Okura 2002). “Anotar é o processo de agrupar todas as
informações disponíveis e relacionar com as seqüências de DNA ”(Weiss 2010).
4.3. Processos de inserção e recuperação de dados
Para manipular uma informação ("E= mc^2 1905!") em uma bactéria Yachie et al
(2007), precisaram converte-la em seqüências genéticas. A mensagem foi inicialmente
convertida em seqüência binária, o código hexadecimal gerado a partir de entradas de
teclado foi deslocado em dados, e as chaves de criptografia foram traduzidas para cada
quatro bits do código binário em dinucleotídeos. Eles duplicaram os dados codificados
em diferentes seqüências de oligonucleotídeos e o inseriram de forma redundante em
múltiplos locos do genoma da Bacillus subtilis, o que estaria representando um modelo
de backup biológico.
A informação foi inserida na bactéria pelo processo de transformação e os dados
codificados foram recuperados pelo seqüenciamento completo do genoma e pela busca
de regiões codificantes repetidas usando alinhamentos múltiplos de todos os bits de
dados, decodificados da seqüência genômica do DNA.
Ailenberg e Rotstein (2009), para inserir dados em uma molécula de DNA
utilizaram um método envolvendo a criação de uma biblioteca de plasmídeo com até
10.000 bp de informação inserida em plasmídeos. Utilizando os princípios do código de
Huffman, definiram códon de DNA para todo o teclado, para obter informações de
codificação (ver Figura 1). A codificação de dados como textos, imagens e músicas
(Figura 2) foi feita a partir da síntese de DNA, e a recuperação das informações pelo seu
seqüenciamento (rever tópico 4.2), utilizando primers específicos.
Figura 1. Distribuição de códons para todo o teclado.
Fonte: Ailenberg e Rotstein (2009).
Figura 2. Seqüência de informações (texto, imagem e música) codificadas.
Fonte: Ailenberg e Rotstein (2009).
5. Vantagens do Armazenamento de dados em bactérias
É possível conservar uma bactéria em laboratórios para estudos futuros, utilizando
técnicas que resultem na redução do metabolismo, pois quanto mais o metabolismo
bacteriano for reduzido maior será o tempo que ela permanecerá viável. (Trabulsi et al
2005).
O material genético tem que ser capaz de auto-duplicar ou auto-replicar e que se
dê corretamente a cada divisão celular (Borges-Osório e Robison 2001), com esta
propriedade natural do material genético, pode-se garantir a integridade das
informações a serem transmitidas. Mesmo o DNA sendo uma molécula estável, não está
livre de mutações, porém quando detectados, os defeitos apresentados pela mutação são
corrigidos por um exército de enzimas de reparo do DNA, cada um deles envolvidos no
combate a um tipo particular de dano (Pierce 2004). Esses reparos são geralmente
realizados de forma o mais eficiente possível, para garantir que as informações
transmitidas apresentem o mínino de alterações possíveis.
Quando as bactérias estão crescendo em meio rico, a replicação do seu DNA
ocorre sem parar durante o ciclo celular (Snustad e Simmons 2001), e um grande
número de bactérias, carregando a mesma informação genética pode ser obtido em
pouco tempo.
Existem bactérias como as do gênero Deinococcus, que sobrevivem em
condições extremas, incluindo ultravioleta, dessecação, vácuo parcial, e radiação
ionizante, de até 1,6 milhões rad, ou dose de radiação, algumas também toleram altas
temperaturas (Adams 2000).
Grandes quantidades de informações podem ser armazenadas sendo possível
abrigar 1022 moléculas de DNA, cada uma codificando 400 bits de informações, mais
informações do que pode ser armazenada em um disco rígido de 20 GB (Isaia Filho
2004). Em um mililitro de qualquer líquido pode conter até 109 bactérias, com potencial
de memória enorme (Siewicz et al 2001).
6. Desvantagens do armazenamento de dados em bactérias
O armazenamento de informações em DNA nos organismos vivos tem como
desvantagem a perda de informações devido a mutações, deleções e inserções de DNA
(Yachie, Ohashi e Tomida 2008).
A evolução genética e a adaptação do organismo (bactérias) podem levar ao
acúmulo de mutações que podem resultar na destruição da herança dos dados (Yachie et
al 2007), uma mutação altera a seqüência de bases de DNA (Murray et al 2006).
As bactérias possuem um tempo de vida limitado, sua morte pode ser ocasionada
principalmente pelo acúmulo excessivo de produtos tóxicos e/ou escassez de nutrientes
(Jorge 2006), sendo necessário garantir um meio ideal para seu crescimento e
reprodução.
7. Considerações finais
Este trabalho realizou um estudo sobre as condições biológicas que fazem do DNA um
meio de armazenamento, e das bactérias os seres vivos responsáveis por conter as
informações adicionadas, devido a sua “simplicidade”, tolerância a adição de
seqüências de genes artificiais, facilidade de ser conservada e principalmente pela forma
como as informações serão por elas transmitidas.
Em contraste com os dispositivos convencionais, algumas espécies de bactérias
podem sobreviver e garantir a integridade das informações nelas armazenadas em meio
a radiações ou a outras alterações do meio. Em caso de acidentes nucleares, por
exemplo, uma grande massa de informações pode se tornar irrecuperável, pela
destruição do local onde esteja armazenada ou pela falta de acessibilidade.
Além disso, este trabalho apresentou um estudo dos métodos utilizados na
manipulação das informações contidas no DNA, desde a amplificação até a
identificação das seqüências. Ainda são processos limitados, demorados, com
participação de muitas pessoas e de elevado custo, mas que vem sendo aperfeiçoados
cada vez mais, para a obtenção e busca mais rápidas das informações.
Referências
Adams, J.C. (2000) “On the Application of DNA Based Computation”, Disponível em:
<http://publish.uwo.ca/~jadams/dnaapps1.htm> acesso em: 17/09/2010.
Ailenberg, M. e Rotstein, O. D. (2009) “An improved Huffman coding Method for
Archiving text, image, and music characters in dna. Biotechiniques”, v. 47, p.747754.
Andrade, A.L., Freitas, M.F e Geronimo, M.B. (2008) “Suporte de armazenamento”,
UFFC- Faculdade de ciências UNESP. 10p.
Almeida, A. V. (2006) “Arquiteturas de redes de armazenamento de dados. São Paulo”,
104p. Trabalho final (mestrado profissional em computação) - Universidade
Estadual de Campinas, Instituto de Computação.
Barbosa, H. R. e Torres, B. B. (2005) “Microbiologia Básica”, São Paulo: Atheneu.
196p.
Batzoglou, S. et al. (2002) “ARACHNE: A Whole-Genome Shotgun Assembler”,
Genome Res. v. 12, p. 177-189.
Bancroft, C. et al. (2001) “Long-term storage of information in DNA. Science”, v. 293,
p.1763-1765.
Borges-Osório, M. R.e Robinson, W. M. (2001) “Genética Humana”, 2. ed. Porto
Alegre: Artmed. 459p.
Burns, G. W. e Bottino, P. J. (1991) “Genética”, 6. ed. Rio de Janeiro: Guanabara
Koogan S.A., 381p.
Isaia Filho, E. (2004) “Uma metodologia para a computação com DNA”, Porto Alegre
(RS), 80p. Dissertação (mestrado) – Universidade Federal do Rio de Grande do Sul.
Programa de Pós- Graduação em Computação.
Jorge, A. O. C. (2006) “Princípios de microbiologia e Imunologia”, [S.P.:]: Santos.
418p.
Murray, P. R., et al. (2006) “Microbiologia médica”, 5. ed. Rio de Janeiro: Elsevier.
979p.
Okura, V. K. (2002) “Bioinformática de projetos Genoma de bactérias”, São Paulo,
102p.
Pierce, B.A. (2004) “Genética um enfoque conceitual”, Rio de Janeiro: Editora
Guanabara Koogan S.A. 758p.
Sanger, F., Nicklen, S. e Coulson, A.R. (1977) “DNA sequencing with chainterminating inhibitors (DNA polymerase/nucleotide sequences/bacteriophage
4X174)” Biochemistry, v. 74, n. 12, p. 5463-5467.
Siewicz, P.W. et al. (2001) “Future Generation Computer Systems”, v.17, Issue 4,
p.361-378.
Snustad, D.P. e Simmons, M.J. (2001) “Fundamentos de Genética”, 2. ed. Rio de
Janeiro: Guanabara Koogan S.A. 756p.
Trabulsi, L.R. e Alterthum, F. (2005) “Microbiologia”, 4. ed. São Paulo: Atheneu.
Tortora, e.j., Funke, b.r. e Case, c.l. (2005) “Microbiologia”, 8.ed. São Paulo: Artimed
Editora s.a. 894p.
Yachie, N. et al. (2007) “Alignment-Based Approach for Durable Data Storage into
Living Organisms”, Biotechnol. Prog. v. 23, p. 501 - 505.
Yachie, N., Ohashi, Y. e Tomita, M. (2008) “Stabilizing synthetic data in the DNA of
living organisms”, Syst. Synth. Biol, v.2, p.19-25.
Huang, X.et al. (2003) “PCAP: a whole-genome assembly program”, Genome Res. v.
13, p. 2164–2170.
Norton, P. (2005) “Introdução á informática”, São Paulo: Pearson Makron Books.
Weiss, V. A. (2010) “Estratégia de finalização da montagem do genoma da Bactéria
Diazotrófica Endofílica Herbaspirillum seropedicae”, SmR1. Curitiba, 70p.
Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências
Biológicas. Programa de Pós-Graduação em Bioquímica.
Winn Jr, W. C. et al. (2008) “Koneman, diagnosticos Microbiológicos: texto e atlas
colorido”, 6. ed. Rio de Janeiro: Guanabara Koogan.1565p.
Download

Artigo na íntegra - Campus de Parnaíba