.
Armazenar dados no DNA soa como ficção científica, mas está em um futuro próximo. O professor Tom de Greef espera que o primeiro centro de dados de DNA esteja funcionando dentro de cinco a dez anos. Os dados não serão armazenados como zeros e uns em um disco rígido, mas nos pares de bases que compõem o DNA: AT e CG. Tal data center teria a forma de um laboratório, muitas vezes menor do que os atuais. De Greef já pode imaginar tudo. Em uma parte do prédio, novos arquivos serão codificados por meio da síntese de DNA. Outra parte conterá grandes campos de cápsulas, cada cápsula embalada com um arquivo. Um braço robótico remove uma cápsula, lê seu conteúdo e a coloca de volta.
Estamos falando de DNA sintético. No laboratório, as bases são unidas em uma determinada ordem para formar cadeias de DNA produzidas sinteticamente. Arquivos e fotos atualmente armazenados em data centers podem ser armazenados no DNA. Por enquanto, a técnica é adequada apenas para armazenamento de arquivos. Isso ocorre porque a leitura dos dados armazenados é muito cara, então você deseja consultar os arquivos de DNA o mínimo possível.
Grandes data centers que consomem muita energia se tornam obsoletos
O armazenamento de dados no DNA oferece muitas vantagens. Um arquivo de DNA pode ser armazenado de forma muito mais compacta, por exemplo, e a vida útil dos dados também é muitas vezes maior. Mas, talvez o mais importante, essa nova tecnologia torna obsoletos os grandes centros de dados que consomem muita energia. E isso é extremamente necessário, adverte De Greef, “porque em três anos, geraremos tantos dados em todo o mundo que não seremos capazes de armazenar metade deles”.
Juntamente com o estudante de doutorado Bas Bögels, a Microsoft e um grupo de universidades parceiras, De Greef desenvolveu uma nova técnica para tornar a inovação do armazenamento de dados com DNA sintético escalável. Os resultados foram publicados hoje na revista Natureza Nanotecnologia. De Greef trabalha no Departamento de Engenharia Biomédica e no Instituto de Sistemas Moleculares Complexos (ICMS) da TU Eindhoven e atua como professor visitante na Radboud University.
Escalável
A ideia de usar fitas de DNA para armazenamento de dados surgiu na década de 1980, mas era muito difícil e cara na época. Tornou-se tecnicamente possível três décadas depois, quando a síntese de DNA começou a decolar. George Church, geneticista da Harvard Medical School, desenvolveu a ideia em 2011. Desde então, a síntese e a leitura de dados ficaram exponencialmente mais baratas, levando finalmente a tecnologia ao mercado.
Nos últimos anos, De Greef e seu grupo analisaram principalmente a leitura dos dados armazenados. Por enquanto, esse é o maior problema dessa nova técnica. O método de PCR usado atualmente para isso, chamado de ‘acesso aleatório’, é altamente propenso a erros. Portanto, você só pode ler um arquivo por vez e, além disso, a qualidade dos dados se deteriora muito cada vez que você lê um arquivo. Não exatamente escalável.
Veja como funciona: PCR (Reação em Cadeia da Polimerase) cria milhões de cópias do pedaço de DNA que você precisa adicionando um primer com o código de DNA desejado. Os testes de corona no laboratório, por exemplo, são baseados nisso: mesmo uma quantidade minúscula de material de coronavírus do nariz é detectável quando copiada tantas vezes. Mas se você quiser ler vários arquivos simultaneamente, precisará de vários pares de iniciadores fazendo seu trabalho ao mesmo tempo. Isso cria muitos erros no processo de cópia.
Cada cápsula contém um arquivo
É aqui que as cápsulas entram em ação. O grupo de De Greef desenvolveu uma microcápsula de proteínas e um polímero e ancorou uma lima por cápsula. De Greef: “Essas cápsulas têm propriedades térmicas que podemos usar a nosso favor.” Acima de 50 graus Celsius, as cápsulas se fecham, permitindo que o processo de PCR ocorra separadamente em cada cápsula. Não há muito espaço para erros então. De Greef chama isso de ‘PCR termoconfinado’. No laboratório, até agora conseguiu ler 25 arquivos simultaneamente sem erros significativos.
Se você baixar a temperatura novamente, as cópias se desprendem da cápsula e o original ancorado permanece, o que significa que a qualidade do seu arquivo original não se deteriora. De Greef: “Atualmente, estamos com uma perda de 0,3 por cento após três leituras, em comparação com 35 por cento com o método existente.”
Pesquisável com fluorescência
E isso não é tudo. De Greef também tornou a biblioteca de dados ainda mais fácil de pesquisar. Cada arquivo recebe uma etiqueta fluorescente e cada cápsula sua própria cor. Um dispositivo pode então reconhecer as cores e separá-las umas das outras. Isso nos traz de volta ao braço robótico imaginário no início desta história, que selecionará o arquivo desejado do pool de cápsulas no futuro.
Isso resolve o problema de leitura dos dados. De Greef: “Agora é só esperar até que os custos da síntese de DNA caiam ainda mais. A técnica estará então pronta para aplicação.” Como resultado, ele espera que a Holanda em breve seja capaz de abrir seu centro de dados de DNA inaugural – uma estreia mundial.
.