DNA – apelidado de “meio de armazenamento da natureza” – armazenou com precisão os conjuntos de instruções para toda a vida na Terra por bilhões de anos. Mas também pode ser a chave para gerenciar o crescimento explosivo de dados e armazenar dados de arquivo para as próximas gerações.
A ideia de armazenar dados digitais em DNA remonta a mais de meio século, mas tornando-se um a realidade acelerou nos últimos anos com avanços em biotecnologia e custos decrescentes de sequenciamento de genoma.
Dave Landsman é o diretor sênior de padrões da indústria e um engenheiro distinto Nos últimos dois anos, ele tem sido um dos principais na exploração de armazenamento de dados de DNA da empresa.
“À medida que procuramos maneiras de armazenar a explosão de dados criada pelo desejo de digitalizar, salvar e extrair cada vez mais informações, precisamos explorar novas tecnologias de armazenamento para complementar a hierarquia de armazenamento atual”, disse Landsman. “Embora a tecnologia ainda seja incipiente como uma realidade comercial, o armazenamento de dados de DNA pode desbloquear a capacidade de armazenar grandes quantidades de dados por décadas ou séculos, a baixo custo.”
No final de 2020, líderes de tecnologia Twist Bioscience, Illumina, Microsoft uniram forças para criar a DNA Data Storage Alliance. A organização cresceu para mais de 60 empresas membros e recentemente se juntou à Storage Networking Industry Association (SNIA) como um grupo SNIA Technology Affiliate. Isso alavanca a adesão à Aliança e a experiência de definição de padrões da SNIA.
“Para obter um rack de armazenamento de dados de DNA em um piso de data center, em última análise, é necessário um ecossistema baseado em padrões”, disse Landsman. “A afiliação da DNA Data Storage Alliance com a SNIA impulsionará nossos esforços para criar isso.”
Os “AGCT’s” do armazenamento de DNA
Landsman explicou como a tecnologia de armazenamento de dados de DNA se baseia nos blocos de construção da química e da biologia.
As moléculas de DNA são compostas por longas cadeias de nucleotídeos . Cada nucleotídeo de DNA contém uma base (adenina, guanina, citosina ou timina) que codifica a informação que nossa maquinaria celular usa para codificar e expressar o genoma humano.
Devido aos avanços dramáticos nas últimas décadas , agora é possível construir uma molécula de DNA sintético, base por base, com as bases encadeadas em qualquer ordem.
Ao mapear os 1’s e 0’s de um objeto digital (por exemplo, arquivo, imagem, etc.) nas quatro bases de DNA, o DNA sintetizado se torna uma versão codificada dos dados digitais originais. Quando é hora de ler os dados, o DNA é sequenciado, extraindo as bases e decodificando-as novamente em 1’s e 0’s.