segunda-feira, março 05, 2018

Microsoft Research armazena e recupera informação em cadeia de DNA


Em 2016 a Microsoft Research anunciou que estava investindo um grande esforço para tornar sequências de DNA uma mídia confiável e conveniente para o armazenamento de grandes quantidades de dados. O motivo era simples: a quantidade de informação que pode ser empacotada em cadeias de moléculas é astronômica, muito maior do que qualquer método que utilizamos hoje. Para se ter uma ideia, um grama de material genético é capaz de em teoria armazenar um zetabyte de informação, ou um bilhão de terabytes. O grande problema, no entanto é o método utilizado para escrever e, principalmente, ler os dados: DNA armazena informação em cadeias compostas por quatro bases (adenina, citosina, guanina e timina, ou simplesmente A, C, G e T) e é preciso primeiro traduzir código binário para essa configuração.

Depois, cada bit é dividido em pedaços de 100 a 150 bases de comprimento e inseridos nas terminações das cadeias, de modo que seja “fácil” ler os dados de volta. Além de o método de escrita depender de equipamentos específicos, como a máquina da Twist Bioscience (empresa que forneceu as 10 milhões de cadeias de oligonucleotídeos que a Microsoft utiliza na pesquisa) para fazer a leitura, todo o DNA precisa ser sequenciado. E mais de uma vez, isso porque há um nível de aleatoriedade dada a forma com que os bits acabam impressos nas cadeias, de modo a não receber erros.

No entanto, um time de pesquisadores da Microsoft Research e da Universidade de Washington apresentou um “novo” método para ler os dados no material genético de maneira mais simples: eles implementaram algo próximo a um sistema de arquivos e fizeram uma leitura de acesso randômico, e ainda que não seja necessariamente uma novidade, foi a primeira vez que conseguiram em uma longa cadeia, conseguindo recuperar 200 MB de dados sem erros, divididos em 35 arquivos com tamanhos entre 29 K e 44 MB, consistindo de textos, áudios, imagens e até vídeos em alta definição. [...]

A perspectiva para o uso de material genético como mídia de armazenamento não é para fornecer SSDs ou pendrives com espaço medido em EBs, mas sim prover uma forma de armazenar todo o conhecimento humano de uma maneira ligeiramente mais duradoura (o DNA tem meia-vida de 521 anos). [...]


Nota: A “plataforma de armazenamento” que o ser humano, usando toda a sua inteligência e seus recursos, está começando a utilizar agora existe há cerca de seis mil anos. Portanto, não se trata de “tecnologia de ponta”. Quem criou esse meio de armazenamento de informação que há milênios supera os nossos mais modernos HDs? E mais importante: Quem criou toda a informação genética armazenada nesse “dispositivo”? Sem essa informação e a tecnologia para armazená-la, simplesmente não haveria vida. Ponto. [MB]

Leia mais sobre a maravilha conhecida como DNA. Clique aqui.