Consiguen grabar imágenes y todos los sonetos de Shakespeare en ADN

Imagen: chrisharvey. Fuente: PhotoXpress.

Investigadores del EMBL-European Bioinformatics Institute (EMBL-EBI) han creado un método de almacenamiento de datos en forma de ADN, un material que tiene una duración de decenas de miles de años. El nuevo sistema, del que habla la revista Nature, permite almacenar al menos 100 millones de horas de vídeo de alta definición en una ‘taza’ de ADN.

Actualmente, en el mundo existe una ingente cantidad de información digital, se calcula que equivalente a tres zettabytes (3021 bytes). Además, la creación constante de nuevos contenidos digitales plantea un verdadero desafío para el almacenamiento de archivos.

Los discos duros son caros y requieren de un suministro constante de electricidad, mientras que incluso el mejor material archivador que no precisa electricidad, como las cintas, tiene un tiempo máximo de degradación de una década. Este es un problema creciente para ciencias como la biología, con volúmenes masivos de datos, entre los que se incluyen secuencias de ADN. Estos datos conforman gran parte del corpus de los registros científicos.

"Ya sabíamos que el ADN es un medio eficaz de almacenamiento de información, ya que hemos podido extraerlo de huesos de mamuts lanudos con una antigüedad de decenas de miles de años, y darles sentido", explica Nick Goldman, del EMBL-EBI, en un comunicado de dicha institución. “También es un recurso de almacenamiento increíblemente pequeño, denso y que no necesita ninguna fuente energética, por lo que su transporte y mantenimiento es sencillo", añade el científico.

Pero aunque la lectura del ADN es una tarea fácil, escribir en él ha sido hasta ahora un obstáculo. En este sentido, hay dos problemas: en primer lugar, con los métodos actuales solo es posible producir ADN en cadenas cortas. En segundo lugar, tanto la escritura como la lectura de ADN son propensas a errores, en particular cuando se repiten las letras de ADN (cualquier secuencia de ADN está formada por una sucesión de letras que representan la estructura primaria de una molécula real o hipotética de ADN o banda, con la capacidad de transportar información).

Nick Goldman y su colaborador, Ewan Birney (director asociado del EMBL-EBI), se propusieron crear un código que resolviese ambos problemas.

Una pequeña mota cargada de información

"Sabíamos que teníamos que desarrollar un código utilizando solo cadenas cortas de ADN, y hacerlo de tal manera que resultara imposible crear una banda con la misma letra. Así que pensamos: vamos a descomponer el código en un montón de fragmentos, con información de indexación que muestre a qué parte del código general pertenece cada fragmento, y hagamos un esquema de codificación que no permita repeticiones. De esta manera, deberíamos tener el mismo error en cuatro fragmentos diferentes para que el ADN no funcione… y eso sería muy raro”, explica Birney.

El nuevo método requiere la síntesis de ADN con la información codificada, proceso en el que participó Agilent Technologies, Inc, una compañía que fabrica dispositivos electrónicos y que tiene su sede en California.

Birney y Goldman enviaron a esta empresa versiones codificadas de los siguientes archivos: el discurso de Martin Luther King en mp3 "I Have a Dream" (“Tengo un sueño”); una foto en jpg del EMBL-EBI; un pdf del artículo original ("Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid") de los genetistas Watson y Crick (primera publicación que describió la estructura de doble hélice del ADN, aparecida en Nature); un archivo de texto con de todos los sonetos de Shakespeare, y un archivo que describía la propia codificación.

Nick Goldman, del EMBL-EBI, mira el ADN sintetizado. Imagen: EMBL Photolab. Fuente: EMBL-EBI.

"Descargamos los archivos de la web y los usamos para sintetizar cientos de miles de fragmentos de ADN. El resultado se parece a una pequeña mota de polvo", señala Emily Leproust, de Agilent.

Agilent envió al EMBL-EBI la muestra de ADN ya sintetizada con la información enviada, y los investigadores del EMBL-EBI fueron capaces de descifrar los archivos que este ADN contenía, sin error alguno.

"Hemos creado este código fiable usando una forma molecular que sabemos que va a durar, en las condiciones adecuadas, unos 10.000 años e incluso más", afirma Goldman. "Siempre que alguien conozca el código, podrá leerlo de nuevo; si se tiene una máquina capaz de leer ADN".

Aunque quedan por resolver aún muchos aspectos prácticos del sistema, la densidad inherente y la durabilidad del ADN hacen que este sea un medio atractivo de almacenamiento. El siguiente paso para los investigadores será perfeccionar el sistema de codificación y explorar los aspectos prácticos, allanando el camino para un modelo de almacenamiento en ADN comercialmente viable.

Referencia bibliográfica:

Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney. Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Nature (2013). DOI: 10.1038/nature11875.

Consiguen grabar imágenes y todos los sonetos de Shakespeare en ADN

Investigadores del EMBL-European Bioinformatics Institute desarrollan un método eficaz de almacenamiento de datos en el material genético

{{date}} {{title}}