El ADN almacena archivos digitales de forma compacta y duradera

La información de 600 smartphones cabe en la punta de este tubo de ensayo, en forma de ADN. Imagen: Tara Brown Photography. Fuente: UW.

Las empresas de tecnología construyen de forma rutinaria centros de datos para almacenar todas las fotos de bebés, transacciones financieras, vídeos divertidos de gatos y mensajes de correo electrónico que atesoran sus usuarios.

Pero una nueva técnica desarrollada por la Universidad de Washington (Seattle, EE.UU.) e investigadores de Microsoft podría reducir el espacio necesario para almacenar los datos digitales que caben en un supermercado, hasta el tamaño de un terrón de azúcar.

Un equipo de ingenieros eléctricos y científicos de la computación ha detallado uno de los primeros sistemas completos para codificar, almacenar y recuperar datos digitales usando moléculas de ADN, que pueden almacenar información millones de veces más compacta que las tecnologías actuales de archivos.

En un experimento presentado en abril en la Conferencia Internacional ACM sobre soporte arquitectónico para lenguajes de programación y sistemas operativos (Atlanta), el equipo codificó con éxito datos digitales de cuatro archivos de imagen en secuencias de nucleótidos de fragmentos de ADN sintético.

Más significativamente, también fueron capaces de revertir ese proceso, rescatando las secuencias correctas de un conjunto más amplio de ADN y reconstruyendo las imágenes sin perder un solo byte de información.

El equipo también ha codificado y recuperado los datos que autentifican archivos de vídeo del proyecto de la UW Voces del Tribunal de Ruanda, que contienen entrevistas con jueces, abogados y otros miembros del tribunal de crímenes de guerra de Ruanda.

"El ADN es muy, muy compacto y muy resistente," dice el co-autor Luis Ceze, profesor asociado de informática en la UW, en la información de ésta. "Esencialmente estamos utilizándolo para almacenar datos digitales -fotos, vídeos, documentos- de una manera manejable, para cientos o miles de años."

Se espera que el universo digital llegue a los 44 billones de gigabytes en 2020. Eso es diez veces más que en 2013, y representa los datos suficientes para llenar más de seis pilas de tablets que lleguen a la luna. Si bien no toda esa información debe ser salvada, el mundo está produciendo datos más rápido que su capacidad para almacenarla.

Las moléculas de ADN puede almacenar información con una densidad muchos millones de veces mayor que las tecnologías existentes para el almacenamiento digital -memorias flash, discos duros, medios magnéticos y ópticos-. Estos sistemas también se degradan al cabo de unos años o décadas, mientras que el ADN puede preservar la información de forma fiable durante siglos. El ADN es más adecuado para aplicaciones de archivos, que para que se pueda acceder a los archivos inmediatamente.

Método

Los investigadores desarrollaron un nuevo método para convertir las largas cadenas de unos y ceros en datos digitales, con los cuatro bloques básicos de construcción de secuencias de ADN: adenina, guanina, citosina y timina.

"Cómo se pasa de unos y ceros a As, Gs, Cs y Ts es importante, ya que si se utiliza un enfoque inteligente, puede conseguirse una alta densidad con pocos errores", dice el co-autor Georg Seelig, profesor de la UE. "Si lo haces mal, obtienes una gran cantidad de errores."

Los datos digitales se cortan en pedazos y se almacenam mediante la síntesis de un número masivo de pequeñas moléculas de ADN, que pueden ser deshidratadas o conservadas de otro modo para su almacenamiento a largo plazo.

Los investigadores de la UW y Microsoft también han demostrado la capacidad para llevar a cabo el "acceso aleatorio": identificar y recuperar las secuencias correctas de esta gran reserva de moléculas de ADN al azar, lo cual es una tarea similar a volver a montar un capítulo de una historia a partir de una biblioteca de libros rasgados.

Acceso

Para acceder después a los datos almacenados, los investigadores también codifican el equivalente a los códigos postales y las direcciones de calles de las secuencias de ADN. Mediante técnicas de reacción en cadena de la polimerasa -comúnmente utilizadas en biología molecular- identifican más fácilmente los códigos postales que están buscando. Utilizando técnicas de secuenciación de ADN, los investigadores pueden entonces "leer" los datos y convertirlos de nuevo a un archivo de vídeo, imagen o documento utilizando las direcciones de calles para reordenar los datos.

Actualmente, la mayor barrera para el almacenamiento viable en ADN es el coste y la eficiencia con la que se puede sintetizar (o fabricar) y secuenciar (o leer) el ADN a gran escala. Pero los investigadores dicen que no hay obstáculo técnico al logro de esas ganancias si hay los incentivos adecuados.

Los avances en el almacenamiento de ADN se basan en técnicas iniciadas por la industria de la biotecnología, pero también incorporan nuevos conocimientos. El enfoque de codificación del equipo de UW y Microsoft, por ejemplo, toma cosas prestadas de los esquemas de corrección de errores usados habitualmente en las memoria de ordenador, y que no se habían aplicado al ADN.

"Este es un ejemplo en el que estamos tomando prestado algo de la naturaleza -ADN- para almacenar información. Pero estamos usando algo que sabemos de las computadoras -cómo corregir errores de memoria- y aplicándolo a la naturaleza ", explica Ceze.

"Este enfoque multidisciplinario es lo que hace este interesante proyecto. Estamos juntando un conjunto diverso de disciplinas para ver dónde están los límites de lo que puede hacerse con el ADN. Y, como resultado, estamos creando un sistema de almacenamiento con una densidad y durabilidad sin precedentes", resume Karin Strauss, investigadora de Microsoft y profesora en la UW.

Referencia bibliográfica:

James Bornholt, Randolph Lopez, Douglas M. Carmean, Luis Ceze, Georg Seelig y Karin Strauss: A DNA-Based Archival Storage System. ACM International Conference on Architectural Support for Programming Languages and Operating Systems (2016).

El ADN almacena archivos digitales de forma compacta y duradera

Microsoft y la Universidad de Washington diseñan un método para guardar datos en las moléculas de la vida

{{date}} {{title}}