Bionimbus ‘cuelga’ la mayor base de datos sobre el cáncer en la nube

Permite acceder y analizar información sin complejas infraestructuras de almacenamiento


La Universidad de Chicago en Estados Unidos ha lanzado el primer sistema de código abierto basado en la nube para administrar, analizar y compartir información sobre el genoma del cáncer humano sin necesidad de las costosas y complejas infraestructuras que normalmente se necesitan para almacenar y descargar grandes volúmenes de datos. Se estima que la plataforma, bautizada como Bionimbus, alberga ya más de un petabyte de datos científicos. Por Patricia Pérez


Patricia Pérez
22/05/2013

Representación de la molécula que anula ADN de un cromosoma en el núcleo de una célula. Fuente: NHGRI
Actualmente se calcula que pueden existir más de 200 tipos diferentes de cáncer, causados por errores en el ADN que desencadenan el crecimiento descontrolado de las células.

La investigación se centra ahora en identificar los cambios en el conjunto completo de ADN de cada tipo de cáncer, su genoma y en entender cómo interactúan dichos cambios para provocar la enfermedad, de forma que se pueda sentar las bases de un tratamiento mucho más individualizado.

Este giro ha multiplicado la información existente lo que, sumado a la importancia de compartir y poner en común los últimos estudios entre la comunidad científica mundial, lleva a la necesidad imperiosa de crear infraestructuras para darles cabida.

Eso es lo que ha conseguido la Universidad de Chicago en Estados Unidos con el lanzamiento del primer sistema de computación en la nube que permite a los investigadores acceder y analizar información sobre la genómica del cáncer humano de forma segura. Bionimbus, como se ha bautizado esta nube de datos protegidos, sustituye a costosas y complejas infraestructuras utilizadas para descargar y almacenar grandes volúmenes de datos.

Según explica la universidad en nota de prensa, se trata de un sistema de código abierto basado en la nube desarrollado por el Instituto de Genómica y Biología de Sistemas (GSB) a partir de una tecnología creada en parte por el Open Science Data Cloud, un proyecto financiado por la Fundación Nacional de Ciencia (NSF) de EEUU para instaurar servicios en la nube para grandes bases de datos científicas.

Su puesta en marcha proporciona a los investigadores un mecanismo mucho más efectivo en tiempo y coste para extraer grandes dosis de información. “Esta tecnología permitirá gestionar y analizar grandes bases de datos esenciales para hacer frente a algunos de los desafíos actuales más importantes, desde la vigilancia medioambiental a la genómica del cáncer”, destaca Robert L. Grossman, director del Open Science Data Cloud y profesor de la Universidad de Chicago.

Centrados en la secuenciación

Con el fin de disponer de un recurso poderoso de cara a una nueva era de investigaciones centradas en mejorar las estrategias de diagnóstico, tratamiento y prevención de cada tipo de cáncer, los Institutos Nacionales de la Salud (NIH) de Estados Unidos han establecido el Atlas del Genoma del Cáncer (TCGA), una plataforma para albergar mapas multidimensionales completos de los cambios genómicos clave en los tipos y subtipos principales de cáncer.

Catálogos como este están disponibles en Bionimbus para que investigadores autorizados por los NIH puedan acceder y analizar la información sin necesidad de crear un entorno seguro compatible donde gestionar terabytes de datos, o de descargar dicha información –lo cual puede llevar semanas- e instalar después las herramientas adecuadas para realizar los análisis deseados.

Por el contrario, esta nube permite a los investigadores centrarse en el análisis de la secuenciación del genoma del cáncer a gran escala, aspecto que los expertos creen que puede abrir caminos en la detección temprana, tratamiento adecuado y prevención del cáncer. En este sentido, Bionimbus está diseñado para servir de apoyo a los instrumentos de secuenciación de nueva generación e integrar al mismo tiempo la tecnología para el análisis y soporte de grandes volúmenes de información.

Actualmente existe una versión de código abierto disponible para aquellos que desean crear sus propias nubes, así como una nube comunitaria, con toda la genómica pública disponible e información relacionada. Se estima que esta última distribuye aproximadamente un petabyte de datos científicos, aunque aspira a duplicar esa cantidad en los próximos años.

De momento, los usuarios son mayoritariamente universidades e institutos que están integrados en Internet2 o Nacional Lambda Rail, redes telemáticas estadounidenses que permiten altas velocidades con una gran fiabilidad.

El Open Science Data Cloud comprende diez bastidores del centro de datos de la Universidad de Chicago. Fuente: Raymond C Parpart/ Universidad de Chicago.
Solución mundial

“Al adoptar el cloud computing como una solución mundial, este proyecto reúne la experiencia de muchos investigadores, no sólo de EEUU sino de todo el mundo”, subraya Harold Stolberg, del NSF. “El logro de ayudar a investigadores a acceder y analizar información importante sobre el genoma del cáncer humano es un importante indicador sobre la evolución futura de estas tecnologías”, añade.

En estos momentos, la nube cuenta con varias bases de datos disponibles, incluyendo el Proyecto 1000 Genomas -consorcio internacional dirigido a crear un mapa de alta resolución de las principales mutaciones del ADN que afectan a la salud humana-, volúmenes de información del Centro Nacional para la Información Biotecnológica (NCBI) -importante fuente de información de biología molecular-, así como completas bases de datos públicas sobre genómica.

Prueba de su utilidad, Megan McNerney, patóloga de la Universidad de Chicago, utilizó Bionimbus para analizar la información que le llevó a descubrir que el gen CUX1, que actúa como supresor tumoral, se inactiva con frecuencia en la leucemia mieloide aguda.

La nube fue fundamental en su trabajo, ya que la utilizó en todos los aspectos del proyecto, incluyendo el almacenamiento seguro de datos protegidos, el control de calidad de los resultados de la secuenciación de nueva generación, alineaciones, análisis de expresión e incluso el desarrollo de algoritmos.

Sin embargo, la fuerza de Bionimbus, según McNerney, radica en “el apoyo que proporciona a los usuarios finales”, lo que permitió utilizar la nube a todos los miembros del equipo, tanto a los expertos como a los no expertos.



Patricia Pérez
Artículo leído 4700 veces



Más contenidos