Arquitectura de Dicode. Fuente: Dicode FIUPM.
La Unión Europea ha puesto en marcha un nuevo proyecto que combina las capacidades de razonamiento humanas y de las máquinas para facilitar y aumentar la colaboración y toma de decisiones en entornos cognitivamente complejos y de computación intensiva, según informa la Facultad de Informática de la UPM en un comunicado.
Haciendo uso de avanzados métodos y tecnologías de computación de alto rendimiento y procesamiento de grandes volúmenes de datos—p.e. Cloud computing, MapReduce, Apache Hadoop o Column databases, el nuevo proyecto permitirá buscar, agregar y analizar datos existentes en diversas, extremadamente grandes y continuamente cambiantes, fuentes de datos.
El nuevo proyecto se llama Dicode y puede definirse como una Infraestructura Cloud para potenciar la colaboración y toma de decisiones en entornos de computación intensiva. En el desarrollo del proyecto, que arrancó en septiembre pasado y se prolongará hasta 2013, participan investigadores del Grupo de Informática Biomédica (GIB) de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM), junto a siete equipos de otros tres países (Alemania, Reino Unido y Grecia).
El GIB, que dirige el catedrático Víctor Maojo, participa como socio de perfil tecnológico en las tareas de integración de servicios, herramientas y recursos del proyecto. De hecho, el GIB es el socio líder en dichas tareas de integración de componentes. Además, el GIB colabora activamente en el desarrollo de nuevas herramientas y servicios para la plataforma del proyecto. Por el GIB participan en Dicode los investigadores Guillermo de la Calle Velasco, Miguel García Remesal, David Pérez del Rey y José Crespo del Arco.
Entornos cognitivamente complejos
Los entornos colaborativos y de toma de decisiones están frecuentemente asociados con grandes cantidades de datos de todo tipo, provenientes de diversas fuentes, cuya baja relación señal-ruido hace difícil abordar el problema. Además, estos datos pueden variar en subjetividad e importancia, incluyendo desde opiniones individuales y estimaciones hasta prácticas ampliamente aceptadas, mediciones indiscutibles o resultados científicos. Sus tipos pueden presentar distintos niveles en lo que se refiere a la comprensión humana y la interpretación que hacen las máquinas.
En la actualidad, grandes volúmenes de datos pueden ser añadidos sin esfuerzo a una base de datos. Sin embargo, los problemas comienzan cuando se quiere estudiar y explotar los datos acumulados durante unas pocas semanas o meses, y analizarlos provechosamente para tomar una decisión. En situaciones más complejas es necesario identificar, comprender y aprovechar los patrones existentes en los datos; es necesario integrar grandes volúmenes de datos provenientes de múltiples fuentes y extraer de ellos nuevo conocimiento que nunca surgiría de una simple inspección manual o del análisis de una única fuente de datos.
El proyecto europeo Dicode dará la adecuada respuesta tecnológica a estas necesidades de los entornos cognitivamente complejos. Los servicios desarrollados e integrados en el contexto del proyecto Dicode serán publicados bajo licencia Open Source.
Basada en avances actuales, la solución prevista en el proyecto Dicode combinará las capacidades de razonamiento humanas y de las máquinas. Puede verse como un innovador entorno de trabajo que incorpora y orquesta un conjunto de servicios interoperables (Figura 1) que reduce la complejidad y sobrecarga de datos en los puntos de decisión críticos a un nivel manejable, permitiendo a las partes interesadas ser más productivas y concentrarse en actividades más creativas e innovadoras.
Haciendo uso de avanzados métodos y tecnologías de computación de alto rendimiento y procesamiento de grandes volúmenes de datos—p.e. Cloud computing, MapReduce, Apache Hadoop o Column databases, el nuevo proyecto permitirá buscar, agregar y analizar datos existentes en diversas, extremadamente grandes y continuamente cambiantes, fuentes de datos.
El nuevo proyecto se llama Dicode y puede definirse como una Infraestructura Cloud para potenciar la colaboración y toma de decisiones en entornos de computación intensiva. En el desarrollo del proyecto, que arrancó en septiembre pasado y se prolongará hasta 2013, participan investigadores del Grupo de Informática Biomédica (GIB) de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM), junto a siete equipos de otros tres países (Alemania, Reino Unido y Grecia).
El GIB, que dirige el catedrático Víctor Maojo, participa como socio de perfil tecnológico en las tareas de integración de servicios, herramientas y recursos del proyecto. De hecho, el GIB es el socio líder en dichas tareas de integración de componentes. Además, el GIB colabora activamente en el desarrollo de nuevas herramientas y servicios para la plataforma del proyecto. Por el GIB participan en Dicode los investigadores Guillermo de la Calle Velasco, Miguel García Remesal, David Pérez del Rey y José Crespo del Arco.
Entornos cognitivamente complejos
Los entornos colaborativos y de toma de decisiones están frecuentemente asociados con grandes cantidades de datos de todo tipo, provenientes de diversas fuentes, cuya baja relación señal-ruido hace difícil abordar el problema. Además, estos datos pueden variar en subjetividad e importancia, incluyendo desde opiniones individuales y estimaciones hasta prácticas ampliamente aceptadas, mediciones indiscutibles o resultados científicos. Sus tipos pueden presentar distintos niveles en lo que se refiere a la comprensión humana y la interpretación que hacen las máquinas.
En la actualidad, grandes volúmenes de datos pueden ser añadidos sin esfuerzo a una base de datos. Sin embargo, los problemas comienzan cuando se quiere estudiar y explotar los datos acumulados durante unas pocas semanas o meses, y analizarlos provechosamente para tomar una decisión. En situaciones más complejas es necesario identificar, comprender y aprovechar los patrones existentes en los datos; es necesario integrar grandes volúmenes de datos provenientes de múltiples fuentes y extraer de ellos nuevo conocimiento que nunca surgiría de una simple inspección manual o del análisis de una única fuente de datos.
El proyecto europeo Dicode dará la adecuada respuesta tecnológica a estas necesidades de los entornos cognitivamente complejos. Los servicios desarrollados e integrados en el contexto del proyecto Dicode serán publicados bajo licencia Open Source.
Basada en avances actuales, la solución prevista en el proyecto Dicode combinará las capacidades de razonamiento humanas y de las máquinas. Puede verse como un innovador entorno de trabajo que incorpora y orquesta un conjunto de servicios interoperables (Figura 1) que reduce la complejidad y sobrecarga de datos en los puntos de decisión críticos a un nivel manejable, permitiendo a las partes interesadas ser más productivas y concentrarse en actividades más creativas e innovadoras.
Validación por el uso
El éxito de los objetivos del proyecto Dicode será validado a través de tres casos de uso. Estos casos fueron elegidos para demostrar la transferibilidad de las soluciones Dicode en diferentes escenarios colaborativos y de toma de decisiones, asociados con diversos tipos y fuentes de datos, cubriendo así toda la gama de características y funcionalidades previstas en dichas soluciones.
Los casos de uso son: Descubrimiento de conocimiento Clínico-Genómico para la Investigación; Proyecto piloto para el estudio informático del tratamiento de la Artritis Reumatoide; y Minería de Opiniones a partir de datos no estructurados de la Web 2.0.
El consorcio está coordinado por el Research Academic Computer Technology Institute de Grecia e integrado, además de por el equipo del GIB, por la Universidad de Leeds (Reino Unido), por el Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (Alemania), el Neofonie Gmbh (Alemania), el Image Analysis Ltd (Reino Unido), el Biomedical Research Foundation - Academy of Athens (Grecia) y el Publicis Frankfurt GmbH (Alemania).
El éxito de los objetivos del proyecto Dicode será validado a través de tres casos de uso. Estos casos fueron elegidos para demostrar la transferibilidad de las soluciones Dicode en diferentes escenarios colaborativos y de toma de decisiones, asociados con diversos tipos y fuentes de datos, cubriendo así toda la gama de características y funcionalidades previstas en dichas soluciones.
Los casos de uso son: Descubrimiento de conocimiento Clínico-Genómico para la Investigación; Proyecto piloto para el estudio informático del tratamiento de la Artritis Reumatoide; y Minería de Opiniones a partir de datos no estructurados de la Web 2.0.
El consorcio está coordinado por el Research Academic Computer Technology Institute de Grecia e integrado, además de por el equipo del GIB, por la Universidad de Leeds (Reino Unido), por el Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (Alemania), el Neofonie Gmbh (Alemania), el Image Analysis Ltd (Reino Unido), el Biomedical Research Foundation - Academy of Athens (Grecia) y el Publicis Frankfurt GmbH (Alemania).