Esquema del diseño BlueGene. Fuente: Wikipedia
La Conferencia SC10 sobre computación de alto rendimiento, conexión en red, almacenamiento y análisis que se celebra hasta el próximo 19 de noviembre en Nueva Orleans (Louisiana) ha sido el escenario de la presentación del documento “Performance Analysis of a Hybrid MPI/CUDA Implementation of the NAS-LU Benchmark”, obra de los profesores del departamento de Informática de la Universidad de Warwick, que compara el superordenador más potente de China ( y ahora el más potente del mundo) con los diseños de supercomputación utilizados por las máquinas estadounidenses.
Según un comunicado de la institución inglesa, recogido por Science Daily, el nuevo estudio refleja cómo los diseños GPU (GPGPU), ideados inicialmente para generación de gráficos en 3D y empleados en la nueva supercomputadora china ‘Thiane 1A’, presentada a finales del mes pasado, impusieron un nuevo récord de rendimiento al superar los 2.5 petaflops, contra los diseños alternativos de supercomputación empleados en EE.UU, que utilizan procesadores en paralelo de núcleo relativamente simple, interconexionados de manera muy eficaz y escalable, como es el caso de las arquitecturas ‘BlueGene’ de IBM.
Como afirma el principal autor del estudio, el profesor Stephen Jarvis, su análisis supondrá una ventaja importante en los planes de investigación y desarrollo del diseño de arquitecturas para superordenadores de los dos grandes colosos de la supercomputación, China y EEUU: “Si usted está invirtiendo miles de millones de dólares o yuanes en programas de supercomputación, entonces vale la pena que pare y se replantee cuál de los diseños podría conducirle de forma realista a la exascala, y una vez que lo tenga decidido, deberá evaluar y mitigar los riesgos conocidos -el poder, resistencia y capacidad de programación”.
Según un comunicado de la institución inglesa, recogido por Science Daily, el nuevo estudio refleja cómo los diseños GPU (GPGPU), ideados inicialmente para generación de gráficos en 3D y empleados en la nueva supercomputadora china ‘Thiane 1A’, presentada a finales del mes pasado, impusieron un nuevo récord de rendimiento al superar los 2.5 petaflops, contra los diseños alternativos de supercomputación empleados en EE.UU, que utilizan procesadores en paralelo de núcleo relativamente simple, interconexionados de manera muy eficaz y escalable, como es el caso de las arquitecturas ‘BlueGene’ de IBM.
Como afirma el principal autor del estudio, el profesor Stephen Jarvis, su análisis supondrá una ventaja importante en los planes de investigación y desarrollo del diseño de arquitecturas para superordenadores de los dos grandes colosos de la supercomputación, China y EEUU: “Si usted está invirtiendo miles de millones de dólares o yuanes en programas de supercomputación, entonces vale la pena que pare y se replantee cuál de los diseños podría conducirle de forma realista a la exascala, y una vez que lo tenga decidido, deberá evaluar y mitigar los riesgos conocidos -el poder, resistencia y capacidad de programación”.
Sin embargo, ante el debate sobre comprar GPGPU o BlueGene, Jarvis reconoce que “nadie puede estar completamente seguro del diseño que se impondrá a niveles de exascalas”, o lo que es lo mismo, ordenadores con capacidad de procesar un trillón de operaciones de punto flotante por segundo (10 ^ 18), el próximo hito de la informática del siglo XXI.
Los desafíos de la supercomputación
La investigación del profesor Jarvis utiliza modelos matemáticos, evaluaciones comparativas y simulaciones para determinar el rendimiento probable de estos diseños en un futuro y poner de relieve los principales desafíos en la guerra de supercomputación.
Para el autor del estudio, el primero de los retos es superar la brecha real que existe entre la ingeniería y la programación, donde incluso los mejores programadores del mundo están luchando para llegar a utilizar una pequeña fracción de la potencia de cálculo que permiten los últimos diseños de supercomputación. Un abismo que seguirá siendo un problema si no se produce una innovación significativa.
"El Tianhe-1A tiene un rendimiento máximo teórico de 4,7 petaflops, sin embargo, nuestras mejores marcas registradas de un código de programación sólo pueden ofrecer 2,5 petaflops, lo que supone desaprovechar gran parte del potencial del equipo. Esto contrasta con el BlueGene del Lawrence Livermore National Laboratory en los EE.UU., una pequeña máquina de 0,5 petaflops de rendimiento, que por el contrario ofrece 0.415 petaflops. En muchos sentidos, esto no es sorprendente, ya que nuestros modelos de programación actuales están diseñados alrededor de las CPU2, explica el profesor Jarvis.
Pero los problemas no terminan ahí. El diseño BlueGene también tiene sus inconvenientes, como recuerda Jarvis: “En nuestro trabajo mostramos que BlueGenes puede requerir muchos más elementos de procesamiento que un sistema basado en GPU para hacer el mismo trabajo. Muchos de nuestros algoritmos científicos (las recetas que utilizamos para hacer los cálculos) no sirven a esta escala, de modo que a menos que empiece a invertirse en esta área, sólo tendremos máquinas fantásticas que no podremos usar".
Otro de los desafíos claves identificados en la investigación de la Universidad de Warwick es el hecho de que en la carrera por utilizar GPGPUs, los investigadores aún no han puesto suficiente energía en la elaboración de tecnologías que realmente se puedan usar en paralelo a escala masiva. El informe pone de manifiesto que los sistemas basados en la tecnología GPU resuelven problemas entre 3 y 7 veces más rápido que los tradicionales diseños basados en la CPU. Sin embargo, también recalca que a medida que aumenta el número de elementos de proceso conectados entre sí, el rendimiento de los sistemas basados en GPU mejora a un ritmo mucho más lento que las máquinas diseñadas al estilo de BlueGene.
Como conclusión del estudio, el profesor Jarvis se atreve a vaticinar el futuro: "Habida cuenta de la encrucijada en la que se halla la supercomputación y el orgullo que se juega en la carrera de la exascala, la batalla por el diseño seguirá disputándose y se necesitarán las mejores técnicas de modelado que la comunidad pueda aportar para discernir el diseño bueno del malo”.
El nuevo superordenador más potente del mundo es chino
La supercomputadora ‘Tianhe 1A’ acaba de hacerse con el primer puesto de la prestigiosa lista TOP500, una clasificación de los superordenadores más rápidos del mundo, elaborada por universidades alemanas y estadounidenses. El sistema, diseñado en China por la Universidad Nacional de Tecnologías de Defensa y ubicado en el Centro Nacional de Supercomputación de Tianjin, ha acabado así con casi dos décadas de dominio estadounidense y japonés.
Los desafíos de la supercomputación
La investigación del profesor Jarvis utiliza modelos matemáticos, evaluaciones comparativas y simulaciones para determinar el rendimiento probable de estos diseños en un futuro y poner de relieve los principales desafíos en la guerra de supercomputación.
Para el autor del estudio, el primero de los retos es superar la brecha real que existe entre la ingeniería y la programación, donde incluso los mejores programadores del mundo están luchando para llegar a utilizar una pequeña fracción de la potencia de cálculo que permiten los últimos diseños de supercomputación. Un abismo que seguirá siendo un problema si no se produce una innovación significativa.
"El Tianhe-1A tiene un rendimiento máximo teórico de 4,7 petaflops, sin embargo, nuestras mejores marcas registradas de un código de programación sólo pueden ofrecer 2,5 petaflops, lo que supone desaprovechar gran parte del potencial del equipo. Esto contrasta con el BlueGene del Lawrence Livermore National Laboratory en los EE.UU., una pequeña máquina de 0,5 petaflops de rendimiento, que por el contrario ofrece 0.415 petaflops. En muchos sentidos, esto no es sorprendente, ya que nuestros modelos de programación actuales están diseñados alrededor de las CPU2, explica el profesor Jarvis.
Pero los problemas no terminan ahí. El diseño BlueGene también tiene sus inconvenientes, como recuerda Jarvis: “En nuestro trabajo mostramos que BlueGenes puede requerir muchos más elementos de procesamiento que un sistema basado en GPU para hacer el mismo trabajo. Muchos de nuestros algoritmos científicos (las recetas que utilizamos para hacer los cálculos) no sirven a esta escala, de modo que a menos que empiece a invertirse en esta área, sólo tendremos máquinas fantásticas que no podremos usar".
Otro de los desafíos claves identificados en la investigación de la Universidad de Warwick es el hecho de que en la carrera por utilizar GPGPUs, los investigadores aún no han puesto suficiente energía en la elaboración de tecnologías que realmente se puedan usar en paralelo a escala masiva. El informe pone de manifiesto que los sistemas basados en la tecnología GPU resuelven problemas entre 3 y 7 veces más rápido que los tradicionales diseños basados en la CPU. Sin embargo, también recalca que a medida que aumenta el número de elementos de proceso conectados entre sí, el rendimiento de los sistemas basados en GPU mejora a un ritmo mucho más lento que las máquinas diseñadas al estilo de BlueGene.
Como conclusión del estudio, el profesor Jarvis se atreve a vaticinar el futuro: "Habida cuenta de la encrucijada en la que se halla la supercomputación y el orgullo que se juega en la carrera de la exascala, la batalla por el diseño seguirá disputándose y se necesitarán las mejores técnicas de modelado que la comunidad pueda aportar para discernir el diseño bueno del malo”.
El nuevo superordenador más potente del mundo es chino
La supercomputadora ‘Tianhe 1A’ acaba de hacerse con el primer puesto de la prestigiosa lista TOP500, una clasificación de los superordenadores más rápidos del mundo, elaborada por universidades alemanas y estadounidenses. El sistema, diseñado en China por la Universidad Nacional de Tecnologías de Defensa y ubicado en el Centro Nacional de Supercomputación de Tianjin, ha acabado así con casi dos décadas de dominio estadounidense y japonés.