fugaku superordenadores summit

Durante los últimos años, hemos asistido a un impulso sin precedentes en la adopción de tecnologías digitales. Desde la computación de alto rendimiento (HPC) y el ya habitual análisis de grandes cantidades de datos, hasta la inteligencia artificial (IA) y el aprendizaje automático (ML).

Los superordenadores, también llamados clusters computacionales o en paralelo, procesan simulaciones complejas al dividir los problemas de computación en “trabajos” más pequeños. Estos se ejecutan simultáneamente en múltiples nodos de servidores interconectados por una red rápida. La relación precio-rendimiento de estos sistemas mejora de forma constante. Lo que contribuye a que la HPC sea más asequible. Un problema de computación que hace veinte años tardaría semanas en procesarse, en sistemas de varios millones de euros, se puede resolver en tan solo unas horas en un único servidor equipado con GPU para su cálculo.

La HPC, que antes solo estaba al alcance de instituciones educativas y grandes empresas, se ha vuelto más asequible. Ya que las nubes públicas y los centros de datos colectivos permiten a las organizaciones más pequeñas reservar capacidad de cálculo remota bajo demanda. Solo han de pagar por las horas de uso por núcleo y los servicios relacionados.

Esta computación de alto rendimiento permite a las organizaciones resolver un amplio abanico de problemas complejos. Incluye la optimización de productos y el diseño electrónico, el análisis crediticio y la detección de fraudes, descubrimiento de fármacos, simulación de estudios en humanos, predicción meteorológica, etc.

Una nueva era de la supercomputación

Entre 2002 a 2009, el rendimiento en la supercomputación se duplicó casi cada 12 meses. Sin embargo, este ritmo se redujo a cada 2,3 años entre 2009 y 2019. Lo que se atribuye a varios factores, como la ralentización de la Ley de Moore y limitaciones técnicas como el escalado de Dennard.

Los superordenadores, también llamados clusters computacionales o en paralelo, procesan simulaciones complejas al dividir los problemas de computación en “trabajos” más pequeños

Sin embargo, la tecnología ofrece formas innovadoras de superar las limitaciones, para dar paso a lo que se denomina la era de la computación a exaescala. Un sistema de este tipo es aquel que puede realizar un quintillón de operaciones en coma flotante por segundo (FLOPS). Eso es un billón de billones -o 1.000.000.000.000.000-, lo que significa que las máquinas de exaescala pueden resolver cálculos cinco veces más rápido que los mejores superordenadores actuales y, también, ejecutar modelos más complejos y de mayor precisión.

Para alcanzar estas nuevas cotas de rendimiento, los ingenieros adoptan un enfoque heterogéneo. Este consiste en la integración de CPU con GPU y la optimización iterativa tanto del hardware como del software. El objetivo es alcanzar nuevos niveles de rendimiento y eficiencia a un menor coste por FLOPS.

No hay mejor ejemplo para demostrarlo que el superordenador Frontier, que está en desarrollo dentro de Oak Ridge Leadership Computing Facility en Estados Unidos. Está llamado a hacer historia como el primer superordenador de exascala operativo del mundo, cuando se ponga en marcha a finales de este año. Integra CPU AMD EPYC de tercera generación y GPU Radeon Instinct. Con lo que ofrecerá más de 1,5 exaflops de potencia de procesamiento máxima. También habrá un sistema de clase exascala basado en AMD, aún más potente, llamado El Capitán y cuya construcción está prevista en Lawrence Livermore National Labs, Estados Unidos, para 2023.

Japón llegó en primer lugar, con su propio superordenador FUGAKU de 1,42 exaflops de rendimiento máximo y, según se informa, China opera ya un sistema Sunway “Oceanlite” de 1,32 exaflops, aunque es menos conocido. ¿Dónde se sitúa Europa en esta carrera?

La misión europea de la exaescala

Mientras China y Estados Unidos buscan convertirse en los líderes del mundo de la supercomputación, Europa adopta un enfoque más colaborativo con European High-Performance Computing Joint Undertaking (EuroHPC), financiada por el gobierno europeo. La iniciativa reúne recursos para financiar una infraestructura europea de HPC, con datos de primer orden, y apoyar un ecosistema de supercomputación innovador.

Los esfuerzos en supercomputación del continente también se ven reforzados por Horizon Europe. Este impulsa descubrimientos y primicias mundiales, incluido el desarrollo de máquinas de exaescala situadas en la UE.

Valga como ejemplo el superordenador Hawk, actualmente en el puesto 24º en la lista TOP500 de los superordenadores más rápidos del mundo. Está instalado en la Universidad de Stuttgart (HLRS) y es un sistema basado en HPE Apollo 9000 con 5.632 nodos repartidos en 44 racks. Cada uno de ellos lleva CPU AMD EPYC y ofrece alrededor de 26 petaflops de rendimiento máximo. HLRS permite a los clientes del sector de la automoción realizar análisis estructurales y simulaciones de dinámica de fluidos.

También está Lumi, una máquina pre-exaescala situada en el IT Centre for Science (CSC) de Kajaani (Finlandia). Con sus CPU AMD EPYC “Trento” personalizadas y cuatro aceleradores con GPU AMD Instinct MI250X por nodo, será capaz de ejecutar más de 375 petaflops o 375.000 millones de millones de cálculos por segundo, con un rendimiento máximo teórico de más de 550 petaflops por segundo.

Lumi también ofrece una innovadora “tecnología de refrigeración gratuita”, que permite utilizar el calor residual en la red de calefacción urbana de Kajaani. Así reduce aún más los costes y la huella de CO2. Se prevé que esta tecnología reduzca la huella de carbono anual de toda la ciudad en 13.500 toneladas, una cantidad que equivale a la producida por 4.000 coches2.

En su camino hacia la exaescala, Europa ya conoce el nuevo mundo de posibilidades que ofrece este nivel de rendimiento sin igual. Estos sistemas ayudarán a resolver las cuestiones más complejas de la investigación científica. Permitirán a los científicos crear modelos más realistas del sistema terrestre y el clima. Además de potenciar nuevos estudios del Universo, desde la física de partículas hasta la formación de las estrellas.

Con el acceso a la tecnología desarrollada por AMD y los proveedores de x86 que ya se utiliza en algunas de las máquinas más rápidas del mundo, así como el acceso a una serie de herramientas de software de código abierto para optimizar y escalar las cargas de trabajo de supercomputación, Europa ya es capaz de resolver soluciones complejas y aprovechar las ventajas de la computación a exaescala. Sin embargo, para que Europa se tome en serio la posibilidad de explotar sus propios sistemas de clase Exascale, será necesario que varios países europeos sigan invirtiendo en el desarrollo de hardware, herramientas y software escalable.

Por Roger Benson, Senior Director, Commercial EMEA en AMD.

>