HPE IA swarm learning process

HPE ha anunciado que está trabajando en la eliminación de barreras para que las empresas construyan y entrenen fácilmente modelos de Machine Learning a escala, para generar valor más rápido, con el nuevo sistema de desarrollo de soluciones de Machine Learning de HPE. Este nuevo sistema, diseñado específicamente para la IA, es una solución integral que engloba una plataforma de software, computación, aceleradores y comunicaciones para desarrollar y entrenar modelos de IA de manera más precisa, más rápida y a escala.

El sistema de desarrollo de Machine Learning de HPE es el resultado de la inversión que realizó HPE con la adquisición de IA Determined para combinar su sólida plataforma de Machine Learning (ML), conocida actualmente como HPE Machine Learning Development Environment, con sus soluciones de IA y de supercomputación (HPC). Con el nuevo sistema de desarrollo de ML de HPE, los usuarios pueden acelerar el tiempo necesario para obtener valor de sus modelos, y así comenzar a obtener resultados desde la construcción y entrenamiento de esos modelos, reduciendo los tiempos, pasando de semanas y meses a solamente unos días.

HPE también ha anunciado hoy que Aleph Alpha, una startup alemana de IA, ha adoptado el Sistema de Desarrollo de ML de HPE para entrenar su IA multimodal, que incluye Procesamiento del Lenguaje Natural (PLN) y visión artificial. Al combinar el procesamiento de imágenes y textos en cinco idiomas con una comprensión del contexto casi similar a la humana, los modelos amplían los límites de la IA moderna para todo tipo de casos de uso innovadores basados en el lenguaje y las imágenes, tales como asistentes de IA para la creación de textos complejos, resúmenes y comprensión de alto nivel, búsqueda de información muy específica en cientos de documentos y aprovechamiento de conocimientos especializados en un contexto conversacional.

El sistema de desarrollo de Machine Learning de HPE es el resultado de la inversión que realizó HPE con la adquisición de IA Determined

Al adoptar el sistema de desarrollo de ML de HPE, Aleph Alpha ha conseguido que su sistema se pusiera en marcha y empezase el entrenamiento de forma eficiente en un tiempo récord, combinando y supervisando cientos de GPU.

“Estamos viendo una eficiencia y un rendimiento sorprendentes, de más de 150 teraflops, al utilizar el HPE Machine Learning Development System. El sistema se configuró rápidamente y empezamos a entrenar nuestros modelos en horas en lugar de en semanas. Poder ejecutar estas cargas de trabajo masivas, combinadas con nuestra investigación en curso, confiando en una solución integrada para el despliegue y la supervisión, marcaron la diferencia”, ha declarado Jonas Andrulis, fundador y director general de Aleph Alpha.

“Las empresas buscan incorporar la IA y el ML para diferenciar sus productos y servicios, pero a menudo se enfrentan a la complejidad de configurar la infraestructura necesaria para construir y entrenar modelos de IA precisos y a escala”, ha explicado Justin Hotard, vicepresidente ejecutivo y gerente general de HPC e IA, en HPE. “El sistema de desarrollo de ML de HPE combina nuestras soluciones integrales end-to-end de HPC para deep learning con nuestra innovadora plataforma de software de ML en un solo sistema, proporcionando así una solución de alto rendimiento lista para usar, que permite acelerar el tiempo necesario para obtener valor y resultados con la IA”.

Aprovechar todo el potencial de la IA con Machine Learning

Las organizaciones aún tienen que alcanzar la madurez en su infraestructura de IA que, según IDC, es la inversión más significativa y costosa requerida para las empresas que desean acelerar su fase de experimentación o creación de prototipos para desarrollar productos y servicios de IA. Por lo general, la adopción de la infraestructura de IA para respaldar el desarrollo y la capacitación de modelos a escala requiere de un proceso complejo de varios pasos que involucra la compra, configuración y administración de un ecosistema de software de procesamiento paralelo, así como una infraestructura que abarca procesamiento, almacenamiento, interconexión y aceleradores especializados.

El sistema de desarrollo de ML de HPE ayuda a las empresas a evitar la alta complejidad asociada con la adopción de la infraestructura de IA, al ofrecer la única solución que combina software, computación especializada con aceleradores, redes y servicios, lo que permite a las empresas comenzar de inmediato a construir y entrenar de manera eficiente modelos de ML optimizados, a escala.

Obtener modelos precisos para conseguir valor más rápido con el sistema de desarrollo ML de HPE

El sistema también ayuda a mejorar la precisión en los modelos de forma más rápida con un entrenamiento distribuido de última generación, optimización automatizada de hiperparámetros y búsqueda de arquitectura neuronal, que son clave para los algoritmos de ML.

El sistema de desarrollo de Machine Learning de HPE ofrece computación optimizada, computación acelerada e interconexión, que son factores clave de rendimiento para escalar los modelos de forma eficiente para una combinación de cargas de trabajo, empezando por una configuración pequeña de 32 GPU hasta una configuración más grande de 256 GPU. En una configuración pequeña de 32 GPU, el sistema de desarrollo de ML de HPE ofrece una eficiencia de escalado de aproximadamente el 90% para cargas de trabajo como el procesamiento del lenguaje natural (PLN) y la visión artificial por ordenador. Además, según pruebas internas realizadas, el sistema de desarrollo de ML de HPE con 32 GPUs ofrece hasta 5,7 veces más velocidad para una carga de trabajo de PLN en comparación con otras soluciones que contengan las mismas 32 GPUs, pero con una interconexión menos eficiente.

El sistema de desarrollo de ML de HPE se ofrece como una solución integrada que proporciona una infraestructura de IA totalmente instalada y preconfigurada para el desarrollo de modelos llave en mano y entrenamiento a escala. Como parte de nuestra oferta, HPE Pointnext Services proporcionará instalación y configuración del software en sus instalaciones, lo que permitirá a los usuarios implementar y entrenar de inmediato modelos de ML para obtener información más rápida y precisa de sus datos.

El sistema de desarrollo de ML de HPE se ofrece a partir de una configuración básica a modo de pequeño bloque de construcción, con opciones para ir creciendo y aumentando la configuración. La configuración base cuenta con estos elementos:

  • Plataforma innovadora de Machine Learning con HPE Machine Learning Development Environment para permitir a las empresas desarrollar, iterar y escalar rápidamente modelos de alta calidad desde la POC hasta producción.
  • Infraestructura de IA optimizada usando el sistema HPE Apollo 6500 Gen10 para proporcionar capacidades de cómputo masivas y especializadas para entrenar y optimizar modelos de IA, comenzando con 8 GPU NVIDIA A100 de 80 GB para computación acelerada.
  • Disposición de supervisión y gestión centralizadas y precisas para un rendimiento óptimo con HPE Performance Cluster Management , una solución de software de gestión de sistemas.
  • Herramientas para controlar y gestionar los componentes del sistema utilizando servidores HPE ProLiant DL325 y switch Ethernet Aruba CX 6300 de 1 Gb.
>