MySQL HeatWave ML automatiza completamente el ciclo de vida del Machine Learning y almacena todos los modelos entrenados dentro de la base de datos MySQL, eliminando la necesidad de mover los datos o el modelo a una herramienta o servicio de ML.
Sobre esto, Oracle ha anunciado que Oracle MySQL HeatWave soporta ahora ML dentro de la base de datos, como complemento del procesamiento de transacciones y de la analítica disponibles anteriormente, siendo el único servicio en la nube de MySQL que lo hace.
«MySQL HeatWave es uno de los servicios en la nube de más rápido crecimiento en Oracle. Un número cada vez mayor de clientes ha migrado desde Amazon y otros servicios de bases de datos en la nube a MySQL HeatWave, y han obtenido importantes mejoras de rendimiento y menores costes”, afirma Edward Screven, chief corporate architect, Oracle.
Machine Learning en aplicaciones MySQL
En primer lugar, está el proceso de extracción de datos fuera de la base de datos y en otro sistema para crear y desplegar modelos de ML. Este enfoque crea múltiples silos para aplicar el machine learning a los datos de la aplicación e introduce latencia a medida que los datos se mueven. También conduce a la proliferación de datos fuera de la base de datos, lo que la hace más vulnerable a las amenazas de seguridad y añade complejidad para que los desarrolladores programen en múltiples entornos.
En segundo lugar, los servicios existentes esperan que los desarrolladores sean expertos en guiar el proceso de entrenamiento del modelo ML; de lo contrario, el modelo no es óptimo, lo que degrada la precisión de las predicciones. Por último, la mayoría de las soluciones de ML existentes no incluyen la funcionalidad de proporcionar explicaciones sobre por qué los modelos que los desarrolladores construyen ofrecen predicciones específicas.
MySQL HeatWave ML resuelve estos problemas integrando de forma nativa las capacidades de machine learning dentro de la base de datos MySQL, eliminando la necesidad de extraer, transformar y cargar (ETL) los datos a otro servicio.
HeatWave ML automatiza completamente el proceso de entrenamiento y crea un modelo con el mejor algoritmo, las características óptimas y los hiperparámetros óptimos para un conjunto de datos dado y una tarea especificada. Todos los modelos generados por HeatWave ML pueden proporcionar explicaciones sobre el modelo y la predicción.
MySQL HeatWave ML, la forma más fácil, rápida y económica para que los desarrolladores añadan potentes capacidades de aprendizaje automático a sus aplicaciones MySQL
Capacidades HeatWave ML
HeatWave ML ofrece las siguientes capacidades en comparación con otros servicios de bases de datos cloud:
- Fully Automated Model Training: todas las etapas de creación de un modelo con HeatWave ML están totalmente automatizadas y no requieren ninguna intervención de los desarrolladores. Esto da como resultado un modelo ajustado que es más preciso, no requiere trabajo manual y el proceso de entrenamiento siempre se completa.
- Model and Inference Explanations: la explicabilidad del modelo ayuda a los desarrolladores a entender el comportamiento de un modelo de aprendizaje automático. Por ejemplo, si un banco deniega un préstamo a un cliente, el banco necesita poder determinar qué parámetros del modelo se han tenido en cuenta, o si el modelo contiene algún sesgo.
- Hyper-Parameter Tuning: HeatWave ML implementa un nuevo algoritmo de reducción basado en la búsqueda de gradientes para el ajuste de hiperparámetros. Esto permite que la búsqueda de hiperparámetros se ejecute en paralelo sin comprometer la precisión del modelo. El ajuste de hiperparámetros es la etapa que más tiempo consume en el entrenamiento de modelos de ML, y esta capacidad única proporciona a HeatWave ML una ventaja de rendimiento significativa sobre otros servicios en la nube para construir modelos de aprendizaje automático.
- Algorithm Selection: HeatWave ML utiliza la noción de modelos proxy -que son modelos simples que muestran las propiedades de un modelo complejo completo- para determinar el mejor algoritmo de ML para el entrenamiento. Utilizando un modelo proxy simple, la selección del algoritmo se realiza de forma muy eficiente, sin pérdida de precisión.
- Intelligent Data Sampling: durante el entrenamiento del modelo, HeatWave ML muestrea un pequeño porcentaje de los datos para mejorar el rendimiento. Este muestreo se realiza de tal manera que todos los puntos de datos representativos se capturan en el conjunto de datos de la muestra.
- Feature Selection: la selección de características ayuda a determinar los atributos de los datos de entrenamiento que influyen en el comportamiento del modelo de aprendizaje automático para hacer predicciones.