En 2023, se proyecta que la inversión en Tecnologías de la Información en Europa alcance más de un billón de dólares, según un informe reciente de la firma Gartner. Este aumento representa un incremento del 5,5% en comparación con el año 2022. En particular, el gasto en centros de datos ha experimentado un crecimiento del 3,1%, superando los 46.000 millones de dólares.
Estos datos resaltan la continua importancia de la información en las decisiones empresariales y en la expansión de los negocios. En este contexto, la empresa española PUE, especializada en consultoría e implementación de proyectos de Datos y Aprendizaje Automático, ha identificado 5 claves que serán fundamentales para la gestión de datos en 2024. Estas claves buscan ayudar a las empresas a optimizar sus procesos de datos y aprovechar al máximo su potencial.
La implementación del aprendizaje automático
En el próximo año, las empresas continuarán adoptando rápidamente las últimas innovaciones en aprendizaje automático, centrándose especialmente en los grandes modelos de lenguaje (LLM). Estos modelos utilizan técnicas de aprendizaje automático para entender patrones complejos de lenguaje natural a partir de vastas cantidades de datos.
Aunque el procesamiento del lenguaje natural (PNL) seguirá siendo predominante en muchos casos de uso, las empresas intensificarán la integración de LLM, como el GPT de OpenAI y el BERT de Google. Esto resultará en mejoras en la calidad de la interacción con proveedores y clientes, automatización de tareas de procesamiento de lenguaje natural, desarrollo de prototipos y aplicaciones en este campo, así como avances en la extracción de información y la generación de contenido creativo.
Consolidación del lakehouse como vía de almacenamiento
Más empresas adoptarán arquitecturas data lakehouse en almacenamiento, fusionando las ventajas de datalakes y data warehouses. Y es que, aprovechan la flexibilidad cruda de datalakes y la capacidad analítica estructurada de los data warehouses, proporcionando un enfoque más completo y equilibrado para el análisis de datos.
Esta evolución mejorará la gobernanza del dato, ofreciendo eficiencia, reducción de tiempos y optimización de procesos. Todo ello, respaldada por nuevas funcionalidades avanzadas como Apache Iceberg.
Las empresas acelerarán la adopción de soluciones de aprendizaje automático y de grandes modelos de lenguaje
Creación de espacios de datos para compartir información entre entidades
La práctica de compartir información en espacios de datos entre entidades está ganando relevancia en las colaboraciones empresariales. Estos entornos virtuales permiten la consolidación de conjuntos de datos de diversas fuentes bajo reglas comunes, facilitando la colaboración entre compañías. Estos espacios mejoran la eficiencia, transparencia y colaboración en sectores como el retail, donde personalizan el «customer journey» con ofertas específicas basadas en datos de intereses y hábitos de compra.
En el sector sanitario, la compartición de datos del historial del paciente mejora el control y seguimiento del proceso de recuperación, así como acelera la investigación y desarrollo de fármacos y tratamientos al permitir la colaboración entre instituciones médicas, firmas farmacéuticas y laboratorios.
Diseño de data products específicos para el gobierno de datos
Las empresas también explorarán la creación de sus propios productos de datos para mejorar la gobernanza de la información y abordar las necesidades específicas de sus negocios. Estas herramientas van más allá del simple almacenamiento de datos, transformándolos en información útil que optimiza los procesos.
El desarrollo de data products implica la creación de nuevas plataformas que facilitan la gestión, acceso, calidad y análisis de datos dentro de la organización, generando así valor en la toma de decisiones estratégicas. Por ejemplo: paneles interactivos y dashboards para visualizar datos de manera más intuitiva, soluciones de pronóstico con modelos productivos para anticipar cambios en el mercado, sistemas de monitoreo y alerta para prevenir la falta de stock, y asistentes virtuales que integran servicios de atención al cliente.
La federación de datos como solución en entornos híbridos y multicloud
En cuanto a la integración, la federación de datos emerge como la tendencia principal para abordar el desafío de proporcionar acceso a datos distribuidos sin consolidarlos físicamente en un único repositorio central. Esta estrategia mantiene la autonomía de los datos en su origen, siendo una solución efectiva para empresas con procesos complejos en entornos híbridos y multicloud.
La federación de datos maximiza su utilidad sin la necesidad de trasladarlos físicamente, resultando en la reducción de costos, optimización de recursos y aceleración de procedimientos.