La tendencia dicta que el volumen de información vaya a más, triplicándose en 2025. Capitalizar todo su potencial exige contar con recursos como data lakes: repositorios centralizados y escalables diseñados para almacenar, procesar, analizar y proteger grandes cantidades de datos.
En relación a ello, Cloudera ha anunciado que Apache Iceberg está disponible en su plataforma Cloudera Data Platform (CDP) como parte de su estrategia en pro del open source.
“Los clientes exigen cada vez más desde el principio. Un data lakehouse abierto aborda los problemas de interoperabilidad y de arquitectura en su core. Innovar consiste en resolver los problemas con las mejores herramientas, sin importar el proveedor, explica Juan Carlos Sánchez de La Fuente, Regional Director España y Portugal de Cloudera.
Cloudera Data Platform, data lakes
Concebido como un proyecto de Netflix y después donado a la Fundación Apache Software en 2018, Apache Iceberg es la primera plataforma híbrida que ofrece data lakehouse abiertos.
Puesto que, CDP permite realizar análisis multifunción a escala de petabytes, tanto en flujos de datos en streaming como en datos almacenados en un almacén cloud nativo, ya sea en múltiples nubes como on-premise.
Cloudera fortalece su plataforma de datos híbrida con open data lakehouse
El despliegue de Apache Iceberg en CDP incluye:
- Cloudera Data Warehousing
- Cloudera Data Engineering
- Cloudera Machine Learning
Además, la velocidad y la precisión de Apache Iceberg en CDP permiten a las organizaciones combinar almacenes de datos a gran escala con datos procedentes del IoT en tiempo real, así como aplicar ML e IA.