Comunidad de Byte TI

Únete a la Comunidad de Directivos de Tecnología, Ciberseguridad e Innovación Byte TI

Encontrarás un espacio diseñado para líderes como tú.

Datos eficiencia Denodo

Cuatro indicadores con los que medir la eficiencia real de los datos y sus costes 

Muchas empresas realizan inversiones importantes en plataformas de datos modernas. Sin embargo, aún existe una pregunta clave: ¿son realmente eficientes estas arquitecturas de datos? Y, sobre todo, ¿cómo puede medirse esa eficiencia en entornos basados en datos? Sin indicadores claros de rendimiento, las organizaciones suelen basarse en estimaciones aproximadas o en expectativas que no siempre se cumplen en el uso real de los datos

Ante esta cuestión, la compañía Denodo propone un marco de medición basado en cuatro indicadores clave que permiten evaluar si una arquitectura de datos contribuye a generar ingresos a partir de los datos o si, por el contrario, genera costes sin que resulte evidente. 

Indicador 1: Tiempo hasta obtener información útil (Time to Insight) 

El primer indicador que Denodo propone para evaluar la eficiencia de una arquitectura de datos mide cuánto tiempo transcurre desde que se generan los datos en bruto hasta que esos datos se transforman en información útil para las operaciones diarias, los análisis estratégicos o las aplicaciones de inteligencia artificial basadas en datos. 

Cuando ese proceso se alarga, suele ser señal de que los datos están almacenados en silos o de que la arquitectura de datos está fragmentada. En estos casos, es necesario replicar datos a gran escala, intervenir manualmente en los procesos de datos o añadir capas de integración de datos complejas. Las consecuencias van más allá del ámbito técnico: cuando la información derivada de los datos tarda en llegar, las decisiones se retrasan y las empresas pierden competitividad. 

Para medirlo, es recomendable calcular cuánto tarda en estar disponible la información útil basada en datos para el usuario final desde que se solicita. Este “tiempo de entrega” de datos puede analizarse en dashboards, modelos analíticos y aplicaciones de inteligencia artificial, lo que permite detectar mejoras en los procesos de datos y comparar resultados con otras herramientas o durante las pruebas de nuevas plataformas de datos. 

Indicador 2: Productividad en ingeniería de datos 

El segundo KPI definido por Denodo se centra en uno de los aspectos que más influyen en el coste total de las plataformas de datos: la productividad de los equipos de ingeniería de datos. Cuando es habitual intervenir manualmente en los procesos de datos o reajustarlos, suele deberse a estructuras de datos fragmentadas, pipelines de datos duplicados o a una baja reutilización de los productos de datos existentes. 

Esta fragmentación no gestionada de datos tiene también consecuencias negativas en aspectos fundamentales como el control de accesos a los datos y la privacidad del dato. Elementos que es obligatorio tener en cuenta para poder poner en producción los productos de datos que se estén desarrollando. 

Este indicador puede medirse a partir de las horas de ingeniería necesarias para integrar nuevas fuentes de datos o desarrollar nuevos productos de datos. También conviene analizar la relación entre el trabajo de mantenimiento de datos y el trabajo de desarrollo que aporta valor a partir de los datos. 

Indicador 3: Rentabilidad de la infraestructura 

La replicación ineficiente de datos, las pérdidas de eficiencia en el procesamiento de datos que consumen tiempo, los recursos de computación sobredimensionados o los ecosistemas de herramientas de datos redundantes pueden generar gastos innecesarios. Por ello, el tercer KPI analiza el retorno real de la infraestructura de datos. 

Para medir este indicador, Denodo recomienda analizar y calcular el coste total de propiedad (TCO), incluyendo todos los costes relevantes asociados a los datos, como la capacidad de computación, almacenamiento de datos, integraciones de datos, gestión de herramientas y otros factores relacionados con el ecosistema de datos. Además, evaluar métricas como el coste por consulta, por caso de uso o por usuario activo en entornos de datos permite obtener una visión más clara de la eficiencia y la escalabilidad. 

Indicador 4: Agilidad y capacidad de adaptación 

El cuarto indicador identificado por Denodo mide la capacidad de una organización para adaptarse rápidamente a nuevos requisitos de negocio, cambios del mercado o exigencias regulatorias relacionadas con los datos. 

En el entorno digital, esta capacidad depende en gran medida de la agilidad de las infraestructuras de datos, e implica la posibilidad de reutilizar productos de datos en distintos análisis de datos, aplicaciones de inteligencia artificial o iniciativas de negocio. Cuando los tiempos de despliegue de nuevos proyectos de datos son demasiado largos, suele tratarse de una señal de estructuras rígidas en la gestión de datos. 

Un aspecto importante para poder reutilizar eficientemente productos de datos es que, tanto los metadatos utilizados como “materia prima” como los propios productos de datos, constituyan una capa semántica de datos que pueda ser entendible por los diferentes roles que intervienen en el ciclo de vida del producto de datos, incluidos, por supuesto, los consumidores de los datos. 

Este indicador puede medirse evaluando el tiempo que tarda una empresa en poner en marcha nuevos proyectos basados en datos, desde la fase de concepto hasta su entrada en producción. También puede analizarse cuántos casos de uso reutilizan productos de datos compartidos y cuántos requieren desarrollos independientes de datos. 

“Medir todos estos indicadores clave es fundamental, pero el verdadero valor aparece cuando las organizaciones pueden optimizarlos. En muchos casos, el problema no es la falta de datos, sino la complejidad de las arquitecturas de datos que dificultan acceder a ellos con agilidad”, afirma Bernardo Godar, director general para Iberia & Latam en Denodo. “Para ello, la gestión lógica de datos adquiere un papel importante al introducir una capa semántica virtual entre las fuentes de datos y quienes los utilizan, lo que permite acceder a la información sin depender directamente de dónde se almacenan los datos”.

Deja un comentario

Scroll al inicio