Comunidad de CIOs Revista Byte TI | Noticias tecnología

Únete a la Comunidad de Directivos de Tecnología, Ciberseguridad e Innovación Byte TI

Encontrarás un espacio diseñado para líderes como tú, donde podrás explorar tecnologías emergentes, compartir estrategias y colaborar en soluciones de vanguardia

análisis de datos con IA

Los retos de administrar y gestionar los datos

Administrar y gestionar los datos se ha convertido en un elemento crítico para las empresas en la era digital en la que nos encontramos. Los datos son considerados como el nuevo petróleo, ya que contienen información valiosa que puede impulsar la toma de decisiones estratégicas, mejorar la eficiencia operativa y ofrecer ventajas competitivas.

En este contexto, los responsables de TI se enfrentan a un doble reto. Y es que, por un lado están construyendo y dando soporte a entornos híbridos cada vez más complejos, a la vez que el volumen y la sofisticación de los ciberataques va en aumento.

Mientras que por otro, los enfoques de copia de seguridad tradicionales no tienen en cuenta las cargas de trabajo modernas -desde IaaS y SaaS hasta contenedores-, lo que puede dar lugar a una recuperación poco fiable, lenta o inadecuada para la empresa cuando más se necesita.

Sobre esto, Víctor Pérez de Mingo, Senior System Engineer en Veeam Software matiza que lo que está claro es que una recuperación rápida y fiable a partir de copias de seguridad seguras e inmutables, “ofrece la mejor línea de defensa para las organizaciones. Los responsables de TI deben modernizar la protección de sus datos al mismo tiempo que modernizan sus entornos de producción”.

Retos en la gestión del dato

La gestión efectiva de los datos no está exenta de desafíos. Uno de los retos más importantes es la enorme cantidad de datos generados y recopilados por las organizaciones en la actualidad. Y es que, con la rápida digitalización, la llegada de tecnologías como el IoT y las redes sociales, se ha producido una explosión de datos que en muchas ocasiones, pone de manifiesto la falta de recursos de muchas organizaciones.

Para Carmen Derlinchan, Senior Systems Engineering Director Pure Storage Iberia una estrategia efectiva de gestión de datos debe basarse en el reconocimiento de que distintos tipos de datos tienen diferentes necesidades de acceso, almacenamiento y gestión, “el principal desafío al que se enfrentan las organizaciones es la explosión de datos no estructurados. Según Gartner, los datos no estructurados han alcanzado una tasa de crecimiento del 30% anual. Ante este panorama, encontrar soluciones óptimas y sostenibles para gestionar y almacenar datos es una prioridad urgente para las empresas españolas. También es necesario tener en cuenta la forma en que las empresas españolas consumen almacenamiento. En este contexto, el Almacenamiento como Servicio (STaaS) es la mejor opción, ya que proporciona la flexibilidad y elasticidad para responder a las cambiantes necesidades empresariales sin una gran inversión inicial.

Por otro lado, los contenedores serán clave para los diseños de infraestructura neutral en la nube, superando el bloqueo. Pues, en un futuro cercano, veremos un aumento en las empresas que incorporan la neutralidad en la nube en su diseño para evitar este bloqueo”

En palabras de Tomás Saiz, Business Development Manager para España y Portugal de Synology lo esencial es definir una buena estrategia, y saber responder a la pregunta de: ¿Que datos necesito y que necesito de los datos?, “esta es la etapa más relevante y puede ser interesante buscar ayuda externa para terminar en un dialogo interno debe ser una dialogo y formal entre las distintas áreas de la empresa, donde IT hacer propuestas, pero el resto de las áreas deben estar implicados con sus propias propuestas y planteamiento de requerimientos. Durante esta decisión hay que Evaluar los activos y su origen: Infra IT, BBDD, CRM, Equipos producción, datos estructurados/No estructurados,en este caso disponer de CMDB puede ser una herramienta de gran utilidad. Por último Completar los entornos productivos; actuales, futuros, y presupuesto: Esta fase puede ser la fase más sencilla una vez que se han trabajado las anteriores”.

Los contenedores serán clave para los diseños de infraestructura neutral en la nube

Siguiendo esta línea, José Luis Martínez, Enterprise Account Manager de Cloudera incide en los entornos bridos y multicloud dentro del nuevo estándar, siendo uno de los mayores retos para las empresas, gestionar eficazmente las cargas de trabajo que operan en la nube, “y es que con los datos empresariales almacenados tanto en on-premise como en múltiples nubes públicas, se hace difícil vigilar y gestionar el consumo de la nube a través de varios departamentos y centros de coste, mantener la plataforma estable y controlada y solucionar problemas a través de estas diferentes infraestructuras”.

Almacenamiento en la nube

El almacenamiento en la nube ha revolucionado la forma en que las empresas gestionan sus datos. En lugar de depender de servidores físicos locales, el almacenamiento cloud ofrece a las organizaciones capacidad ilimitada, flexibilidad, accesibilidad, seguridad avanzada, copias de seguridad automatizadas y escalabilidad. Ventajas que permiten optimizar la gestión de los datos, liberando recursos y brindando una mayor eficiencia operativa en un entorno empresarial cada vez más digitalizado.

El año pasado, Gartner publicó «A Strategic Roadmap for Migrating Data Management to the Cloud”, donde afirmaba que el futuro ecosistema de datos debe aprovechar los componentes de gestión de datos distribuidos, que puedan ejecutarse en múltiples nubes y / o en on-premise, pero deben tratarse como un todo cohesivo con un alto grado de automatización.

En base a esto, José Luis Martínez añade las siguientes razones por las cuales, las compañías en España deciden dar el paso a la nube:

  • El 53% considera que esta migración al cloud mejora la accesibilidad de los datos

  • Un 46% señala que facilita la optimización del almacenamiento

  • Un 37% que aumenta la escalabilidad

Por el contrario, como desventajas, hubo cierta unanimidad, ya que el 72% de las organizaciones considera una barrera los problemas asociados a la ciberseguridad ajenos a la normativa y un 71% afirma que el principal motivo para no migrar al cloud es su preocupación por el gobierno del dato. Y la Administración Pública tampoco se queda atrás. Otro estudio que hemos publicado junto a PUE y Administraciones TIC, revela que estos organismos destacan como beneficios la eficiencia y la reducción de los costes de infraestructura (58,7%), la disminución de los costes operativos (54%) y la calidad del servicio (54%) son las ventajas más destacadas. El 24% cuenta ya con un modelo de cloud híbrida para gestionar sus datos”, concluyen desde Cloudera.

Pero entonces, ¿cómo pueden las empresas obtener los mayores beneficios de la nube?, Desde Nutanix han presentado nuevas funcionalidades adicionales para Nutanix Cloud Platform que permiten a los clientes integrar la gestión de datos de aplicaciones tanto en las propias instalaciones on-premise, como en la nube pública o en el edge”.

Nutanix Data Services para Kubernetes (NDK) ayudará a acelerar el desarrollo de aplicaciones en contenedores introduciendo las operaciones de aprovisionamiento del almacenamiento. En este sentido, otra de las grandes novedades es Multicloud Snapshot Technology (MST), diseñado para ofrecer una mayor movilidad de datos entre nubes. MST ayudará a muchos clientes a gestionar los costes de su infraestructura primaria permitiéndoles almacenar fácilmente instantáneas (snapshots) en un medio de almacenamiento menos costoso, y recuperarlas con la misma facilidad a través de cualquier infraestructura, nube privada o pública. La principal ventaja de ambas soluciones es la flexibilidad máxima y el ahorro de tiempo en la gestión del dato”, comenta Alejandro Solana, director técnico de Nutanix Iberia.

Seguridad para los datos empresariales

Según el estudio ‘El Estado de la Ciberseguridad en España’ de la consultora Deloitte, el 94% de las empresas españolas sufrió al menos un incidente grave de ciberseguridad en 2021. Si aceptamos que es casi imposible mantener alejados a los atacantes decididos a entrar en los sistemas, la clave para resistir un ataque de ransomware reside en la capacidad de restaurar esos sistemas a un punto en el tiempo anterior al inicio del ataque, y hacerlo rápidamente.

Por lo tanto, Carmen Derlinchan señala que las organizaciones necesitan una estrategia doble: instantáneas avanzadas e inmutables de sus datos y la capacidad de restaurar los sistemas rápidamente y a escala, “las instantáneas inmutables están protegidas porque no pueden borrarse, modificarse ni cifrarse, aunque un atacante acceda a los datos sensibles. Las copias de seguridad tradicionales en cinta o disco pueden restaurar aproximadamente de uno a dos terabytes por hora. Esto no es suficiente para la mayoría de las organizaciones, ya que puede significar horas o días de inactividad que podrían causar pérdidas financieras y de reputación. Afortunadamente, algunas soluciones basadas en flash pueden ofrecer velocidades de hasta 270 TB por hora y son necesarias para poner en marcha una organización con el mínimo impacto negativo. Esto es exactamente lo que ofrece Pure Storage con SafeMode Snapshots, una solución de protección de datos integrada con FlashArray y FlashBlade”.

Las organizaciones también deben tener en cuenta la regla 3-2-1-1-0 según Víctor Pérez de Mingo, es decir, “tener al menos 3 copias de los datos; 2 soportes diferentes para estas copias; 1 de ellas en una ubicación remota; al menos 1 de estas copias debe estar en un repositorio inmutable u offline; y con cero fallos en la recuperación.  Proteger y gestionar los datos corporativos es crucial para cumplir la normativa de seguridad. Sus datos son su activo más valioso, por lo que es mejor protegerlos con una solución de backup segura. En este sentido, Veeam permite implementar estrategias transparentes, prácticas y fiables para proteger sus datos de modificaciones o eliminaciones no deseadas con opciones de backup seguras y verificables. Además, es necesario a su vez crear conciencia sobre estos problemas entre el personal mediante formación periódica sobre higiene digital y ciberseguridad”.

Tomás Saiz destaca las estrategias Zero Trust, “la seguridad perimetral sigue siendo la base, coordinada, tanto para en entorno on-prem como en la nube, e incluida esta seguridad desde el desarrollo DevOps. Actualmente, muchos de los eventos de una empresa, empiezan y terminan fuera de su zona de control y estrategias como Zero Trust o soluciones CASBI, Clean Pipes,.y todo lo que afecte a comunicaciones debe estar en compartido también con los equipos de seguridad. En esta estrategia Zero Trust, es fundamental la gestión de usuarios y gestión de calves y accesos. Muchas de las fugas de seguridad, ocurren en el interior de la empresa y con origen en los propios usuarios, ya sea de forma consciente o inconsciente”.

Integridad de los datos en una organización

Las organizaciones empresariales se centran más que nunca en proteger y asegurar sus datos en entornos informáticos cada vez más complejos. Para el Senior System Engineer de Veeam Software, estas empresas se centran en tres factores clave:

  • Conocer los datos: El primer paso para resolver cualquier problema es saber a qué nos enfrentamos.  Antes de proteger nada, hay que saber quién almacena qué y dónde. ¿Utiliza todo el mundo en la empresa las mismas cuentas? Para asegurarse de que esto se hace correctamente, los equipos de TI a menudo tienen que emprender una «investigación» en toda la empresa. En general, la cantidad de datos almacenados por la mayoría de las organizaciones, ya sean migrados desde las instalaciones locales o almacenados originalmente en la nube, es enorme. Para saber qué datos son críticos y sensibles, tendremos que clasificarlos. Los motores automatizados de clasificación de datos pueden ayudarnos a ordenarlos y organizarlos, de este modo no tenemos que protegerlo todo a ciegas. Una vez que sepamos exactamente qué tenemos almacenado en la nube (y dónde), sólo entonces podremos empezar a estudiar cómo proteger esos datos.

  • Conocer sus responsabilidades: Un problema común que surge es que las empresas a menudo no saben exactamente de qué son responsables cuando se trata de seguridad y protección de datos en la nube. Aunque depende del proveedor de la nube, normalmente el proveedor es responsable de la seguridad de la infraestructura y de las instalaciones físicas que la alojan. La seguridad de las aplicaciones, los datos y el acceso al entorno, sin embargo, es responsabilidad del cliente. En la práctica, esto significa que las empresas deben asegurarse de que todos los datos críticos y sensibles almacenados en la nube tengan copias de seguridad en caso de brechas o interrupciones. La mejor práctica es tener varias copias de seguridad en distintas ubicaciones (por ejemplo, una en las instalaciones y otra en la nube) y tener copias de los datos en distintos soportes, con al menos una copia fuera de las instalaciones, desconectada e inmutable; y si es posible, aún mejor, las tres al mismo tiempo.

  • Proteger la rentabilidad: Garantizar un proceso adecuado del ciclo de vida de los datos es clave. Sin él, el buen trabajo realizado inicialmente se volverá ineficaz y costoso con el tiempo, y la empresa pagará por almacenar y proteger los datos equivocados de la forma equivocada. Los datos deben estar en una plataforma de almacenamiento adecuada en la nube, y esto cambiará a lo largo de su ciclo de vida.

Como bien sabemos, los datos poseen un valor trascendental, por lo que es crucial anticipar un aumento en la demanda de acceso a estos datos con el fin de tomar decisiones informadas. En este sentido, el Enterprise Account Manager de Cloudera explica que los entornos de nube híbrida desempeñan un papel esencial al permitir a las empresas ejercer control sobre el acceso a estos activos. “Al mismo tiempo, facilitan a los usuarios la integración de principios fundamentales de gobernanza y seguridad de datos en su estrategia de datos. Asimismo, con independencia de que los datos estén en la nube pública, en la privada u on-premise, según avanzan las iniciativas de IA y cambian las normativas, la estrategia de despliegue debe actualizarse de forma proactiva para mantenerse al día con las nuevas demandas y oportunidades de valor. Este aspecto es fundamental para asegurar, de nuevo, la calidad de los datos en una organización”.

Coincidiendo con su compañero, el director técnico de Nutanix Iberia reafirma el modelo multicloud, como una de las mejores prácticas a tener en cuenta, para asegurar la calidad y la integridad de los datos dentro de una organización.

Administrar y gestionar los datos se ha convertido en un elemento crítico para las empresas en la era digital en la que nos encontramos

Nuestra aproximación es proporcionar una plataforma homogénea y estándar, con la misma experiencia independientemente de la ubicación de los datos, las aplicaciones y las operaciones. En la práctica, los clientes pueden habilitar o deshabilitar fácilmente las cargas de trabajo en función de sus necesidades sin importar el lugar en el que se encuentren, ya sea nube pública o privada. Todo ello bajo los mismos cuadros de mandos, de forma automatizada e integrada”, concluye.

Rendimiento, eficiencia y competitividad

En la actualidad, ser una organización basada en datos implica un enfoque mucho más amplio y avanzado en comparación con hace unos años. No se trata de aprovechar el análisis de algunos datos para respaldar las decisiones, sino de aprovechar al máximo todos los datos disponibles para impulsar la toma de decisiones en todos los niveles de la organización para impactar en toda su estructura.

Esto implica, en palabras de José Luis Martínez, tener la capacidad de utilizar cada bit de datos disponible, ya sea estructurado o no estructurado, incluyendo datos almacenados en diferentes formatos, como bases de datos tradicionales, hojas de cálculo, documentos de texto, imágenes, videos, archivos de audio, datos generados por sensores, datos de redes sociales y más.

Asimismo, “las organizaciones pueden utilizar datos en movimiento y en reposo para tomar mejores decisiones. Los datos en movimiento se refieren a aquellos que se generan y transmiten en tiempo real, como datos de transacciones, feeds de sensores o datos de redes sociales. Por otro lado, los datos en reposo son aquellos que se almacenan y no están en constante cambio. La capacidad de procesar y analizar datos en movimiento y en reposo permite a las compañías obtener información valiosa en tiempo real y también realizar análisis retrospectivos para identificar patrones y tendencias históricas para implementar mejoras de manera constante”.

Y lo que es más importante, desde Puré Storage añaden que esto se traduce en un mejor conocimiento de los clientes, “lo que permite ofrecer productos o servicios personalizados para satisfacer necesidades específicas. Una experiencia personalizada aumenta la satisfacción del cliente y, por tanto, la competitividad de la empresa en el mercado. Del mismo modo, el análisis de datos puede funcionar como herramienta de previsión, identificando tendencias emergentes en el mercado y anticipándose a las demandas cambiantes de los clientes y descubriendo nuevas oportunidades para ser pioneros”, comenta Carmen Derlinchan.

Nuevas tendencias

Como parte de la transformación digital que viven hoy las empresas, la sostenibilidad y la IA son dos de las tendencias clave que se observan en cuanto a la gestión, almacenamiento y análisis de datos en el ámbito empresarial .

Hoy en día, las empresas están mucho más concienciadas con el medio ambiente, pero la volatilidad de los costes energéticos ha forzado la situación. Dado que el aumento de los costes energéticos tiene un enorme impacto en los resultados de una organización, las tecnologías sostenibles que consumen menos energía estarán en la agenda de todas las empresas.

En cuanto a la IA, Carmen Derlinchan señala que esta tecnología es relevante para la industria del almacenamiento porque ayuda a optimizar el uso de los recursos analizando los patrones de acceso, identificando los datos redundantes o no utilizados y sugiriendo acciones para mejorar la eficiencia en la gestión de datos. “Una de las aplicaciones más relevantes de la IA es su uso en medicina. Por ejemplo, unos científicos anunciaron que habían desarrollado un nuevo antibiótico analizando datos mediante IA. Se utilizó un algoritmo para analizar más de 100 millones de compuestos químicos en cuestión de días. El antibiótico recién descubierto puede destruir más de treinta tipos de bacterias, y ha sido reconocido por la comunidad médica como un paso importante en la lucha contra la resistencia a los medicamentos. Aunque no es imposible que este descubrimiento se hubiera producido sin la IA, sin duda aceleró el proceso” afirma.

José Luis Martínez opta por la irrupción de las arquitecturas modernas de datos como data fabric, data mesh o data warehouse, en cuanto a lasa nuevas tendencias. Y es que, una arquitectura data fabric permite unificar todas estas fuentes de datos y aplicaciones dispares de forma segura y automatizada, sin cambiar dónde o cómo se almacenan los datos. “Esta arquitectura conectada facilita, acelera y hace más seguro el despliegue de aplicaciones y automatización basadas en datos y facilita más información basada en datos a los usuarios empresariales en forma de autoservicio”.

Otras compañías han establecido una arquitectura de datos relacionada por proyectos y en muchas ocasiones lo más probable es que las herramientas y técnicas utilizadas para implantar la solución concreta fueran establecidas por un pequeño equipo con un objetivo limitado. Con el tiempo, este enfoque complica el diseño, deteriora la propiedad y crea reglas engorrosas en toda la organización para el acceso y la influencia sobre los datos, “Data Mesh trata de abordar estos problemas estructuralmente, más que tecnológicamente. Establece los datos como un producto fundamental, en lugar de un proyecto. Y, por último, como su nombre indica, un data lakehouse es la iteración más reciente de almacenamiento de datos que mezcla los conceptos de data lake y data warehourse, creados ambos para hacer frente a las limitaciones de las bases de datos singulares. En Cloudera estamos facilitando a las organizaciones la implementación de este tipo de arquitecturas modernas de datos y mover de forma más eficiente los datos, metadatos, cargas de trabajo y aplicaciones de datos a través de distintas nubes y de infraestructuras on-premise para optimizar el rendimiento, coste y la seguridad de las compañías”, finaliza.

Al igual que sus compañeros, Javier Gallego, Sales Director Data Center Compute Solutions de Dell Technologies, destaca la inteligencia artificial y el aprendizaje automático, a lo que añade el uso de soluciones de almacenamiento en la nube, “para mayor escalabilidad y accesibilidad, el enfoque en la privacidad y protección de datos con el cumplimiento de regulaciones como el GDPR, y la integración de análisis en tiempo real para la toma de decisiones ágil y basada en datos”.

Big Data e Inteligencia Artificial

Las tecnologías emergentes están aprovechando el potencial de los datos almacenados para proporcionar información relevante y valiosa que puede utilizarse en la toma de decisiones estratégicas. Herramientas como ChatGPT han suscitado una gran concienciación y han alimentado el debate sobre la IA y sus posibles ventajas para las empresas.

Los grandes modelos lingüísticos están aumentando el acceso de todo el mundo a los datos, pero plantean muchos problemas de confianza, conformidad de los datos y propiedad intelectual. Ahora más que nunca, las empresas necesitan soluciones de IA en las que puedan confiar.

Pero, ¿cómo tiene que ser esta confianza?, Para José Luis Martínez, la confianza en la IA empieza por la confianza en los datos, “ya que los grandes modelos lingüísticos son tan buenos como los datos con los que se han entrenado. Para ayudar aún más a sacar todo el valor posible de los datos y utilizar la IA en el entorno empresarial de manera segura y responsable, desde Cloudera hemos presentado el Chatbot LLM. Se trata del primer modelo que permite a las empresas construir su propia aplicación de IA eligiendo el LLM de código abierto que prefieran para utilizar sus datos, todo alojado internamente en la empresa. Esto beneficia no solo a los científicos de datos y expertos en Machine Learning, sino también a todos los desarrolladores y unidades de negocio, democratizando verdaderamente la IA”.

Por su parte, y desde la perspectiva de la protección de datos y la recuperación frente al ransomware, Víctor Pérez de Mingo dice que independientemente de cuál sea la próxima gran novedad tecnológica, los fundamentos no cambian. “Si se considera que la tecnología emergente añade valor y eficiencia a la empresa, la creación de resistencia, seguridad y capacidad de recuperación para garantizar su disponibilidad debe formar parte del alcance del proyecto desde el principio.  Y esto debe integrarse en la estrategia más amplia de protección de datos”, concluye.

Deja un comentario

Scroll al inicio