cientificos de datos, 5 problemas

Los datos parecen el nuevo filón. Casi desde que la tecnología comenzó a desarrollarse, eso de extraer el valor de los datos empezó a ser un elemento prioritario. Pero es desde hace unos años, cuando existe la tecnología adecuada, el momento en el que se puede extraer todo el valor de los mismos. Datos estructurados, no estructurados, información que nace en el Edge,… las fuentes de obtención nunca han sido tantas y tampoco lo es la cantidad de tecnologías a la que los departamentos TIC tienen acceso para poder recopilarlos todos, gestionarlos, y utilizarlos para muchas funciones.

Alejandro Expósito Esteban, Business Excellence, Digital and Innovation Director de Merck
Alejandro Expósito Esteban, Business Excellence, Digital and Innovation Director de Merck.

En este sentido, Alejandro Expósito Esteban, Business Excellence, Digital and Innovation Director de Merck afirma que “los datos son primordiales no solo en los procesos de digitalización sino en prácticamente todas las áreas de la compañía. No concibo una toma de decisiones que no esté apoyada en ellos. Mas allá de esto, en procesos complejos de digitalización y en la implantación de herramientas avanzadas como puede ser la IA son fundamentales, pero en mi opinión ninguna IA llegará más lejos que los datos que la alimentan”.

 

Pablo de la Puente Mora-Figueroa, CIO de Gestamp
Pablo de la Puente, CIO de Gestamp

También Pablo de la Puente Mora-Figueroa, CIO de Gestamp, cree que los datos van a adquirir más relevancia porque “los datos son el principal activo en la toma de decisiones de las Organizaciones y por tanto el eje central de los proyectos de transformación digital de las Compañías independientemente de su tamaño y área de negocio”

Luis Díez Porres, Jefe del Área de Estadísticas y Análisis de Datos en Gerencia de Informatica de la Seguridad Social
Luis Díez Porres, Jefe del Área de Estadísticas y Análisis de Datos en Gerencia de Informatica de la Seguridad Social

Está claro que todo lo que rodea al dato no se trata de una moda pasajera. Hablamos de una tendencia que es una verdadera necesidad tanto para empresas como para AA.PP. si quieren manejarse en un entorno cada vez más competitivo. En este sentido, Luis Díez Porres, Jefe del Área de Estadísticas y Análisis de Datos en Gerencia de Informatica de la Seguridad Social, cree que “la tendencia actual es que las organizaciones trabajen en torno al dato (data-driven, data-centric) y por ello, la importancia pasa paulatinamente de los procesos a los datos. Esta estrategia se traslada a todos los ámbitos de las organizaciones, de modo que, en el proceso de digitalización de servicios, el dato pasa a ser un factor clave (hace años hablábamos de los “procesos” y la moda eran los BPMs). En este escenario, las tecnologías están evolucionando y conceptos como las bases de datos NoSQL no hacen sino reforzar esta creencia”. Y como las tecnologías evolucionan la importancia que se va a dar al dato en los próximos años, también irá en aumento.

Carlos Bermúdez Pérez, Director de Gestión del Complejo Hospitalario Ntra. Sra. de Candelaria del Servicio Canario de la Salud.
Carlos Bermúdez Pérez, Director de Gestión del Complejo Hospitalario Ntra. Sra. de Candelaria del Servicio Canario de la Salud.

“Los datos van a marcar la diferencia. Ya la está marcando. No sólo debido a que el que tenga el dato estructurado y adecuadamente etiquetado va a controlar sus procesos, sino que va a poder predecir con precisión lo que va a pasar a través de los nuevos modelos basados en Inteligencia Artificial. El análisis y la predicción basado en el dato va a dejar de ser, también, una actividad que los humanos dejemos de realizar en poco tiempo. El dato no va a ser una moda pasajera, es lo que sostiene, dirige y vertebra las redes sociales, el comercio electrónico, la publicidad, el ocio que consumimos y hasta lo que votamos en unas elecciones”, afirma Carlos Bermúdez Pérez, Director de Gestión del Complejo Hospitalario Ntra. Sra. de Candelaria del Servicio Canario de la Salud.

IBM Storage Annual Summit

Gestionar los datos

Una de las claves a las que se enfrentan los departamentos de TI es la de encontrar la fórmula para gestionar la avalancha de datos a la que se enfrentan. Por eso contar con herramientas adecuadas es esencial y dentro de todas esas herramientas, empiezan a despuntar soluciones como la inteligencia artificial para ayudar en esa gestión. Tal y como asegura Carlos Bermúdez, “la IA va a ayudar a la generación de más datos, adecuadamente etiquetados con la información asociada a cualquier proceso. La Inteligencia Artificial será el generador de datos en la que el humano va a delegar la tarea de introducir la información en los sistema. En poco tiempo, un informe médico se generará automáticamente sin que el médico pulse una sola tecla de su ordenador”.

Francesc Muñoz, CIO de Cuatrecasas
Francesc Muñoz, CIO de Cuatrecasas

En la misma línea se sitúa el CIO de Cuatrecasas, Francesc Muñoz, que ya están empleando en algunas de sus tareas: “En nuestro caso, las principales herramientas, son aquellas vinculadas con la inteligencia artificial que facilitan tanto la extracción de esas entidades como, tras su entrenamiento, poder dar respuestas y acelerar numerosos procesos. Asimismo herramientas que facilite la “curación” de los datos para mejorar la calidad y homogeneidad de los mismos. Para finalizar, más allá de la calidad de los datos herramientas que ayuden a gestionar la seguridad y privacidad sobre todo de los datos personales. Hay que tener en cuenta que en Cuatrecasas no existe un gran volumen de datos transaccionales. No somos ni una utility, ni una entidad financiera, ni una empresa de retail, ni tampoco tenemos sistemas IoT. Nuestro mayor volumen de datos son datos no estructurados y se encuentran fundamentalmente en los documentos. Tanto los que realizamos para nuestros clientes (contratos de todo tipo, demandas, contestaciones, etc.) como los que recibimos (sentencias, jurisprudencia, escrituras, etc.). Ahí radica el primer foco, en extraer estos datos y entidades incrustados en los documentos (sobre qué versa dicho documento, que partes, qué leyes menciona, de qué sector económico es, etc.) y enriquecer así nuestro DataWarehouse”.

Enrique Salgado Becher, Senior Information Security Manager de Cabify
Enrique Salgado Becher, Global IT Manager de Cabify

Pero además de la inteligencia artificial hay otros elementos importantes en lo que se refiere a la gestión de los datos. Muchos responsables de tecnología creen que las personas son todavía más importantes. Así por ejemplo, para Enrique Salgado Becher, Global IT Manager de Cabify, “la principal herramienta no es software ni hardware, sino el factor humano. Empleados con el conocimiento necesario sobre el procesamiento de datos a gran escala. Herramientas y servidores de alta computación hay decenas y decenas, todos los softwares evolucionan rápidamente… y el nivel de capacidad de procesamiento de datos incrementa de manera exponencial, pero empleados con el conocimiento necesario para utilizar este software y este hardware es lo que escasea y tiene mayor valor”. Alejandro Expósito de Merck cree que sobre todo es importante “la concienciación, es decir, entender el valor de los mismos y apoyarse en ellos para tomar decisiones, y la segunda es el conocimiento, debemos aprender a extraer el conocimiento de esos datos. En cuanto a herramientas las dividiría en tres áreas; herramientas de almacenamiento, de representación del dato y de extracción de conocimiento, de forma que nos permitan explorar, analizar y comprender los mismos y por supuesto que todas ellas nos permitan garantizar la seguridad del dato. Dentro de una empresa otro de los hándicaps con los que nos encontramos es la estanqueidad del dato, a veces es difícil ser capaz de compartir datos entre departamentos, debemos buscar las herramientas y crear la política de gestión del dato que nos permita romper esos silos”.

IBM Storage Annual Summit

El almacenamiento

Finalmente, otro de los retos se encuentra en el almacenamiento de los datos. Y aquí, la nube ha venido para ayudar de tal forma que ya no es necesario meter más y más máquinas dentro de una compañía a medida que se incrementa el volumen de los datos. Por eso, Alejandro Expósito considera que “la nube es una de las soluciones que sin lugar a duda deberíamos incluir en nuestra estrategia de gestión del almacenamiento. Creo que el problema ya no es tanto el almacenamiento como distinguir que datos son los realmente útiles y que has de guardar, pero también tenemos un reto identificando los periodos de retención de dichos datos, tenemos que ser consciente que muchos de ellos cuando dejan de ser útiles o relevantes podemos destruirlos, establecer esos periodos de retención en las empresas ayudaría mucho en la gestión de los almacenamientos. Pienso, por tanto, que lo realmente importante es planificar una adecuada estrategia de gestión de almacenamiento de datos”. También Francesc Muñoz de Cuatrecasas cree que la nube es una solución al problema del almacenamiento. En su opinión, “la nube es una solución al problema del almacenamiento, pero hay que gestionar dos ámbitos muy importantes: por un lado la seguridad y privacidad y por otro, la velocidad de acceso e integración con nuestros sistemas”.

Y es que, una de las ventajas es el coste de las soluciones en cloud. Un ejemplo es el que pone Enrique Salgado de Cabify: “En algunas plataformas que utilizamos el coste del almacenamiento es 0, y sólo pagamos por el procesamiento y no por el almacenamiento. Evidentemente a mayor cantidad de datos, mayor suele ser el coste en la mayoría de las plataformas, pero la habilidad de poder provisionar mas espacio de manera inmediata a unos costes razonables hace que para nosotros el almacenamiento sea un tema puramente operativo pero nunca un problema”.

Pablo de la Puente Mora-Figueroa, CIO de Gestamp
Pablo de la Puente Mora-Figueroa, CIO de Gestamp.

En la misma línea se sitúa Pablo de la Puente Mora-Figueroa, CIO de Gestamp, que además señala que no sólo el almacenamiento en cloud ha reducido los precios: “El almacenamiento de datos ha ido abaratándose tanto en soluciones on-premise como en cloud lo cual ha acelerado mucho la posibilidad de la que soluciones aumenten el volumen de datos que manejan. Desde Gestamp consideramos que la nube es una palanca más para acelerar los procesos de digitalización y que las soluciones TI tienen que ir hacia modelos híbridos y multicloud”.

Finalmente, con todos estos hechos parece que el almacenamiento ya no es un problema. Tal y como expone Carlos Bermúdez Pérez, Director de Gestión del Complejo Hospitalario Ntra. Sra. de Candelaria del Servicio Canario de la Salud, “no creo que el almacenamiento sea un problema en la actualidad. Vamos a necesitar muchísimo almacenamiento para la cantidad inimaginable de información que estamos generando y que vamos a generar en los próximos años. Tendremos aún más generadores de datos automáticos de todos los procesos y de todos los elementos de interés. Los grandes fabricantes, a la vanguardia del almacenamiento, saben que tienen que aumentar casi que exponencialmente año a año sus capacidades, garantizando la disponibilidad y manteniendo la inmediatez del acceso. Todo será nube y distribuido, no me cabe duda. La tendencia de todos los sistema es que se pagará por el uso, en el campo de la medicina, por ejemplo, los dispositivos médicos se basarán en una conexión a internet para hacer el diagnóstico en remoto y el almacenaje de los resultados y el almacenamiento local, será un almacenamiento temporal para garantizar el envío”.

Storage Annual Summit

En definitiva, los datos son los auténticos protagonistas de la transformación digital. Extraer su verdadero valor para tomar las decisiones adecuadas es una de las claves que llevará a una organización al éxito o al fracaso. Para poder obtener un aprovechamiento total del mismo es importante contar con las soluciones adecuadas. Por ello el próximo 25 de noviembre se celebrará el Storage Annual Summit en el que conocer las tendencias actuales que rodean al dato. Además, en el encuentro, uno de los protagonistas de este reportaje, Carlos Bermúdez, contará como en el Hospital Universitario Ntra. Sra. de Candelaria, cómo están abordando sus actuales retos en torno al dato.

Puedes inscribirte en el Storage Annual Summit PULSANDO AQUÍ

IBM Storage Annual Summit