La importancia del Big Data y el Data Science

Los datos se han convertido en el punto más relevante para empresas y organizaciones. Sin el dato, la transformación digital sería imposible y son ellos los responsables de que una compañía pueda crecer en el futuro.

Factores como la mejora de las herramientas o la irrupción del cloud computing han posibilitado que gestionar los datos sea más sencillo que hace unos años y eso ha posibilitado que la toma de decisiones sea mucho más simple. En esta toma de decisiones entran en juego dos conceptos parecidos pero a la vez, diferentes: Data Science y Big Data.

Los primero que hay que decir es que sin Data Sience no existiría Big Data. Big Data sí podría existir, pero sería irrelevante si no fuera por la labor que hace el Data Science. Y es que, Data Science es la encargada de desarrollar la limpieza de los datos y el análisis de los mismos para acelerar y abordar la toma de desiciones. Es decir, se trata de extraer la información útil de los datos que se tienen para posibilitar la realización de predicciones que orienten a una compañía en su estrategia. Para ello emplea modelos inteligentes que aprenden de sí mismos, como el Machine Learning, junto con métodos estadísticos para entrenar a los ordenadores.

Y, ¿qué es el Big Data? Pues de forma sencilla: el conjunto de datos almacenados. Es algo que lleva haciéndose desde los inicios de las tecnologías de la información sólo que ahora, gracias por ejemplo a tecnologías como Cloud Computing, tenemos la posibilidad de almacenar grandes cantidades de datos, algo que no se podía hacer en los sistemas tradicionales. No sólo eso, sino que aunque hubiéramos tenido la posibilidad de almacenar semejante cantidad de información, las herramientas de software para procesar los datos con las que se trabajaba, eran incapaces de procesar y analizar tal cantidad.

Cada vez hay más datos. Los generamos sin apenas darnos cuenta cada vez que programamos una ruta en nuestro navegador, cada vez que se sube una foto a Instagram o, simplemente, en cada ocasión que mandamos un mensaje de Whatsapp a una persona. También generamos datos cada vez que buscamos algo en Internet o cuando compramos algo de forma online (y también offline si pagamos con un medio electrónico) o simplemente mientras vemos un marketplace online. También se están generando datos cuando ponemos nuestra huella dactilar en el lector de entrada a la oficina o cuando pasamos por un escáner facial en un aeropuerto.

Pero los datos no sólo los generamos nosotros. También los generan las máquinas: termómetros, sistemas de videovigilancia, máquinas expendedoras, semáforos, etc. están generando nuevos datos de forma constante.

Y llega la combinación perfecta

La combinación de Data Science y Big Data hace posible que podamos sacar el valor al dato. Para que esta combinación se produzca se pasan por cuatro fases. La primera de ellas, lógico, es la recopilación del dato, que como hemos dicho puede provenir de distintas fuentes. Ese dato hay que almacenarlo en algún lugar. Este es el segundo paso.

Y a partir de aquí hay que tratar los datos y ponerlos en valor para sacar beneficios de los mismos que nos ayuden en la toma de decisiones. Dependiendo del tipo de información que tengamos se puede hacer de forma muy sencilla o tendremos que emplear técnicas más avanzadas. Entre esas técnicas se encuentra el Machine Learning o Aprendizaje Automático, que basándose en estadísticas y en patrones repetitivos puede sacar conclusiones. Una vez que estos datos han sido tratados podemos emplearlos para realizar determinadas acciones. Por ejemplo, gracias a el tratamiento que se ha hecho, se puede saber cuándo se va a producir un atasco en una determinada carretera, por lo que se pueden lanzar mensajes para que los conductores cojan una ruta alternativa a una hora determinada. Otro ejemplo más, gracias a la combinación de Data Science y Big Data, Netflix sabe cuáles son tus gustos por lo que puede proponerte contenido que se adapte a tus preferencias o básandose en los lugares que sueles visitar, Google puede recomendarte un restaurante u otro cuando estés realizando una excursión turística.

Estos son sólo algunos de los ejemplos en lo que el Big Data y el Data Science juega un papel fundamental. Pero esta combinación también ha ayudado en la lucha contra la Covid-19. Sin ir más lejos, el Instituto de Investigación del Hospital La Paz de Madrid, gracias a la utilización del Big Data y de la Inteligencia Artificial ha desarrollado un algoritmo que permite predecir que sucederá con pacientes afectados por el coronavirus. Probado en 300 pacientes, en este caso, los datos extraídos son los genéticos de cada persona que ha superado la enfermedad. El algoritmo emplea esos datos  y arroja sus predicciones que abarcan desde la mejora del enfermo al fallecimiento del mismo. La tasa de acierto rondó el 97%. Gracias a este desarrollo, se puede ayudar a generar hipótesis para la reutilización de fármacos, identificar a las personas con un riesgo inusualmente alto o bajo y contribuir al conocimiento global de la biología de la infección y la enfermedad.

En definitiva, Big Data y Data Science son dos elementos fundamentales en no sólo en el desarrollo de las empresas y que pueden garantizar su subsistencia a largo plazo, sino que van a jugar un papel cada vez más relevantes en apartados como la sostenibilidad, la medicina o la demografía, entre otras muchas.

>