La aplicación del Machine Learning en el ámbito de la sostenibilidad, más concretamente en el desarrollo de predicciones en la ecología, está viviendo su momento de esplendor, y la Estación Biológica del Parque de Doñana está muy ligada a ello.
Gracias a un grupo de investigadores españoles y al desarrollo de un modelo basado en esta tecnología, ya se puede predecir cómo van a evolucionar las poblaciones herbáceas de un determinado terreno, utilizando datos climatológicos y de propiedades del suelo, con el objetivo de estimar los efectos directos del cambio climático en los distintos escenarios de reducción de emisiones de gases de efecto invernadero.
“La digitalización está ayudando de forma directa al avance científico y a la conservación del medioambiente. Hace décadas todos los registros de temperatura o precipitación se hacían a mano en unas pocas ubicaciones, hoy en día, y gracias a tecnologías como el Machine Learning, podemos monitorizar continuamente esas magnitudes en millones de puntos. Cuanto mayor sea la calidad de los datos, mejor funcionarán los modelos que podemos construir con ellos”, explica Javier García Algarra, director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad.
Machine Learning en el Parque de Doñana
Las plantas herbáceas son imprescindibles para mantener la biodiversidad de un entorno tan variado como el Parque Nacional de Doñana. Proporcionan sustento y abrigo a multitud de animales que pasan parte del año en las marismas y sirven para fijar el suelo en una zona sujeta a inundaciones periódicas.
Las distintas especies herbáceas compiten entre sí por los nutrientes disueltos en un entorno muy salino, y la abundancia de una de ellas puede resultar perjudicial para otras, aunque en ocasiones también puede ser beneficiosa. La desaparición de una especie, como consecuencia del cambio climático, podría desencadenar un fenómeno que se conoce como ‘extinción en cascada’, de ahí que sea muy importante predecir si la alteración de las condiciones climáticas puede variar de manera significativa las especies presentes (fauna y flora) en la marisma.
El machine learning permite la monitorización de más de veinte especies de plantas de ambiente hipersalino en el Noreste del Parque de Doñana
Es aquí donde entra el Machine Learning, cómo bien explica Javier García Algarra: “La esencia del Machine Learning consiste en construir una función matemática basada en datos disponibles hasta la fecha y poder hacer con ella predicciones. El estudio de las consecuencias del cambio climático es una aplicación natural de estas técnicas y puede ser una herramienta de gran ayuda”.
En el caso de la Estación Biológica, esto se consigue mediante la monitorización de más de veinte especies de plantas de ambiente hipersalino de la marisma Los Caracoles, en el Noreste del Parque de Doñana.
Modelo en dos pasos
Desde el Centro Universitario U-tad explican que han empleado un modelo en dos pasos, para predecir la abundancia cuando cambian la temperatura y los minerales disueltos en el suelo. De este modo, se puede llegar a predecir, hasta con un nivel de acierto del 85% cuántos ejemplares de cada especie convivirán bajo unas determinadas condiciones.
Dicho modelo ha destapado los grandes impedimentos que afloran con este tipo de estudios, pues la obtención de datos en abundancia, en este caso, sobre las especies herbáceas en campo, duró un total de cinco temporadas, una por año. Para hacerse una idea, el director académico ha desvelado que el equipo del CSIC, “tuvo que realizar conteos individuales en una zona de marisma en la que se reproducen estas especies. La construcción y verificación del modelo llevó un año de trabajo adicional”
Uno de los inconvenientes con los que se han encontrado los investigadores a lo largo del proceso es la calidad y la representatividad de los datos. “Aunque se trata de un trabajo realizado por un equipo muy profesional, hasta que no se completa la tarea no puedes saber si los modelos van a ser mejores que los anteriores de los que se disponía. Es un poco como cocinar, dispones de buenos ingredientes y de experiencia inventando recetas, pero hasta que no has terminado el trabajo no puedes estar seguro de si has alcanzado el punto óptimo”, explica.
Entonces, con todos estos problemas, ¿cómo se ha conseguido mejorar la calidad de las predicciones?. García comenta que el problema reside en que la predicción es muy complicada, “porque para saber cuántas plantas de la especie A habrá el año que viene, necesito saber las de las especies B, C, etc. Para saber las de la especie B, también necesitaría saber las de la A, es una condición circular. Lo que hicimos fue hacer una primera predicción utilizando muy pocas variables, lo que rompe esa condición. Esa primera predicción es muy débil, pero combinándola con los datos originales se consigue una precisión mayor que con los modelos que había hasta la fecha y ese era el objetivo”.
Equipo multidisciplinar
La investigación, llevada a cabo durante dos años, ha sido desarrollada por un equipo de profesionales multidisciplinar formado por Javier García Algarra, director de investigación y director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad, Javier Galeano e Icíar Civantos-Gómez, científicos del Grupo de Sistemas Complejos de la Universidad Politécnica de Madrid, junto a los ecólogos Óscar Godoy y David García-Callejas del Instituto Universitario de Investigación Marina (INMAR) en la Universidad de Cádiz e Ignasi Bartomeus en la Estación Biológica de Doñana (EBD-CSIC).
Otros campos de actividad
Este tipo de avances son una muestra de cómo la digitalización, el big data, la analítica de datos y las herramientas interactivas de visualización contribuyen al avance científico y tienen aplicación directa en el desarrollo y la conservación del medioambiente.
Además, el estudio se puede enfocar a otros campos de actividad, como es el caso de la agricultura comercial. “Lo mismo que hemos hecho con especies silvestres puede aplicarse a cultivos como cereales, plantas forrajeras o legumbres. Este tipo de herramientas se usan ya para seleccionar variedades que puedan resistir mejor cambios de temperatura o sean resistentes a hongos o parásitos que proliferen bajo las nuevas condiciones”, concluye el director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad.