Innova-tsn ha obtenido el 1er puesto en EMEA y el 7º puesto a nivel mundial en la KNOWLEDGE DISCOVERY AND DATA MINING – KDD Cup 2017, la copa del mundo de Analytics, por detrás de Microsoft China y de cinco empresas chinas, país de origen de uno de los principales patrocinador de la copa, la multinacional Alibaba.
El caso propuesto por la organización de la KDD Cup 2017, estaba directamente relacionado con la predicción de los flujos de tráfico de las autopistas de peaje en China. El objetivo final era ofrecer a los responsables de la gestión del tráfico, medidas preventivas basadas en datos y preparar el camino hacia una solución holística y realista a los cuellos de botella del tráfico.
Para el desarrollo de la solución del ejercicio planteado, Innova-tsn conformó un equipo de especialistas que han trabajado en varias líneas de modelización, creando nuevas variables y probando distintas técnicas para predecir el tiempo medio empleado en recorrer un tramo de carretera y el volumen de vehículos que pasaba por distintos puntos de peaje. En la edición de 2017, Innova-tsn compitió con 434 grupos de analistas e ingenieros de todos los rincones del mundo.
El primer paso del equipo de Innova-tsn que participó en la KDD 2017, fue realizar un análisis del problema planteado por los organizadores del concurso y las posibles estrategias para abordarlo. En una segunda fase, se llevó a cabo el tratamiento de los datos originales para estructurar la información y creación de variables que pudieran tener un impacto positivo en la predicción del modelo. A partir de este punto, se realizó el desarrollo de los modelos y el ensamblaje de las distintas estrategias en una sola.
Innovación y creatividad
Una de las características de la KDD 2017 y que la hace diferente de otras competiciones es que los problemas propuestos suelen ser abiertos y para abordarlos no existe un enfoque obvio. Esto conlleva un extra de creatividad siendo una de las principales motivaciones para participar en este proyecto, lo que obliga a los participantes salir de su zona de confort a la hora de diseñar soluciones.
Tres han sido los componentes estratégicos que han permitido a Innova-tsn alcanzar el séptimo puesto: innovación, creatividad y talento. El equipo, conformado por distintos perfiles profesionales, ha conseguido unificar los diferentes puntos de vista de cada uno de sus integrantes en uno solo, para poner en marcha un proyecto verdaderamente disruptivo y que ha supuesto un desafío para la empresa.
El concurso tuvo dos fases de características idénticas: inicialmente se contaba con más de dos meses para realizar los desarrollos que permitirían ir ajustando los modelos finales. Tras la creación de una tabla de modelización inicial, puesta en común para todo el equipo, se repartieron tareas y se paralelizaron distintas líneas de desarrollo analítico. Cada integrante del equipo, a su vez, generó nuevas variables con el fin de crear modelos independientes y que diesen buenos resultados. Se probaron numerosas técnicas estadísticas, de minería de datos y machine learning y se pusieron en común para combinarlos en un modelo final. Entre los enfoques probados destacan, entre otras, las estrategias de tipo Boosting, redes neuronales recurrentes, cadenas de Markov, series temporales y métodos de stacking para el ensamble de distintos modelos.
En cuanto al software empleado, se ha apostado por una variedad de ellos, utilizando indistintamente diferentes lenguajes de cálculo técnico como SAS, R, Python y Matlab. Se ha utilizado en cada paso el que se consideraba más adecuado, actualizado y potente.
El objetivo de Innova-tsn es seguir apostando por participar en este tipo de concursos internacionales
Tras esa primera fase, los organizadores de la KDD Cup 2017 proporcionaron los datos con los que los diferentes equipos debían medir sus proyectos. Esto permitió recalibrar, actualizar y ensamblar los modelos. A partir de ese punto, se dispuso de cuatro días más para realizar las últimas pruebas, de las cuales se seleccionó automáticamente la mejor.
La motivación de los equipos
La KDD 2017 es la conferencia interdisciplinar más importante del mundo, que reúne a investigadores y profesionales de la minería de datos, data analytics y Big Data. Cada año la organización elige un país como sede, en esta ocasión ha sido Canadá el lugar escogido, tras San Francisco, sede de la pasada edición.
Para el equipo de Innova-tsn, la participación en la KDD 2017 aportó una motivación especial, que no siempre se tiene en el día a día, así como la posibilidad de trabajar con profesionales de diferentes áreas de la organización que comparten la misma ilusión y que dedican su tiempo voluntariamente a un proyecto, cuya finalidad es la satisfacción personal y las ganas de aprender, así como mejorar el aprendizaje, tanto en la modelización como en el análisis de datos. La copa KDD 2017 es un reto creativo que exige dedicación, esfuerzo y constancia.
Futuro
El objetivo de Innova-tsn es seguir apostando por participar en este tipo de concursos internacionales, sinónimo de innovación y de disrupción tecnológica. El reto planteado es colocarse en el TOP 3 del ranking mundial en la próxima edición de la KDD Cup 2018.