algoritmos videojuego

En el campo de la inteligencia artificial (IA), existen algoritmos que aprenden mediante un sistema de recompensas y penalizaciones. Estos algoritmos ya están superando a los jugadores profesionales de StarCraft, Dota 2 y las difíciles damas de Go chino. Los algoritmos de inteligencia artificial pueden aprender de diferentes formas. 

Por ejemplo, las personas etiquetan cientos de miles de fotos de peatones por una pequeña tarifa y, con base en estos datos, los algoritmos que se utilizan más tarde en los vehículos autónomos aprenden a reconocer a los peatones. Es poco probable, según señala Innotechnews, que este método permita que las máquinas alcancen un nivel de «inteligencia» acorde con un humano: una persona procesa simultáneamente tanta información diferente.

Por lo tanto, los científicos están buscando otras formas de crear inteligencia artificial «real». En esta área del aprendizaje automático, los algoritmos o agentes se encuentran en un entorno específico y realizan acciones que les permitirían maximizar las recompensas. La tarea de los desarrolladores de estos algoritmos es construir un sistema de recompensas y penalizaciones de tal manera que el agente complete la tarea lo más rápido posible. 

Los algoritmos ya están superando a los jugadores profesionales de StarCraft, Dota 2 y las difíciles damas de Go chino

Por ejemplo, si queremos enseñar a un algoritmo de este tipo a jugar al ajedrez, restaremos puntos de la recompensa total cuando pierda sus propias piezas y lo premiaremos por los movimientos exitosos. De hecho, un agente suele realizar muchos millones de acciones diferentes antes de comenzar a navegar por una nueva asignación. Desafortunadamente, el aprendizaje en un entorno simulado está lejos de ser posible en todas las áreas y, en consecuencia, los agentes que aprenden con refuerzo todavía se utilizan principalmente en robótica y juegos. 

AlphaGo Zero

Go Checkers es un antiguo juego de mesa chino que requiere un pensamiento estratégico extraordinario. En 2017, introdujeron una versión mejorada de este algoritmo: AphaGo Zero. A diferencia de su predecesor, este algoritmo no utilizó la experiencia de otros juegos en su entrenamiento, sino que recibió solo las reglas básicas del juego como base. Además, el algoritmo jugó consigo mismo durante 40 días hasta que alcanzó un nivel de habilidad que le permitiría vencer fácilmente a las mejores expertos de Go. 

Dota 2

La inteligencia artificial ha aprendido a derrotar a las personas no solo en los juegos de mesa, sino también en juegos de computadora muy complejos. Así, en abril de 2020, la empresa OpenAI, fundada por Elon Musk, presentó su algoritmo, que logró un éxito considerable en un videojuego tan difícil como Dota 2, derrotando al equipo que se llevó el primer lugar en el torneo internacional anual. Sin embargo, para lograr Con tal resultado, el algoritmo tuvo que jugar Dota 2 de forma continua, por supuesto en un entorno simulado.

AlphaStar

StarCraft II fue otro videojuego en el que la inteligencia artificial pudo vencer a los mejores jugadores. Cuando DeepMind presentó el algoritmo AlphaStar correspondiente en enero de este año, pudo ganar 10 juegos seguidos, pero aún perdió en el juego final ante uno de los jugadores profesionales. Por supuesto, para alcanzar este nivel, el algoritmo tuvo que jugar a StarCraft II varios millones de veces, ganando una experiencia inaccesible para cualquier otra persona. 

La compañía escuchó las críticas y recientemente introdujo una versión actualizada del algoritmo, que tiene acceso limitado al mapa, al igual que los jugadores normales, y no puede realizar más de 22 acciones diferentes durante cada 5 segundos del juego, lo que es comparable a la reacción humana estándar. AplhaStar es superado por el 99,8% de los jugadores en StarCraft II según los resultados de la competencia en línea.