La nueva Inteligencia Artificial Inspirada por el funcionamiento del cerebro humano y basada en un mecanismo biológico llamado neuromodulación, permite que los agentes inteligentes se adapten a situaciones desconocidas.
La Inteligencia Artificial (AI) ha permitido el desarrollo de técnicas de aprendizaje automático de alto rendimiento en los últimos años. Sin embargo, estas técnicas a menudo se aplican tarea por tarea, lo que implica que un agente inteligente capacitado para una tarea funcionará mal en otras, incluso siendo muy similares. Para superar este problema, los investigadores de la Universidad de Lieja (ULiège) han desarrollado un nuevo algoritmo basado en un mecanismo biológico llamado neuromodulación. Este algoritmo permite crear agentes inteligentes capaces de realizar tareas que no se encuentran durante el entrenamiento. Este novedoso y excepcional resultado se presentó en la revista PLOS ONE.
A pesar del inmenso progreso en el campo de la IA en los últimos años, todavía estamos muy lejos de la inteligencia humana.
La diferencia entre el entrenamiento de la AI y su rendimiento real
De hecho, si las técnicas actuales de IA permiten entrenar a los agentes informáticos para realizar ciertas tareas mejor que los humanos cuando están entrenados específicamente para ellos, el rendimiento de estos mismos agentes a menudo es muy decepcionante cuando se les pone en condiciones (incluso ligeramente) diferentes de las experimentadas durante el entrenamiento.
El ser humano es capaz de adaptarse a nuevas situaciones de manera muy efectiva mediante el uso de las habilidades que ha adquirido a lo largo de su vida.
Por ejemplo, un niño que ha aprendido a caminar en una sala de estar también aprenderá rápidamente a caminar en un jardín. En ese contexto, aprender a caminar está asociado con la plasticidad sináptica, que modifica las conexiones entre las neuronas, mientras que la rápida adaptación de las habilidades para caminar aprendidas en la sala de estar a las necesarias para caminar en el jardín está asociada con la neuromodulación. La neuromodulación modifica las propiedades de entrada-salida de las neuronas a través de neuromoduladores químicos.

Fig. 5. Bosquejo de una interacción de tiempo-paso entre un agente para las dos tareas diferentes (A y B) muestreadas para el tercer punto de referencia.
Cada tarea se define mediante la atribución de una recompensa positiva a uno de los dos objetivos (en azul) y una recompensa negativa al otro (en rojo). En cada paso de tiempo, el agente emite una acción a t que dirige la dirección de su próximo movimiento. Si el agente alcanza un objetivo, recibe la recompensa correspondiente.
La plasticidad sináptica es la base de todos los últimos avances en AI
Sin embargo, hasta ahora ningún trabajo científico ha propuesto una forma de introducir un mecanismo de neuromodulación en las redes neuronales artificiales. Este resultado excepcional es el resultado de una colaboración extremadamente fructífera entre neurocientíficos e investigadores de inteligencia artificial en la Universidad de Lieja que desarrollan algoritmos inteligentes: dos Ph.D. estudiantes, Nicolas Vecoven y Antoine Wehenkel, así como dos profesores, Damien Ernst (especialista en inteligencia artificial) y Guillaume Drion (neurocientífico).
Estos investigadores de ULiège han desarrollado una arquitectura de red neuronal artificial completamente original, introduciendo una interacción entre dos subredes. El primero tiene en cuenta toda la información contextual sobre la tarea a resolver y, sobre la base de esta información, neuromodula la segunda subred en la forma de los neuromoduladores químicos del cerebro. Gracias a la neuromodulación, esta segunda subred, que determina las acciones que debe realizar el agente inteligente, se puede adaptar extremadamente rápido a la tarea actual. Esto le permite al agente resolver eficientemente nuevas tareas.
Esta innovadora arquitectura ha sido probada con éxito en clases de problemas de navegación para los cuales es necesaria la adaptación. En particular, los agentes entrenados para moverse hacia un objetivo, evitando obstáculos, pudieron adaptarse a situaciones en las que su movimiento fue interrumpido por direcciones de viento extremadamente variables.
El profesor Damien Ernst afirma que «la novedad de esta investigación es que, por primera vez, los mecanismos cognitivos identificados en neurociencia están encontrando aplicaciones algorítmicas en un contexto multitarea. Esta investigación abre perspectivas en la explotación en IA de la neuromodulación, una clave en el funcionamiento del cerebro humano «.
Más información: Nicolas Vecoven et al. Introducing neuromodulation in deep neural networks to learn adaptive behaviours, PLOS ONE (2020). DOI: 10.1371/journal.pone.0227922