Ya hemos hablado del cubo de Rubik, que ejerce una fascinación a los matemáticos, por su complejidad, por las posibilidades para estudiar este tipo de pasatiempos tridimensionales.
Los matemáticos han ya mostrado las propiedades del cubo, la complejidad del mismo, y la manera de resolverlo. Sin embargo, ahora lo interesante es que una red neuronal ha aprendido a resolver el cubo por sí misma.
Reto tecnológico
Los investigadores de la Universidad de California, Irving, han creado un sistema inteligente que puede resolver el cubo, en promedio, en 1.2 segundos y usando unos 20 movimientos.
Esto es 2 segundos más rápido que el ser humano que ostenta el récord mundial, con 3.47 segundos. Cabe decir que los humanos normales lo podemos resolver, conociendo los algoritmos básicos, en unos 50 segundos.
Pero la red neuronal, llamada DeepCubeA, no tiene el récord del mundo en la resolución del cubo entre máquinas.
Otros investigadores el año pasado mostraron un robot que podía resolver el cubo en 0.38 segundos, usando el algoritmo min2phase, del MIT, que es algo así como 3 veces el algoritmo que usa la red neuronal.
DeepCubeA aprendió por sí mismo
Mientras otros algoritmos se diseñaron específicamente para resolver el cubo, DeepCubeA tuvo que armar su propia solución, su propio camino.
Más curioso es el hecho de que los investigadores no están exactamente seguros de cómo DeepCubeA se dio cuenta de cómo tenía que hacer que hubiese un color en cada una de las caras.
Hay varios millones de millones de combinaciones posibles para el cubo, pero solamente un estado completo.
Y aunque los investigadores le dijeron cuál era el estado final del cubo, DeepCubeA halló por sí misma cómo llegar a esta solución y hoy no se entiende completamente cómo desarrolló su estrategia.
Una de las razones para esto bien puede ser que una red neuronal es finalmente un modelo matemático, simbólico, que se expresa con ecuaciones. Pasar de ahí a la parte conceptual parece ser ahora un problema en las redes neuronales.
Entrenamiento personal
Los investigadores, para este estudio, comenzaron con una versión simulada del cubo de Rubik y entonces lo revolvieron.
DeepCubeA entonces se entrenó a sí misma, asunto que le llevó dos días, mejorando sus habilidades en un intento de resolver las combinaciones más difíciles.
De acuerdo con un artículo publicado en Nature, los investigadores le dieron a DeepCubeA 10 millones de combinaciones y le pidieron que lo resolviera entonces en 30 o menos movimientos.
La IA se puso a prueba con unas mil combinaciones. El sistema logró resolver el cubo todas las veces y lo hizo en el mínimo número estipulado de movimientos en un 60% de los intentos.
El algoritmo puede resolver otros juegos como el «juego de 15» y Sokoban.
DeepCubeA usa una red neuronal artificial, que emula lo que hacen las neuronas humanas, con técnicas de aprendizaje, en donde la IA aprendió a detectar patrones y teorizar con las entradas dadas por los humanos.
Adoptó un mecanismo de aprendizaje reforzado, que significa que lo que aprendía iba incrementando los estados de dificultad, a partir del estado meta sin tener ningún conocimiento del dominio.
Los investigadores antes habían publicado ya un artículo con un enfoque diferente al pasatiempo, llamado Política Aproximada de Interacciones.
Hay que indicar que la red neuronal DeepCubeA no se diseñó específicamente para resolver los cubos de Rubik, sino que el algoritmo tiene amplias implicaciones:
«¿Cómo podemos crear IA avanzada que sea más robusta y capaz de razonar, entender y planear?» Pierre Baldi, profesor de ciencias de la computación y autor senior del estudio dijo: «este trabajo es un paso hacia esta meta mucho más compleja».