Hace más de 30 años, Marvin Minski le pidió a un estudiante de posgrado que hiciese un trabajo para el verano: se trataba de que se escribiese un software que describiese lo que encontrara en una fotografía. Probablemente -si la historia es real (que no me consta)- Minsky se le olvidó que los problemas en la Inteligencia Artificial (IA) no sólo son difíciles, sino mucho más de lo que se hubiese pensado. Este problema apenas empieza a tener soluciones interesantes porque se requiere claramente de mucha información del mundo exterior para poder describir lo que hay en las fotografías.
Microsoft está trabajando en este tema y ha presentado “CaptionBot”, un programa que hace un trabajo bastante decente para describir escenas de la vida real como podrían ser una persona caminando en la calle, un gato durmiendo en un sillón, etcétera. Pero curiosamente, los investigadores involucrados en este esfuerzo han decidido ignorar fotografías en donde aparezcan símbolos nazis o incluso, imágenes del mismísimo Adolfo Hitler.
CNNMoney puso a prueba al software poniéndole muchas fotos de Hitler y variaciones de la swastica. El programa con mucha frecuencia respondió con “No puedo realmente describir la fotografía”, añadiendo un emoji con carita confundida. Sin embargo, el software pudo reconocer a líderes nazis como Joseph Mengele y Joseph Goebbels.
Un par de semanas antes de este Bot, Microsoft mostró otro de sus trabajos, por ejemplo, el de un programa que se expresaba como un/una quinceañero/a. Después de poner el software para que funcionara en Twitter, el programa empezó con una serie de argumentos racistas, como éste; “Hitler estaba en lo correcto y odio a los judíos”. La compañía le echó la culpa del comportamiento del bot a un “esfuerzo coordinado” por los trolls en línea, que entendieron cómo engañar al programa para que empezara a decir estas frases lamentables. Microsoft retiró su bot en menos de 24 horas de haber sido lanzado.
Por ello quizás, el CaptionBot bien podría estar programado para no ser políticamente incorrecto en algún caso. De hecho, aparte de ignorar a Hitler, también se niega a identificar a personas como Osama bin Laden aunque sí reconoce fotos donde aparece Mao Zedong, Pol Pot o Saddam Hussein.
Un vocero de Microsoft dijo: “Hemos implementado una serie de filtros básicos en un esfuerzo por prevenir algunos escenarios de abuso”. Como los bots están siendo manejados por la IA y las tecnologías de aprendizaje de máquinas, estos evolucionan en la medida que interaccionan con seres humanos. Por ello el bot quinceañero se salió de control. Es claro que hay que definir muchas nuevas reglas para que el bot no se comporte de maneras inesperadas.
El CaptionBot suena como una gran idea, pero claramente está en pañales. La virtud de un programa que describa imágenes es que nos podría servir para buscar fotografías que tengan ciertos elementos en particular. Gracias a Internet hay una cantidad inmensa de fotos que si se analizan adecuadamente, le estarían dando cada vez más poder a los seres humanos.
Referencias: