En los últimos meses la tecnología de aprendizaje profundo (Deep Learning), se ha convertido en la herramienta más usada para una serie de problemas en cómputo, particularmente asociados a la Inteligencias Artificial. Por ejemplo, Facebook y Google lo usan para reconocer todo lo que aparece en una foto. Apple lo utiliza para tratar de discurrir lo que tiene que decir Siri.
La pregunta es si es posible que una red neuronal profunda pueda ayudar a los usuarios a solucionar uno de los problemas más complejos del día a día, poner los emojis correctos en una conversación. Asunto que parece menor, pero que si se piensa, habla de gustos, de lo que nos agrada, de lo que nos parece triste, etcétera.
La aplicación que hace esto es Dango, la cual corre en los teléfonos y predice los emoji, los “stickers” o los GIFs que se quieren mostrar cuando se escribe en alguna app. Esto permite en esencia poder enriquecer una conversación en WhatsApp, Messenger, o cualquier otro esquema de comunicación entre seres humanos.
Pero algo que consideramos trivial, como poner un emoji no lo es. Para ello, un programa sólo podría sugerir qué emoji conviene poner si entiende de qué se está hablando en una conversación. Los programas que por ejemplo, intentan hacer resúmenes de una noticia, en muchas ocasiones fallan porque simplemente no entienden de contextos, de lo que se está hablando. Por ello, gracias a la tecnología del aprendizaje profundo probablemente podamos hacer un avance en este tema.
Las predicciones de Dango se basan en el trabajo previo hecho con una red neuronal. Este tipo de redes está basada -en principio- en como las neuronas trabajan. El esquema en esencia es así: se manda un estímulo a una neurona. Si ese estímulo es suficiente, la neurona manda una señal. Si no lo es, no hace nada. Hay pues un umbral para que la neurona responda. En las redes neuronales de aprendizaje profundo, lo que se hace es mostrarle al sistema millones de ejemplos del uso de emojis tomados de la web. La red neuronal entonces poco a poco va aprendiendo. Después de un par de días, se empiezan a ver resultados. Lo sorprendente es que de acuerdo a millones de mensajes, Dango aprende sobre lo que quieren decir las frases y entonces puede poner un emoji adecuado o dar una lista para ello. Dango ha aprendido, pues, una especie de slang, algo así como un lenguaje coloquial.
La virtud de Internet en este caso, entre tantas que tiene, es que se tiene acceso a chats, memes, conversaciones públicas, en donde los usuarios agregan emojis muchas veces y el programa entonces aprende el tipo de emojis que se sugieren como mejores. Por ejemplo si alguien pone: “esto no es de mi incumbencia”, el sistema puede entonces poner lo siguiente:
Más de uno podrá pensar que si Dango es entrenado para poner emojis, entonces el número de conceptos que puede entender es pequeño. Hoy en Unicode hay unos 1624 emojis. Pero esto no significa que solamente haya 1624 significados para los emojis, pues todo depende del contexto en el que se usen. Esto significa que Dango puede tener muchos más conceptos semánticos que los que los emojis pueden dar. Por ejemplo, “high five” puede significar “gracias” o “por favor”. Puede haber incluso una combinación de emojis para hacer una frase completa:
Por supuesto que la teoría que hace que Dango funcione es más compleja. El siguiente artículo puede dar más luz sobre el tema.
Los emojis, curiosamente encuentra Dango, pueden agruparse en un espacio semántico. Es decir, hay emojis que están de alguna manera relacionados, por ejemplo, el de un corazón roto con otro que indique tristeza. Es claro que eso habla de una ruptura amorosa y que con dos emojis se entiende el concepto. La red semántica de Dango puede verse en la imagen principal que ilustra este artículo.
Pero en mi opinión lo que me parece más relevante son los cambios que se están dando en los lenguajes. Estos ¿se enriquecen? con los emojis. Son lenguajes más visuales y es evidente que el lenguaje escrito no tiene los giros para por ejemplo, expresar ironía o sarcasmo. Depende muchas veces de la interpretación que hace quien lee el mensaje. Como sea, quizás este artículo le dé idea a alguien de cómo usar las redes neuronales profundas para un tema en particular, y en donde el lenguaje bien puede ser el tema principal. Podemos emprender este fascinante camino empezando por esta página.
Referencias: Dango