Las capacidades creativas del ser humano siempre nos han querido mostrar que las computadoras no sirven para estas tareas. Y sí, las máquinas podrán hacer todo más rápido pero… ¿componer música? ¿jugar al ajedrez como maestro? ¿pintar obras de arte? Nos negamos a aceptarlo, pero la creatividad parece ya ser tema de la Inteligencia Artificial y no solamente de la que tenemos los seres humanos.
Así, esta semana OpenAI anunció la creación de un sistema de código abierto llamado Jukebox, que crea melodías únicas y armonías junto con la letra y la vocalización, en el estilo de los artistas más populares que hay en muchos géneros musicales.
Por el momento el resultado está lejos de ser lo que los científicos esperaban, pero sin duda empieza a verse sorprendente. Por ejemplo, Jukebox ha creado de pronto canciones que recuerdan el estilo de los Rolling Stones, la vocalización de Ella Fitzgerald o la entonación de Elton John, entre otros.
Mezclando temas y autores
Ciertamente, algunos resultados son curiosos. Por ejemplo, en una canción que parece tener el estilo de Elvis Presley, la cual se bautizó como «Mitosis», el Elvis de la IA canta esta letra: «Del polvo llegamos con humilde comienzo; de la suciedad a los lípidos a las células al corazón. Con [mitosis] con [meiosis] con el tiempo; Por fin nos despertamos con una mente«.
Y esto solamente nos hace pensar que hay mucho trabajo por hacer pues como comentó un periodista especializado: «algunos esfuerzos de Jukebox suenan así: ‘bien, pero como si se estuviese borracho, como karaoke escuchado a través de una nube de drogas».
Pero todo esto es normal en todo desarrollo científico y aún así, los resultados muestran que es significativo el avance y que bien puede ser muy útil en el campo de la generación de música con programas inteligentes.
¿Cómo el software puede generar canciones?
Para que las computadoras puedan escribir canciones, OpenAI ha creado un conjunto enorme de canciones, que es de alrededor de 1.2 millones de ellas. En un comentario en el blog de OpenAI, se menciona: «hemos mostrado que nuestros modelos pueden producir canciones de muchos géneros musicales como rock, hip-hop y jazz, y estos capturan melodía, ritmo, composición y timbres para una amplia variedad de instrumentos, así como los estilos de los cantantes que se producen con la música».
El antecedente de los programas que componen música es probablemente el esfuerzo más significativo de PG Music’s Band in a Box, que le permitía a los usuarios dar los acordes y crear melodías únicas y armonías en una docena de estilos musicales.
En el 2018, Google mostró Musical Transformer, que genera canciones con las correspondientes repeticiones esperadas y el año pasado, OpenAI, liberó MuseNet, que podía crear melodías musicales pero sin incluir la letra. Todo parece indicar que Jukebox es el primer programa que logra ambos propósitos: música y letra.
Los problemas técnicos a resolver
Escribir software que componga música no es una tarea trivial. En el caso de Jukebox, la clave consiste en procesar cantidades masivas de datos musicales.
Por ejemplo, una canción de 4 minutos, con calidad CD (44 Khz, 16 bits), cuenta con más de 10 millones de pasos, de acuerdo con OpenAI. Un auto-codificador se usó para comprimir la información y volver a muestrear los resultados en el software. Con esa compresión incluso, el software tarda unas 9 horas para generar 1 minuto de audio.
Y se esperan mejoras en el software porque incluso en este caso, OpenAI sabe de las limitaciones de su programa:
«Aunque Jukebox representa un paso hacia adelante en la calidad musical, la coherencia, la longitud del sampleo del audio y la habilidad para condicionarse a un artista, género y letras, hay una brecha aún entre todo esto que hacemos y la música creada por seres humanos», destaca el blog.
Jukebox, por ejemplo, no puede componer temas largos como coros o aquellas piezas que usen frases repetitivas. Se espera que la siguiente versión de Jukebox esté lista para abril del 2021.