Investigadores de la Universidad de Waterloo, Canadá, han desarrollado un sistema que permite generar letras de canciones con el estilo de un cantante particular. El enfoque, esbozado en un artículo en arXiv, usa un autocodificador variacional (VAE por sus siglas en inglés), y un clasificador CNN que se entrena para predecir el artista que se desea a partir de espectrogramas MEL de sus clips de música.
«La motivación de este proyecto parte de un interés personal«, dice Olga Vechtomova, una de las investigadoras que llevó a cabo el estudio . «la música es una de mis pasiones y tenía curiosidad sobre si una máquina puede generar líneas que pueden sonar como la letra de mis artistas favoritos. Mientras trabajaba con modelos generativos de textos, mi grupo de investigación encontró que una red neuronal puede generar algunas líneas impresionantes de texto. El paso siguiente (y natural), fue explorar si la máquina podía aprender la «esencia» del estilo de las letras de un cantante en particular, incluyendo la selección de palabras, temas y estructura de las oraciones, para generar nuevas letras que sonasen como el artista en cuestión».
El sistema desarrollado por Vechtomova y sus colegas se basa en un modelo de red neuronal denominado autocodificador variacional (VAE), el cual puede aprender a reconstruir las líneas originales de texto. En su estudio, los investigadores entrenaron su modelo para generar un número de letras de música diversas, nuevas y coherentes.
En una serie de evaluaciones preliminares, el sistema desarrollado lo hizo muy bien realmente. Sus hallazgos sugieren que esto puede ser útil para generar letras que coinciden con el estilo de un artista en particular. Muchas de las letras generadas por el modelo se alinean sin error con el artista condicionado, reflejando los temas que en general trata en su música.
«Y aunque las líneas generadas contenían muchas veces las palabras del artista, se usaban éstas de maneras interesantes y nuevas, expresando nuevos pensamientos no hallados en las letras originales», dice Vechtomova. «Algunas de las líneas generadas tienen una imagen poética poderosa, expresando estilos como las metáforas y los oximorones, mientras se sigue manteniendo el estilo del artista», indicó la investigadora.
Un sistema de esta naturaleza podría inspirara a artistas en sus nuevas canciones. No se trata se reemplazar a los compositores, sino darles nuevas ideas para desarrollarlas independientemente. «El sistema no pretende reemplazar a ningún artista, sino usar como fuente de inspiración que podría ser análogo a lo que hacen los sintetizadores, que pueden producir un infinito número de sonidos en donde, a partir de ellos, se crean las canciones. De forma similar, esta herramienta puede generar un infinito número de líneas ara las canciones de los artistas, permitiendo así que ellos decidan las mejores y las adecuen a sus nuevas canciones.
«En el futuro planeamos trabajar con modelos que puedan aprender nuevos temas y vocabularios de fuentes adicionales, y así generar letras en el estilo del artista que se deseé», dice Vechtomova y concluye: «M gustaría explorar cómo estos sistemas pudiesen ser usados, potencialmente, por los artistas como fuente de inspiración».