Rodrigo Díaz M.
Los investigadores de Google han creado una aplicación basada en inteligencia artificial (IA) capaz de generar piezas musicales de minutos de duración a partir de texto, e incluso de transformar una melodía silbada o tarareada en otros instrumentos.
La aplicación se llama MusicLM y, aunque aún no se ha lanzado para el público en general, Google ha subido un montón de muestras que ha producido utilizando el modelo.
Los ejemplos son impresionantes. Hay fragmentos de 30 segundos de lo que parecen canciones reales creadas a partir de descripciones de párrafos que prescriben un género, un ambiente e incluso instrumentos específicos, así como piezas de cinco minutos generadas a partir de una o dos palabras como “techno melódico”, “modo historia”, “club futurista” o “rock con acordeón”.
MusicLM puede incluso simular voces humanas, y aunque parece conseguir el tono y el sonido general de las voces correctamente, hay una cualidad en ellas que está definitivamente fuera de lugar. La mejor forma de describirlo es que suenan granuladas o estáticas.
La música generada por IA tiene una larga historia que se remonta a décadas atrás; hay sistemas a los que se les ha atribuido componer canciones pop, copiar a Bach mejor de lo que podría hacerlo un humano en los años 90 y acompañar actuaciones en directo.
Una versión reciente utiliza el motor de generación de imágenes de IA StableDiffusion para convertir indicaciones de texto en espectrogramas que luego se transforman en música. Según el artículo, MusicLM supera a otros sistemas por su calidad, así como por el hecho de que puede captar audio y copiar la melodía.
Esta última parte es quizá una de las demostraciones más interesantes que han hecho los investigadores. La aplicación permite reproducir el audio de entrada, en el que alguien tararea o silba una melodía, y luego escuchar cómo la IA la reproduce en forma de sintetizador electrónico, cuarteto de cuerda y solos de guitarra con mucha precisión.
Al igual que con otras incursiones en este tipo de IA, Google está siendo mucho más cauteloso con MusicLM que algunos de sus homólogos con tecnología similar. “De momento no tenemos planes para lanzarla al público en este momento”, concluye el documento, citando los riesgos de “posible apropiación indebida de contenido creativo y posible apropiación cultural o tergiversación”.
Por ahora, los únicos que podrán hacer uso de la nueva aplicación son otras personas que estén creando sistemas musicales de IA. Google dice que va a publicar un conjunto de datos con unos 5.500 pares de música-texto, que podrían ayudar a entrenar y evaluar otras IA musicales.