Predicen la popularidad de canciones mediante inteligencia artificial

Fuente: pixabay

Investigadores de la UPM han desarrollado un sistema capaz de predecir con precisión la popularidad de canciones actuales en base a técnicas y algoritmos de inteligencia artificial.

 

UPM / En el contexto actual en el que las plataformas digitales incrementan día a día su oferta de contenidos multimedia, un equipo de investigadores perteneciente al Grupo de Aplicaciones de Telecomunicaciones Visuales de la Universidad Politécnica de Madrid (UPM) ha desarrollado un sistema capaz de predecir con alta precisión la popularidad de una canción mediante técnicas de inteligencia artificial (IA).

El nuevo sistema también incluye datos relacionados con el autor, como su popularidad en redes sociales y plataformas digitales

En particular, el sistema implementado analiza diversos parámetros tanto musicales -como el timbre o la progresión armónica- cómo lingüísticos, analizando las letras mediante técnicas de procesamiento natural del lenguaje. Además de estos parámetros, el nuevo sistema incluye datos relacionados con el autor, como su popularidad en redes sociales y plataformas digitales. Los resultados son prometedores y se espera que, en un futuro cercano, este tipo de algoritmos se pueda incluir en las principales plataformas de contenido musical.

El continuo crecimiento del contenido multimedia en plataformas como Netflix, Amazon, Spotify, o Deezer, está fomentando la investigación y el desarrollo de sistemas inteligentes que sean capaces de analizar automáticamente dicho contenido para poder realizar eficientemente tareas de búsqueda y recuperación de información, esenciales en sistemas de recomendación, monitorización de contenido multimedia o incluso de detección de similitud para proteger los derechos de autor.

En particular, existe una rama de investigación destinada al procesamiento de la música conocida como MIR, por sus siglas en inglés (Music Information Retrieval) que estudia, analiza e implementa técnicas de IA aplicadas directamente a contenidos musicales. Así, en los últimos años, la industria de la música está incorporando estos sistemas a sus productos en muchas de sus etapas: desde la fase de grabación y masterizado de obras musicales, hasta la fase final de experiencia de usuario mediante la implementación de sistemas de recomendación basados tanto en la similitud de contenidos como en las preferencias de los usuarios.

El nuevo sistema utiliza tres fuentes diferentes de información para predecir el valor de popularidad: la señal de audio, la letra en caso de estar disponible, y un conjunto de datos relacionados con el autor

Dentro de las muchas aplicaciones que se estudian en la rama de MIR, existe un campo que investiga y analiza la inferencia de la popularidad mediante IA con el objetivo de conocer qué parámetros hacen que un tema musical se coloque en los primeros puestos de las principales listas de éxitos del mundo. Entre los muchos factores que residen en dicho análisis, destacan: el timbre, la estructura armónica de la obra, el ritmo o la letra, en caso de tenerla. Sin embargo, también existen otros factores no intrínsecos a la obra musical que deben tenerse en cuenta y que están relacionados con el movimiento social y cultural del momento o, incluso, con la propia influencia del artista en los medios de comunicación y en las redes sociales.

Gracias a las técnicas de IA se facilita, en gran medida, la extracción automática de muchos de los parámetros mencionados consiguiendo algoritmos cada vez más precisos para resolver esta tarea. Esto puede ayudar a artistas, productores y otras entidades dentro de la industria musical en la toma de decisiones a la hora de subir una obra musical a una determinada plataforma.

En el caso de la señal de audio de la obra musical, se extraen un conjunto de parámetros relacionados con el timbre, el ritmo y la progresión armónica, utilizando distintas técnicas de procesamiento de audio

El sistema desarrollado por los investigadores de la UPM en este trabajo forma parte de este campo de estudio. En particular, el nuevo sistema utiliza tres fuentes diferentes de información para predecir el valor de popularidad: la señal de audio, la letra en caso de estar disponible, y un conjunto de datos relacionados con el autor, como su popularidad en la plataforma deseada, o el número de seguidores que tiene.

En el caso de la señal de audio de la obra musical, se extraen un conjunto de parámetros relacionados con el timbre, el ritmo y la progresión armónica, utilizando distintas técnicas de procesamiento de audio. Por otro lado, en relación con el análisis de letras, se realiza un estudio estilográfico de la misma mediante técnicas de procesamiento del lenguaje que son independientes del idioma de esta.

Esquema principal del sistema propuesto para la predicción de popularidad en canciones actuales.

 

Para realizar la inferencia de la popularidad, se introducen los parámetros mencionados anteriormente en lo que se conoce como un sistema de Aprendizaje Profundo (Deep Learning, en inglés) que aprende relaciones entre los datos de entrada y devuelve como salida un valor entre 0 y 100, indicando el nivel de popularidad de la obra. En la arquitectura propuesta, dicho sistema de AP se ha denominado HitMusicNet enfatizando al objetivo del mismo.

Cada vez son más las aplicaciones que se pueden beneficiar de sistemas más objetivos para la toma de decisiones y para la medida de calidad de experiencia de usuario

Gracias al continuo desarrollo de la tecnología, cada vez son más las aplicaciones que se pueden beneficiar de sistemas más objetivos para la toma de decisiones y para la medida de calidad de experiencia de usuario. En el caso de la predicción de la popularidad, según explica el investigador de la UPM David Martín Gutiérrez: “los resultados obtenidos por el sistema propuesto son prometedores y se espera que, en los próximos años, este tipo de algoritmos se pueda incluir en las principales plataformas de contenido musical, con el objetivo de mejorar su eficiencia, sin repercutir en la experiencia del usuario y del artista o productor”.

Referencia bibliográfica: 
Martin-Gutierrez D; Penaloza, GH; Belmonte-Hernandez, A; Garcia, FA.  A Multimodal End-to-End Deep Learning Architecture for Music Popularity Prediction IEEE ACCESS 8, 39361-39374, 2020 DOI: 10.1109/ACCESS.2020.2976033.

Dejar comentario

Deja tu comentario
Pon tu nombre aquí