Procedimiento de reconocimiento automático a partir de información de audio / Pixabay

Miembros del MTG aportan la mejor solución para el reconocimiento automático de géneros musicales

.

Se ha presentado en el congreso WWW2018, celebrado del 23 al 27 de abril en Lyon (Francia) y ha ganado el reto WWW 2018 Challenge: Learning to Recognize Musical Genre. Un trabajo en el que han participado Xavier Serra y Minz Won, junto investigadores de la Universidad Tecnológica de Delft (Holanda).

.

Por ejemplo, una canción de rock también puede ser considerada como de pop,  o muchas obras clásicas también pueden ser instrumentales

UPF / El reconocimiento automático de los géneros musicales a partir de información de audio, es un reto en tecnología musical ya que, a menudo, las etiquetas que describen los géneros musicales atribuidas manualmente por seres humanos, se consideran subjetivas y ruidosas (confusas). Por ejemplo, una canción de rock también puede ser considerada como de pop,  o muchas obras clásicas también pueden ser instrumentales. A su vez, el etiquetado depende del contexto del oyente, por ejemplo, una persona francesa, una canción en francés, no la clasificaría  como “internacional”. En general, no existe una taxonomía de género universal y su clasificación es un desafío.

Este ha sido el punto de partida de una investigación en el campo de reconocimiento automático presentada a la Conferencia WWW 2018, celebrada del 23 al 27 de abril en Lyon (Francia) y que ha sabido aportar la mejor solución al WWW 2018 Challenge: Learning to Recognize Musical Genre  a la predicción correcta de géneros musicales de segmentos de audio desconocidos utilizando el conjunto de datos FMA (Free Music Archive).

.

Este procedimiento de reconocimiento automático a partir de información de audio se detalla en un artículo del que Xavier Serra y Minz Won, director e investigador doctoral, respectivamente, del Grupo de Investigación en Tecnología Musical (MTG) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF son coautores,  junto con investigadores de la Universidad Tecnológica de Delft (Holanda), Jaehun Kim, primer autor y Cynthia C.S. Liem.

El trabajo parte del hecho de que en la clasificación musical, las etiquetas que describen a los artistas son menos subjetivas y menos ruidosas (confusas)

El trabajo parte del hecho de que en la clasificación musical, las etiquetas que describen a los artistas son menos subjetivas y menos ruidosas (confusas) que las que describen géneros musicales y, a su vez, algunos artistas se relacionan fuertemente con determinados géneros musicales.

“En este trabajo, proponemos aplicar el marco de aprendizaje de transferencia aprendiendo de diferentes tipos de información relacionada con el artista o artistas para luego utilizarla para inferir la clasificación de género”. Una solución que en el challenge ha demostrado ser la más eficiente y que aporta una mayor solidez a la etiqueta, minimizando el ruido potencial”, afirman los autores del trabajo.

Participaron en el desafío o challenge seis equiposy en dos rondas tuvieron que enviar sus predicciones de clasificación de género para 35.000 clips de 30 segundos cada uno. El equipo integrado por Minz Won y Jaehun Kim, fue el ganador.

.

Referencia bibliográfica: 
Jaehun Kim, Minz Won, Xavier Serra, Cynthia C.S. Liem (2018), “Transfer Learning of Artist Group Factors to Musical Genre Classification”, WWW ’18 The Web Conference 2018. 23-27 de abril, Lyon (Francia).