El reto consistía en construir un sistema que fuera capaz de estimar la orientación de la cabeza de un individuo en imágenes de profundidad

Investigadores del Grupo de Investigación Cognitive Media Technologies ganan el Head Pose Estimation Challenge

.

Una competición que se celebra en el marco de la 12ª edición de la Conferencia Internacional sobre Reconocimiento Automático de Caras y Gestos que tendrá lugar el próximo mes de mayo en Washington.

.

La estimación de los ángulos de la cabeza estaba restringida al procesamiento de cada imagen de forma individual / UPF

La estimación de los ángulos de la cabeza estaba restringida al procesamiento de cada imagen de forma individual / UPF

UPF / Dmytro Derkach, Adrià Ruiz y Federico Sukno, investigadores del Grupo de Investigación Cognitive Media Technologies (CMTech) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) han resultado ganadores de la competición Head Pose Estimation Challenge. El reto consistía en construir un sistema que fuera capaz de estimar la orientación de la cabeza de un individuo en imágenes de profundidad. Estas imágenes provenían de una secuencia de vídeo donde se muestra una persona moviendo el eje de rotación de la cabeza. Se capturaron mediante una cámara Kinect 2 que permite que descargar imágenes de profundidad a bajo coste. Para esta competición, la estimación de los ángulos de la cabeza estaba restringida al procesamiento de cada imagen de forma individual.

Los investigadores de la UPF presentaron una propuesta que combina tres métodos diferentes de estimaciones de la orientación. Dos de ellos se basan en la detección de puntos faciales característicos mediante un algoritmo que combina alta precisión y resistencia a oclusiones. El tercer método se basa en la construcción de un diccionario para codificar la geometría facial localmente, y por eso es capaz de trabajar en escáneres especialmente complicados sin necesidad de obtener puntos de referencia.

El sistema se ha evaluado a través de la base de datos SASE, que contiene búsqueda de 30.000 imágenes de cincuenta individuos diferentes. Los resultados obtenidos en el cálculo de orientación de caras, con un error medio de entre 5 y 8 grados por ángulo, los han hecho merecedores del primer premio de la competición.

El método propuesto supone una herramienta útil en ámbitos como la interacción hombre-máquina, la captura de movimiento o el reconocimiento facial y de emociones. Tanto el artículo como el código completo del sistema que se ha desarrollado están disponibles en la página http://fsukno.atspace.eu/Research.htm#HeadPoseChall17

.