¿Sueñan las redes neuronales con ilusiones visuales?

En los tres casos la Sagrada Familia tiene el mismo color, pero se ve de forma diferente por los colores que le rodean. Esto es una ilusión visual. / UPF

Una red neuronal de convolución es un tipo de red neuronal artificial donde las neuronas se organizan en campos receptivos de una manera muy similar a las neuronas en la corteza visual de un cerebro biológico.

 

UPF / Hoy en día, las redes neuronales de convolución (CNN) se encuentran en una variedad de sistemas autónomos (por ejemplo, en sistemas de detección y reconocimiento de caras, en coches de conducción automática, etc.). Este tipo de red resulta muy efectiva en muchas tareas de visión artificial, como por ejemplo en clasificación y segmentación de imágenes, entre otras muchas aplicaciones.

Las ilusiones visuales son imágenes que nuestro cerebro percibe de manera diferente a lo que son en realidad

Las redes de convolución nacieron inspiradas en el comportamiento del sistema visual humano, en particular en su estructura básica formada por la concatenación de módulos  compuesto por una operación lineal seguida por una operación no lineal. Un estudio publicado en la edición avanzada en línea de la revista Vision Research estudia el fenómeno de las ilusiones visuales en las redes de convolución en comparación con su efecto en la visión de los seres humanos. Un trabajo de Alexander Gómez VillaAdrian MartínJavier Vázquez-CorralMarcelo Bertalmío, miembros del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) y realizado con la participación del investigador Jesús Malo de la Universidad de Valencia.

“Dada esta conexión de las CNN con nuestro sistema visual, en este trabajo hemos querido ver si las redes de convolución sufren de problemas similares a nuestro sistema visual. Para ello nos hemos centrado en las ilusiones visuales. Las ilusiones visuales son imágenes que nuestro cerebro percibe de manera diferente a lo que son en realidad”, explica Gómez Villa, primer autor del estudio.

Las redes CNN también son “engañadas” por ilusiones visuales de brillo y color de la misma forma que las ilusiones visuales engañan a los humanos

Los autores, en su estudio, entrenaron las CNN para tareas simples que la visión humana también desarrolla, como por ejemplo la eliminación de ruido y del efecto de difuminación (blur, en inglés). Lo que han observado ha sido que, estas redes CNN entrenadas en estas circunstancias experimentales también son “engañadas” por ilusiones visuales de brillo y color de la misma forma que las ilusiones visuales engañan a los humanos.

Además, explica Gómez Villa “para nuestro trabajo analizamos también cuándo este tipo de ilusiones causan respuestas en la red que no son las esperadas físicamente, pero que tampoco coinciden con la percepción humana”, es decir, casos donde la CNN obtiene una ilusión óptica que es diferente a la ilusión que percibe el ser humano.

Los resultados de este trabajo son consistentes con la hipótesis de que las ilusiones visuales son un subproducto de la optimización de la visión humana a imágenes naturales (aquellas que un humano ve en su día a día). Al mismo tiempo, estos resultados muestran las limitaciones y las diferencias del sistema visual humano y las redes neuronales artificiales CNN.

Referencia bibliográfica: 
Alexander Gómez Villa, Adrian Martín, Javier Vazquez-Corral, Marcelo Bertalmío, Jesús Malo (2020), “Color illusions also deceive CNNs for low-level vision tasks: Analysis and implications”, septiembre, Vision Research, edición avanzada en línea. https://doi.org/10.1016/j.visres.2020.07.010

Dejar comentario

Deja tu comentario
Pon tu nombre aquí