Con una precisión del 84%, el estudio demográfico de Soler-Company ha logrado predecir de manera automática el género, femenino o masculino del autor

Los textos escritos delatan el género de su autoría

.

La identificación de los perfiles de género de la autoría de textos escritos atrae el interés de determinados sectores profesionales y sociales, cuando se aplica, por ejemplo,  al marketing o a la investigación forense.  

.

UPF / Este ha sido el tema de la investigación de Juan Soler-Company, miembro del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, con el que ha ganado el premio a la mejor presentación de póster STAIRS (European Starting AI Researchers  Symposium) en la 22ª edición de la European Conference on Artificial Intelligence, que se está celebrando en La Haya (Holanda), del 28 de agosto al 2 de septiembre.

Este nuevo método es capaz de discernir efectivamente patrones de escritura femeninos y masculinos  

Con una precisión del 84%, el estudio demográfico de Soler-Company ha logrado predecir de manera automática el género, femenino o masculino, de la autoría de artículos de opinión publicados en línea en periódicos de lengua inglesa: The Sun, The Times y New York Daily. Un total de 7.148 textos, de unas 350 palabras de promedio, escritos por 51 diferentes autores y de temática diversa (deportes, política, economía y temas generales).

Para ello, el autor ha analizado estos textos a diferentes niveles y ha llegado a la conclusión de que el análisis profundo del lenguaje, en lo que concierne a su estructura, tanto sintáctica como discursiva, en lugar del análisis tradicional de contenido a través de características meramente léxicas, conduce a una mayor eficacia en la identificación de patrones de género de autoría de textos escritos. Este nuevo método es capaz de discernir efectivamente patrones de escritura femeninos y masculinos.

Soler-Company añade que el siguiente paso de su investigación será buscar patrones de escritura según edad, orientación sexual, profesión, lengua materna y otras características demográficas posibles de sus autores.

.

Trabajo de referencia:

Juan Soler-Company (2016), “Use of Discourse and Syntactic Features for Gender Identification”, Best Poster Presentation Award STAIRS, 22ª European Conference on Artificial Intelligence, La Haya  (Holanda), 28 de agosto al 2 de septiembre, doi: 10.3233 / 978-1-61499-682-8-215. Frontiers in Artificial Intelligence and Applications, vol. 284, pp. 215-220.

.

Share