Método para detectar el discurso de odio en redes sociales

Imagen: Freekip.

Un equipo de investigación de la Universidad de Jaén y de la Universidad de Murcia ha diseñado un sistema para textos en español que clasifica los mensajes dirigidos a dañar por motivos de raza, género, orientación sexual, nacionalidad o religión.

 

Fundación Descubre

El equipo de investigación SINAI de la Universidad de Jaén y el equipo de investigación TECNOMOD de la Universidad de Murcia han desarrollado un sistema automático de detección del discurso de odio en español en medios sociales. El modelo combina el análisis de características lingüísticas con redes neuronales basadas en mecanismos de atención, llamadas Transformers. Éstas permiten saber cuáles son los significados que más influyen sobre una palabra en concreto, útil en casos de polisemia o anáfora. De esta forma, alcanza unos resultados cercanos al 90% de precisión. El desafío de esta herramienta de procesamiento del lenguaje natural es agilizar la detección del lenguaje ofensivo para evitar su propagación masiva.

El sistema combina el análisis de las características lingüísticas con redes neuronales basadas en mecanismos de atención, mejorando la precisión de los sistemas actuales

La ingente cantidad de publicaciones diarias en medios sociales hace que sea imposible revisar cada comentario a mano. Para reducir el número de comentarios que deben ser revisados ​​por expertos o incluso para el desarrollo de sistemas autónomos de detección, los investigadores proponen un modelo de identificación automática de discursos de odio destinado a frenar su dispersión.Estudios anteriores apuntan que la presencia de estos mensajes dirigidos a dañar por motivos de raza, género, orientación sexual, nacionalidad o religión en las plataformas de redes sociales se correlaciona con los delitos de odio en la vida real. “No es factible depender de la supervisión manual para detener estas palabras ofensivas. Por ello, queremos contribuir a la detección del discurso de odio en español con un modelo automático y preciso que sea más rápido ”, incide la investigadora del Grupo Sistemas Inteligentes de Acceso a la Información (SINAI) de la Universidad de Jaén Salud María Jiménez Zafra, una de las autoras del estudio.

En concreto, los investigadores proponen en su artículo ‘Evaluating feature combination strategies for hate-speech detection in Spanish using linguistic features and transformers’ publicado en la revista Complex & Intelligent Systems un método que combina un sistema de extracción de características lingüísticas diseñado para el español y modelos computacionales. “Para ello, se utiliza la plataforma denominada UMUTextStats, desarrollada por el grupo TECNOMOD de la Universidad de Murcia, que obtiene de los textos características morfológicas, pragmáticas, semánticas, sintácticas, y de corrección y estilo, que reflejan qué quiere decir un texto dado y cómo lo dice”, explica el investigador José Antonio García Díaz del grupo TECNOMOD de la Universidad de Murcia.

Imagen: Freekip.

A esto se suma un modelo del lenguaje basado en transformers, es decir, un sistema pre-entrenado que ha aprendido cómo se relacionan las palabras, expresiones y otras características del lenguaje a partir de un gran conjunto de datos.

 

Textos representados

Para que el ordenador ‘entienda’ el lenguaje natural se requiere una codificación adecuada. Para ello, el texto se traduce a modelos estadísticos que capturan diversas dimensiones del lenguaje. De esta forma, los investigadores incluyen 365 rasgos de interés extraídos de la herramienta UMUTextStats organizados en distintas categorías como fonéticas, morfosintácticas, semánticas, pragmáticas, estilométricas o jerga de los medios sociales. Así se contabilizan verbos, pronombres, adverbios, frases hechas o marcadores del discurso. “En el caso específico del odio, se atiende a cuestiones relacionadas como el género, los errores ortográficos, términos inclusivos, la presencia de términos relacionados con animales (zorra, perra…) o palabras malsonantes”, comenta el catedrático de la Universidad de Murcia Rafael Valencia García.

Con esta herramienta de procesamiento del lenguaje natural, se podrán agilizar los mecanismos de alerta sobre esas publicaciones y detenerlas antes de su difusión masiva

Junto a estos métodos que atienden a la propia palabra, se entrenan redes neuronales, es decir, algoritmos que funcionan como lo hace el cerebro humano, que cuenta con áreas especializadas en ciertas tareas, y que van aprendiendo con la incorporación de nuevos datos.

El resultado de esta combinación es un sistema para el idioma español más preciso, generalizable e interpretable. “Nuestra propuesta, basada en el uso de características lingüísticas y modelos del lenguaje, supera la precisión de estudios anteriores y alcanza un 90,4 % en algunos de los experimentos”, remarca el investigador del grupo SINAI de la Universidad de Jaén Miguel Ángel García Cumbreras.

Referencia bibliográfica:
García-Díaz, J.A., Jiménez-Zafra, S.M., García-Cumbreras, M.A., & Valencia-García, R. Evaluating feature combination strategies for hate-speech detection in Spanish using linguistic features and transformers. Complex Intell. Syst. (2022). https://doi.org/10.1007/s40747-022-00693-x

Dejar comentario

Deja tu comentario
Pon tu nombre aquí

Ver más

  • Responsable: Eva Serra Sánchez.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Nominalia que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.