Algoritmos de clasificación consecuentes

Crédito figura: Vicenç Gómez

Los modelos de clasificación o rankings son omnipresentes en una gran variedad de servicios en Internet, desde motores de búsqueda, comercios, sistemas de recomendación, medios de comunicación social y citas en línea. En consecuencia, se ha vuelto mucho más fácil para el usuario encontrar información, productos de consumo, ofertas de trabajo, opiniones etc.

 

UPF / Los sistemas de clasificación han aumentado los servicios disponibles para los usuarios en línea. Sin embargo, se les ha atribuido también fuentes de desinformación, de polarización y de discurso inapropiado o antidemocrático.

Un trabajo en el que ha participado Vicenç Gómez, miembro del grupo de investigación en Artificial Intelligence and Machine Learning, en el Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, ha tenido como objetivo principal diseñar modelos de clasificación consecuentes capaces de tener en cuenta las consecuencias de sus propuestas de clasificación a largo plazo.

El trabajo se ha presentado en dos certámenes internacionales

El trabajo se ha presentado en dos certámenes internacionales: el International Workshop on Misinformation, Computational Fact-Checking and Credible Web, 14 de mayo, San Francisco (EE.UU.); Alan Turing Institute, en un Worshop celebrado el 3 y 4 de junio en Londres (Reino Unido).

Como explica Gómez: “Normalmente, los modelos de clasificación actuales se diseñan para optimizar las medidas inmediatas de utilidad para los usuarios. Premian la gratificación instantánea sin tener en cuenta las consecuencias a largo plazo. Como resultado acaban comportando costes inesperados para el bienestar del sistema”. Por ejemplo, en la integridad de la información, el bienestar tiene que ver con el tamaño medio de publicaciones que, a pesar de clasificarse en las primeras posiciones del ranking, comportan desinformación a lo largo del tiempo.

El objetivo de los autores ha sido construir modelos de clasificación consecuentes que compensen de manera óptima la fidelidad al modelo de clasificación original

Entonces, el objetivo de los autores ha sido construir modelos de clasificación consecuentes que compensen de manera óptima la fidelidad al modelo de clasificación original maximizando la utilidad inmediata y también el bienestar a largo plazo. Presentan un algoritmo práctico y eficiente para aprender modelos de clasificación consecuentes parametrizados que se aproximan de manera más efectiva a los óptimos. Los investigadores muestran que esta representación simplifica enormemente la construcción de modelos de clasificación consecuentes que compensan la fidelidad a los rankings proporcionados por un modelo que maximiza la utilidad inmediata y el bienestar a largo plazo.

En este trabajo, por primera vez, se presenta una representación que contempla conjuntamente los modelos de clasificación y las dinámicas de los usuarios, utilizando un proceso de control probabilístico denominado Proceso de Decisión de Markov (en inglés, MDP), “una estrategia especialmente bien equipada para caracterizar fielmente el problema mencionado anteriormente”, afirman los autores.

 

Un marco matemático para la modelización de la toma de decisiones

Un proceso de decisión de Markov proporciona un marco matemático para la modelización de la toma de decisiones en situaciones en que los resultados son parcialmente aleatorios y en parte bajo el control de un decisor.

Los autores han mostrado su metodología utilizando datos sintéticos y reales recogidos de Reddit, un sitio web de marcadores sociales y agregador de noticias

Los autores han mostrado su metodología utilizando datos sintéticos y reales recogidos de Reddit, un sitio web de marcadores sociales y agregador de noticias en el que los usuarios pueden añadir contenidos que quedan más o menos destacados según sean las votaciones de los demás usuarios.

“Nuestros resultados muestran que los modelos de clasificación consecuentes derivados de nuestra metodología proporcionan rangos que pueden mitigar la propagación de la desinformación y mejorar la civilidad de los debates en línea sin desviaciones significativas de las clasificaciones proporcionadas por modelos que maximizan las medidas de utilidad inmediatas”, concluye Gómez.

Referencia bibliográfica: 
Behzad Tabibian, Vicenç Gómez, Abir De, Bernhard Schölkopf, Manuel Gomez Rodriguez (2019), “Consequential ranking algorithms and long-term welfare”International Workshop on Misinformation, Computational Fact-Checking and Credible Web, 14 de mayo, San Francisco, CA, EE.UU. The Alan Turing Institute, Artificial Intelligence & society: From principles to practice, Londres, 3-4 de junio.

Dejar comentario

Deja tu comentario
Pon tu nombre aquí