Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un marco colaborativo de moderación de contenido para la detección de toxicidad basado en estimaciones conformadas de desacuerdos en las anotaciones

Created by
  • Haebom

Autor

Guillermo Villate-Castillo, Javier Del Ser, Borja Sanz

Describir

Este artículo presenta un nuevo marco que aprovecha las inconsistencias de anotación en la moderación de contenido. Los sistemas de moderación de contenido existentes combinan moderadores humanos con modelos de aprendizaje automático, pero tienden a tratar las inconsistencias de anotación como ruido. Este artículo interpreta estas inconsistencias como señales valiosas que revelan ambigüedad en el contenido y presenta un enfoque que aprende simultáneamente la clasificación de toxicidad y las inconsistencias de anotación mediante aprendizaje multitarea. Específicamente, aprovecha la predicción conforme para considerar la ambigüedad de la anotación y la incertidumbre del modelo, brindando a los moderadores la flexibilidad para ajustar los umbrales de inconsistencias de anotación. Los resultados experimentales muestran que el marco propuesto mejora el rendimiento del modelo, la calibración y la estimación de la incertidumbre en comparación con los enfoques de tarea única, aumenta la eficiencia de los parámetros y optimiza el proceso de revisión.

Takeaways, Limitations

Takeaways:
Demostramos que las inconsistencias de anotación se pueden aprovechar como información valiosa en la moderación de contenido para mejorar el rendimiento del modelo.
Proponemos que la combinación de aprendizaje multitarea y técnicas de estimación de incertidumbre puede conducir a un sistema de moderación de contenido más preciso y confiable.
Mejore el proceso de revisión de contenido y aumente la eficiencia brindando flexibilidad a los moderadores.
La mejora de la eficiencia de los parámetros permite un uso más eficiente de los recursos del sistema.
Limitations:
Se necesitan más investigaciones para determinar la generalidad del marco propuesto y su aplicabilidad a varios tipos de contenido.
Se necesitan más investigaciones sobre estrategias de optimización para el establecimiento de umbrales para el desajuste de anotaciones.
Se requiere evaluación del desempeño y revisión de escalabilidad en entornos de servicio reales.
👍