Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Eliminación de sesgos sociales para una maestría en derecho multimodal justa

Created by
  • Haebom

Autor

Harry Cheng, Yangyang Guo, Qingpei Guo, Ming Yang, Tian Gan, Weili Guan, Liqiang Nie

Describir

Este artículo presenta dos contribuciones importantes para abordar el problema del sesgo social en modelos lingüísticos multimodales a gran escala (MLLM). Primero, introducimos el Conjunto de Datos Contrafactuales Integral (CMSC), que incluye 18 conceptos sociales diversos y equilibrados. CMSC complementa los conjuntos de datos existentes, lo que permite un enfoque más integral para la mitigación del sesgo social. Segundo, proponemos una estrategia de eliminación del sesgo de contraestereotipos (CSD) para mitigar el sesgo social en MLLM aprovechando el contraconcepto de estereotipos generalizados. CSD integra un novedoso método de muestreo de datos consciente del sesgo y reequilibrio de pérdidas para mejorar la eficiencia de reducción de sesgo del modelo. Experimentos extensos utilizando cuatro arquitecturas MLLM principales demuestran que el conjunto de datos CMSC y la estrategia CSD reducen eficazmente el sesgo social en comparación con los métodos existentes, logrando esto sin comprometer el rendimiento general en los puntos de referencia comunes de inferencia multimodal.

Takeaways, Limitations

Takeaways:
Contribuye a resolver el problema del sesgo social del MLLM al proporcionar un nuevo conjunto de datos contrafactuales (CMSC) que incluye conceptos sociales diversos y equilibrados.
Presentamos una nueva estrategia de eliminación de estereotipos (CSD) que reduce el sesgo social en MLLM de manera más efectiva que los métodos existentes.
La estrategia CSD logra una reducción del sesgo sin comprometer el rendimiento general de la inferencia multimodal.
Validamos la eficacia de CMSC y CSD a través de experimentos extensos en varias arquitecturas MLLM.
Limitations:
La cobertura de conceptos sociales del conjunto de datos del CMSC podría no ser completa. Es necesario ampliarla para incluir una gama más amplia de conceptos sociales.
La eficacia de la estrategia CSD puede variar según la arquitectura MLLM específica y los datos de entrenamiento utilizados. Se requiere más investigación con otros modelos y datos.
Podría ser necesaria una mayor investigación para definir y medir el sesgo social. Se deberían considerar diversos indicadores de medición y metodologías de evaluación.
👍