Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SSFO: Optimización de fidelidad autosupervisada para la generación aumentada por recuperación

Created by
  • Haebom

Autor

Xiaqiang Tang, Yi Wang, Keyu Hu, Rui Xu, Chuang Li, Weigao Sun, Jian Li, Sihong Xie

Describir

Para abordar la alucinación de modelos en sistemas de Generación Aumentada por Recuperación (RAG), proponemos la Optimización de Fidelidad Autosupervisada (SSFO). SSFO construye pares de datos de preferencia contrastando las salidas del modelo con y sin contexto, y utiliza la Optimización de Preferencia Directa (DPO) para mejorar la precisión del modelo sin costos de etiquetado ni sobrecarga de inferencia adicional. SSFO aprovecha el fenómeno de "desplazamiento de verosimilitud", que transfiere la masa de probabilidad a tokens alineados con el contexto, y propone una función de pérdida de DPO mejorada basada en este. SSFO logra un rendimiento de vanguardia en múltiples conjuntos de datos, superando los métodos existentes y preservando las capacidades de generalización y seguimiento de dirección en entornos multilingües.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo enfoque para abordar el fenómeno de la alucinación en el sistema RAG.
Mejore la precisión del modelo sin etiquetar costos a través del aprendizaje autosupervisado.
Alinee modelos sin carga de inferencia adicional aprovechando DPO.
Se propone un nuevo mecanismo para mejorar la precisión del modelo utilizando el fenómeno de "desplazamiento de verosimilitud".
Lograr el rendimiento SOTA en diversos conjuntos de datos y demostrar la capacidad de generalización en entornos multilingües.
Limitations:
No hay ninguna mención específica de Limitations en el documento.
👍