Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Recuperación alineada con la referencia y respuesta a preguntas aumentadas sobre documentos propietarios heterogéneos

Created by
  • Haebom

Autor

Nayoung Choi, Grace Byun, Andrew Chung, Ellie S. Paek, Shinsun Lee, Jinho D. Choi

Describir

Este artículo propone un sistema de preguntas y respuestas (QA) basado en Recuperación-Generación Aumentada (RAG) para abordar los desafíos del acceso a la información debido al gran volumen y la naturaleza desestructurada de los documentos corporativos internos. Tomando como ejemplo los documentos de pruebas de choque de la industria automotriz, nos centramos en procesar diversos tipos de datos, mantener la confidencialidad de los mismos y asegurar la trazabilidad entre las respuestas generadas y los documentos originales. Para lograrlo, presentamos el marco RAG-QA, que incluye una canalización de datos que transforma diversos tipos de documentos en un corpus estructurado y pares de QA, una arquitectura interna que preserva la privacidad y un comparador de referencias ligero que vincula las respuestas con el contenido complementario. Nuestros resultados experimentales demuestran mejoras en la precisión factual, la información y la usabilidad en comparación con los sistemas existentes al aplicarlos a la industria automotriz.

Takeaways, Limitations

Takeaways:
Presentación de un marco RAG-QA eficaz para utilizar documentos corporativos internos.
Implementar funciones para procesar diversos tipos de datos (multimodales) y mantener la confidencialidad
Mayor confiabilidad al garantizar la trazabilidad de las respuestas generadas
Sugiriendo el potencial para mejorar la accesibilidad a la información y la eficiencia en la toma de decisiones en diversas industrias, incluida la industria automotriz.
Mayor confiabilidad al medir el desempeño mediante evaluadores humanos y LLM
Limitations:
El marco propuesto está especializado para la industria automotriz y requiere una mayor validación cuando se aplica a otras industrias.
Es necesario tener en cuenta los costos y el consumo de recursos de la construcción y el mantenimiento del sistema.
Escalabilidad y posible degradación del rendimiento para el procesamiento de datos a gran escala
Se necesita una revisión más profunda de la confiabilidad de los evaluadores de LLM.
Se necesita más investigación sobre el rendimiento de generalización para varios tipos de datos multimodales.
👍