Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ComRAG: Generación aumentada por recuperación con almacenes de vectores dinámicos para la respuesta a preguntas comunitarias en tiempo real en la industria

Created by
  • Haebom

Autor

Qinwen Chen, Wenbiao Tao, Zhiwei Zhu, Mingfan Xi, Liangzhong Guo, Yuan Wang, Wei Wang, Yunshi Lan

Describir

En este artículo, proponemos ComRAG, un marco de generación con recuperación aumentada para la Respuesta a Preguntas Comunitarias (CQA) industrial en tiempo real. ComRAG integra conocimiento estático y pares de QA pasados ​​dinámicos mediante un mecanismo de memoria basado en núcleos, diseñado para la recuperación, generación y almacenamiento eficiente. Está diseñado para abordar los problemas que presentan los métodos existentes al no aprovechar al máximo el conocimiento externo, al no integrar contextos de QA pasados ​​dinámicos o al carecer de mecanismos de memoria adecuados para su implementación industrial. Al evaluarse en tres conjuntos de datos de CQA industriales, ComRAG supera a todos los modelos de referencia, mejorando la similitud vectorial hasta en un 25,9 %, reduciendo la latencia entre un 8,7 % y un 23,3 % y reduciendo el crecimiento de fragmentos por iteración del 20,23 % al 2,06 %.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco que puede contribuir a mejorar el rendimiento de los sistemas CQA industriales en tiempo real
Demostrar la utilidad de un mecanismo de memoria basado en el centro que integra de manera efectiva el conocimiento estático y los pares de control de calidad pasados ​​dinámicos.
Demostramos mejoras sustanciales en el rendimiento a través de mejoras en la similitud de vectores, la latencia y la tasa de crecimiento de fragmentos.
Limitations:
Necesidad de validar el rendimiento en otros conjuntos de datos que no sean los tres conjuntos de datos CQA industriales presentados
Se necesita más investigación sobre la escalabilidad y generalización de los mecanismos de memoria basados ​​en el centro.
Dado que se trata de un modelo optimizado para un entorno industrial específico, se necesita más investigación sobre su aplicabilidad a otros dominios.
👍