每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

面向实际应用的工程 RAG 系统:设计、开发和评估

Created by
  • Haebom

作者

Md Toufique Hasan、Muhammad Waseem、Kai-Kristian Kemell、Ayman Asad Khan、Mika Saari、Pekka Abrahamsson

大纲

本文介绍了五款基于实际用例开发的面向特定领域的检索增强生成 (RAG) 应用程序,这些用例涵盖五个实际领域:治理、网络安全、农业、工业研究和医疗诊断。每个系统都集成了多语言 OCR、基于向量嵌入的语义检索以及特定领域的 LLM,并且可以本地部署或通过云 API 部署,以满足多样化的用户需求。一项有 100 名参与者参与的网络评估从六个维度对这些系统进行了评估:可用性、相关性、透明度、响应能力、准确性和可推荐性。基于开发经验和用户反馈,我们记录了 12 条关键经验教训,重点介绍了影响 RAG 系统实际应用的技术、操作和道德挑战。

Takeaways, Limitations

Takeaways:
深入了解 RAG 系统在各个现实领域的实际实施和部署。
提出一种通过用户参与根据实际用例评估 RAG 系统的方法。
介绍了在开发和部署 RAG 系统过程中出现的技术、操作和道德挑战的 12 个关键经验教训。
介绍构建 RAG 系统的技术要素,包括多语言 OCR、矢量嵌入和领域自适应 LLM。
Limitations:
参与评价的用户数量(100)可能相对较少。
对上述五个领域之外的领域的普遍性有限。
这 12 节课可能针对特定的系统和环境。
需要对长期系统性能和稳定性进行进一步研究。
👍