本文介绍了五种基于实际用例开发的、面向特定领域的检索增强生成 (RAG) 应用程序,这些用例涵盖五个领域:政府治理、网络安全、农业、工业研究和医疗诊断。每个系统都集成了多语言 OCR、基于向量嵌入的语义检索以及领域自适应的 LLM,并通过本地服务器或云 API 进行部署以满足用户需求。一项有 100 名参与者参与的网络评估从六个维度对这些系统进行了评估:可用性、相关性、透明度、响应性、准确性和可推荐性。根据用户反馈和开发经验,我们记录了 12 条关键经验教训,这些经验教训突出了影响 RAG 系统实际应用的技术、操作和道德挑战。本文旨在解决基于实际用例的 RAG 系统开发和评估缺乏实证研究的问题。