Sign In
🔍

检索增强生成(RAG):通过外部知识强化语言模型

检索增强生成 (RAG) 是一种利用外部信息(例如互联网或数据库)来回答复杂问题的语言模型。该模型对于事实检查或回答常识问题特别有用。这是2023年12月最近最受关注的领域。这是Meta宣布LLaMA2和积极发表LLM论文而产生的方法。

RAG 的工作原理

输入处理:接收用户的问题或询问。
信息搜索:在互联网或维基百科等数据库中查找相关信息。
情境化:将您找到的信息与您的问题联系起来。
响应生成:根据链接信息生成准确的答案。

真实的例子

RAG 模型查找最新的论文或文章,并根据其内容生成答案。
RAG的优势其实很明显。这是因为它是一种克服称为幻觉的语言模型局限性的方法。检索增强生成(RAG)是语言模型领域的重要进步,在各种知识密集型领域非常有用。这项技术可以利用外部信息提供最新且准确的答案,是一种强大的工具,尤其是在事实核查至关重要的情况下。
事实一致性:使用最新信息提供更准确的答案。
适应性:当信息发生变化时,模型会生成适合最新情况的答案,而无需重新训练模型。
用途广泛:用于各种需要知识的领域,包括回答问题和检查事实。
随着 GPT 的发布,它提供了一个接口,使 RAG 方法更易于使用。示例包括金融服务、电子商务、医疗保健和呼叫中心聊天机器人:RAG 在这些领域中用于检索客户数据、使用最新的目录信息创建产品描述、提供患者记录信息并提供个性化支持。

实际使用的服务

Azure 机器学习:通过 Azure 认知服务工作室和 SDK 启用 RAG,并提供预构建模型,例如 BART-RAG。
ChatGPT :OpenAI 发布了一个搜索插件,可以将相关的外部知识添加到 ChatGPT 响应中。目前仅提供有限测试版。
Anthropic 的宪法人工智能:为使用经过训练的搜索模块生成的响应提供基本原理。我们注重透明度。

如果将 RAG 应用到提示会怎样?

问题分析:分析用户问题并找出适合他们的关键词或概念。
信息搜索:使用RAG的搜索功能搜索相关知识或数据。例如,您可以查找特定主题的最新研究或统计信息。
生成上下文提示:根据找到的信息创建与您的问题相关的提示。此时,我们会为用户的问题准备更多上下文和事实答案,包括检索到的信息。
响应生成:将准备好的提示输入到语言模型中,以根据检索到的信息生成答案。

例子

"최근에 발견된 외계 행성에 대해 설명해주세요."
1.
信息检索:RAG系统搜索“最近发现的系外行星”的最新研究论文、新闻文章、维基百科页面等。
2.
创建上下文提示:根据找到的信息创建提示。例如,您可以创建一个提示,例如“最近发现的系外行星 TRAPPIST-1 有什么特征,为什么它是一个重要的发现?”
3.
生成响应:将此提示输入到语言模型中以生成详细说明 TRAPPIST-1 及其重要性的答案。
📖
🎨
ⓒ 2023。Haebom,保留所有权利。
经版权所有者许可,可以将其用于商业目的,但需注明来源。
👍