Sign In
👁️‍🗨️

RAG与嵌入模型和VectorDB的组合

Naver Webtoon、杨英顺<电马>
这种组合如此引人注目,我忍不住想说它涉及三种技术。如果你一直在读这篇指南,你肯定还记得检索增强生成 (RAG)。所以,你可能会想:RAG 也会参考现有信息来提供更丰富的答案,对吧?那么,嵌入模型和 VectorDB 的作用是什么呢?如果你不好奇,我很抱歉。但我当时确实很好奇。
Embedding模型负责把单词或句子转化为计算机能理解的数字数组,也就是向量。这有点像是教计算机学语言,计算机就能通过这些向量理解句子或者单词的意义了。
VectorDB是存储和管理这些转化后的向量的数据库。可以说,它就像是计算机学到语言后的“词汇本”。这里把很多单词和句子都整理成向量的样子,需要用的时候可以很快找到。
RAG是一种在回答问题时会先查找现有存储的信息(比如存进VectorDB里的信息)再据此生成答案的人工智能模型。有点像学生要答题时回忆自己学过内容的样子。RAG会参考已有的信息,给出更准确、更有用的答案。
也就是说,VectorDB可以作为RAG模型参考信息的“仓库”。当然了,别的数据库也可以。RAG会为了回答某个具体问题,去查找VectorDB中储存的向量信息,并利用这些信息生成新的答案。在这个过程中,RAG会“理解”VectorDB里的内容,然后以此为基础组织自己的回答。
通过这种方式,RAG可以利用已知知识,给出更丰富、更精准的信息。不过,RAG之所以被关注,是因为AI不只是机械地给出预先设定好的答案,而是能基于存储的知识创造出全新的答复,这才是它的创新之处。
♾️
💽
ⓒ 2023。Haebom,保留所有权利。
经版权所有者许可,可以将其用于商业目的,但需注明来源。
所用图像仅用于说明目的,图像的所有权利均属于来源中注明的原作者。
👍