Combinación de RAG, modelo de incrustaciones y VectorDB
Webtoon de Naver, Yang Young-soon <Denma>
Es una combinación que casi te da ganas de bromear que son tres tecnologías en una. Si leíste esta guía sin saltarte nada,Generación aumentada por recuperación RAG (Retrieval-Augmented Generation), seguramente lo recuerdas. Entonces, naturalmente esto puede generarte curiosidad. ¿No se supone que RAG también proporciona respuestas más ricas al referirse a información existente? Entonces, ¿qué papel juegan el modelo de embedding y VectorDB? Eso es lo que uno se pregunta. Si no tenías curiosidad, disculpa. Pero a mí sí me daba curiosidad.
•
El modelo de embedding se encarga de transformar palabras o frases en una matriz de números que la computadora pueda entender, es decir, un vector. Esto es parecido a enseñar un idioma a una computadora, que así logra captar el significado de frases o palabras a través de esos vectores.
•
VectorDB es la base de datos en la que se almacenan y gestionan estos vectores convertidos. Es decir, podríamos decir que es como un 'vocabulario' del idioma aprendido por la computadora. Allí, muchas palabras y frases están organizadas en forma de vectores para que puedas consultarlas rápidamente cuando lo necesites.
•
RAG es un modelo de inteligencia artificial que, al responder una pregunta, busca información ya almacenada (por ejemplo, en VectorDB) y genera sus respuestas en base a eso. Es parecido a un estudiante que recuerda lo que estudió cuando resuelve un examen. RAG se apoya en información existente para crear respuestas más precisas y útiles.
Es decir, VectorDB puede ser el almacén de información de referencia para el modelo RAG. Claro, lo mismo aplica para otras bases de datos. RAG consulta la información vectorial guardada en VectorDB para generar respuestas a preguntas específicas, y utiliza esa información para producir nuevas respuestas. Durante este proceso, RAG 'comprende' la información de VectorDB y construye sus respuestas basándose en eso.
Así, RAG aprovecha el conocimiento previamente almacenado para ofrecer información más rica y exacta. Pero lo que hace innovador a RAG y que capte tanta atención es que la inteligencia artificial no sólo da respuestas ya preparadas, sino que crea nuevas respuestas basándose en el conocimiento guardado.
ⓒ 2023. Haebom, todos los derechos reservados.
Si se indica la fuente y el titular de los derechos lo permite, puede utilizarse con fines comerciales.
Las imágenes utilizadas se incluyen sólo para explicar mejor el contenido, y todos los derechos sobre ellas pertenecen a los autores originales indicados como fuente.