Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Mỗi người một ý: Khám phá sự nhúng tối ưu trong RAG

Created by
  • Haebom

Tác giả

Shiting Chen, Zijian Zhao, Jinsong Chen

Phác thảo

Bài báo này đề xuất hai phương pháp mới để giải quyết thách thức Limitations của Retrieval-Augmented Generation (RAG), vốn đang thu hút sự chú ý như một phương pháp tích hợp thông tin tiên tiến vào các mô hình ngôn ngữ quy mô lớn (LLM) hoặc xây dựng các mô hình miền cụ thể. RAG sử dụng nhiều mô hình nhúng, nhưng các đặc điểm không đồng nhất của chúng dẫn đến sự khác biệt trong kết quả tính toán độ tương đồng và chất lượng của các phản hồi LLM. Để giải quyết vấn đề này, chúng tôi đề xuất Mixture-Embedding RAG và Confident RAG. Mixture-Embedding RAG tích hợp các kết quả truy xuất của nhiều mô hình nhúng nhưng không cải thiện hiệu suất so với RAG thông thường. Mặt khác, Confident RAG tạo ra các phản hồi nhiều lần bằng cách sử dụng nhiều mô hình nhúng và chọn phản hồi có độ tin cậy cao nhất. Phương pháp này cải thiện hiệu suất lần lượt khoảng 10% và 5% so với LLM và RAG thông thường. Kết quả nhất quán trên nhiều LLM và mô hình nhúng khác nhau chứng minh rằng Confident RAG là phương pháp cắm và chạy hiệu quả, có thể áp dụng cho nhiều lĩnh vực.

Takeaways, Limitations

Takeaways:
Confident RAG trình bày một phương pháp hiệu quả để cải thiện hiệu suất của RAG bằng cách kết hợp hiệu quả sức mạnh của nhiều mô hình nhúng khác nhau.
Nó cho thấy sự cải thiện hiệu suất nhất quán trên nhiều mô hình LLM và nhúng khác nhau, cho thấy khả năng ứng dụng rộng rãi.
Nó được triển khai theo phương thức cắm và chạy nên có thể dễ dàng tích hợp vào các hệ thống hiện có.
Limitations:
RAG nhúng hỗn hợp không cho thấy bất kỳ cải thiện hiệu suất nào so với RAG thông thường. Cần nghiên cứu thêm để cải thiện nó.
Hiện vẫn còn thiếu thông tin chi tiết về cách Confident RAG đo lường độ tin cậy. Vẫn còn nhiều điểm cần cải thiện về cách thức đo lường độ tin cậy này.
Cần có thêm các thí nghiệm trên nhiều lĩnh vực khác nhau. Kết quả hiện tại có thể chỉ giới hạn ở một số lĩnh vực cụ thể.
👍