Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MetaGen Blended RAG: Mở khóa độ chính xác Zero-Shot cho lĩnh vực chuyên biệt - Trả lời câu hỏi

Created by
  • Haebom

Tác giả

Kunal Sawarkar, Shivam R. Solanki, Abhilasha Mangal

Phác thảo

Bài báo này trình bày một phương pháp mới, "MetaGen Blended RAG", nhằm giải quyết những thách thức mà phương pháp Tạo dữ liệu Tăng cường Truy xuất (RAG) trên các tập dữ liệu chuyên biệt theo miền: bị cô lập sau tường lửa và chứa nhiều thuật ngữ phức tạp và chuyên ngành không gặp phải trong quá trình tiền huấn luyện LLM. Để giải quyết ba thách thức chính của các RAG hiện có—biến thiên ngữ nghĩa liên miền, chi phí tinh chỉnh và thiếu khả năng khái quát hóa, và khó khăn trong việc đạt được độ chính xác zero-shot—chúng tôi đề xuất một phương pháp để nâng cao khả năng truy xuất ngữ nghĩa thông qua một đường ống tạo siêu dữ liệu và một chỉ mục truy vấn lai sử dụng các vectơ dày đặc và thưa thớt. Bằng cách tận dụng các khái niệm, chủ đề và từ viết tắt chính để tạo ra một chỉ mục ngữ nghĩa giàu siêu dữ liệu và một truy vấn lai nâng cao, phương pháp của chúng tôi đạt được hiệu suất mạnh mẽ và có thể mở rộng mà không cần tinh chỉnh. Phương pháp này vượt trội hơn các mô hình cơ sở RAG zero-shot hiện có trên các tập dữ liệu PubMedQA, SQuAD và NQ, và thậm chí còn cạnh tranh với các mô hình tinh chỉnh. Đây là một cách tiếp cận mới để xây dựng các hệ thống truy xuất ngữ nghĩa với khả năng khái quát hóa vượt trội trên nhiều miền.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng hiệu suất RAG có độ chính xác cao có thể đạt được trên các tập dữ liệu doanh nghiệp cụ thể theo miền mà không cần tinh chỉnh.
Một phương pháp RAG mới được trình bày thông qua việc tạo siêu dữ liệu và lập chỉ mục truy vấn kết hợp.
Nó cho thấy hiệu suất khái quát tuyệt vời trong nhiều lĩnh vực khác nhau (y sinh, kiến thức chung, v.v.).
ĐạT hiệu suất vượt trội hơn các mẫu tham chiếu RAG không bắn hiện có và một số mẫu được tinh chỉnh.
Limitations:
Thiếu phân tích chi tiết về chi phí tính toán của phương pháp đề xuất và độ phức tạp của quy trình tạo siêu dữ liệu.
Cần phải xác nhận thêm hiệu suất tổng quát trên nhiều tập dữ liệu doanh nghiệp khác nhau.
Thiếu phân tích các lỗi có thể xảy ra trong quá trình tạo siêu dữ liệu và tác động của chúng.
Nhu cầu và hạn chế của các chiến lược tạo siêu dữ liệu được tối ưu hóa theo từng miền.
👍