Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DIVER: Một phương pháp tiếp cận nhiều giai đoạn để thu thập thông tin chuyên sâu về lý luận

Created by
  • Haebom

Tác giả

Meixiu Long, Duolin Sun, Dan Yang, Junjie Wang, Yue Shen, Jian Wang, Peng Wei, Jinjie Gu, Jiahai Wang

Phác thảo

Bài báo này đề cập đến những hạn chế của các mô hình tìm kiếm tạo sinh tăng cường đạt được hiệu suất mạnh mẽ trong các tác vụ chuyên sâu về kiến thức, trong đó sự liên quan giữa truy vấn và tài liệu có thể được xác định thông qua việc khớp từ vựng hoặc ngữ nghĩa trực tiếp. Các hệ thống truy xuất hiện tại gặp khó khăn trong việc nắm bắt nhiều truy vấn trong thế giới thực liên quan đến suy luận trừu tượng, tư duy tương tự hoặc suy luận nhiều bước. Để giải quyết thách thức này, chúng tôi trình bày DIVER , một đường ống truy xuất được thiết kế cho việc truy xuất thông tin chuyên sâu về suy luận. DIVER bao gồm bốn thành phần: xử lý tài liệu để cải thiện chất lượng đầu vào, mở rộng truy vấn dựa trên LLM thông qua tương tác tài liệu lặp lại, một trình tìm kiếm tăng cường suy luận được tinh chỉnh trên dữ liệu đa miền tổng hợp bằng cách sử dụng các phủ định cứng và một trình xếp hạng lại từng điểm kết hợp điểm hữu ích do LLM chỉ định với điểm truy xuất. Trên điểm chuẩn BRIGHT, DIVER luôn vượt trội hơn các mô hình nhận biết suy luận cạnh tranh, đạt được điểm nDCG@10 hiện đại là 41,6 và 28,9 cho truy vấn ban đầu. Những kết quả này chứng minh tính hiệu quả của các chiến lược truy xuất dựa trên suy luận trong các tác vụ phức tạp, thực tế. Mã nguồn và mô hình truy xuất sẽ sớm được công bố.

Takeaways, Limitations

_____T147875____-: Chúng tôi giới thiệu DIVER, một quy trình tìm kiếm mới hiệu quả cho việc truy xuất thông tin chuyên sâu về suy luận. Chúng tôi đạt được hiệu suất tiên tiến nhất trên chuẩn BRIGHT. Chúng tôi chứng minh hiệu quả của việc mở rộng truy vấn dựa trên LLM và các công cụ tìm kiếm tăng cường suy luận. Chúng tôi nhấn mạnh tầm quan trọng của các chiến lược tìm kiếm nhận thức suy luận trong các tác vụ thực tế phức tạp.
Limitations: Mã và mô hình tìm kiếm hiện chưa được công bố rộng rãi. Cần phải xác minh hiệu suất trên các chuẩn mực khác ngoài chuẩn mực BRIGHT. Cũng cần phải đánh giá hiệu suất tổng quát hóa trên nhiều loại tác vụ suy luận khác nhau.
👍