Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Lý luận thích ứng động thông qua MCTS do LLM hướng dẫn để KGQA hiệu quả và có nhận thức về ngữ cảnh

Created by
  • Haebom

Tác giả

Yingxu Wang, Shiqi Fan, Mengzhu Wang, Siyang Gao, Siwei Liu, Nan Yin

Phác thảo

Bài báo này đề xuất Lý luận dựa trên MCTS thích ứng động (DAMR), một khuôn khổ mới cho Trả lời câu hỏi đồ thị tri thức (KGQA). Để khắc phục những hạn chế của các phương pháp tạo đường dẫn động dựa trên LLM và truy xuất hiện có, DAMR tích hợp tìm kiếm biểu tượng dựa trên Tìm kiếm cây Monte Carlo (MCTS) với đánh giá đường dẫn thích ứng. Một bộ lập kế hoạch dựa trên LLM sẽ chọn k mối quan hệ liên quan hàng đầu tại mỗi bước để giảm không gian tìm kiếm, và một bộ chấm điểm nhẹ dựa trên bộ chuyển đổi thực hiện ước tính xác suất nhận biết ngữ cảnh bằng cách đồng mã hóa các chuỗi câu hỏi và quan hệ. Hơn nữa, cơ chế tinh chỉnh đường dẫn giả động giúp giảm thiểu việc thiếu dữ liệu giám sát chất lượng cao. Kết quả thực nghiệm chứng minh rằng DAMR vượt trội hơn đáng kể so với các phương pháp tiên tiến hiện có.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ KGQA hiệu quả và có nhận thức về ngữ cảnh bằng cách kết hợp MCTS và LLM, một công cụ chấm điểm nhẹ dựa trên bộ chuyển đổi.
Giảm bớt tình trạng thiếu dữ liệu giám sát chất lượng cao thông qua cơ chế cải thiện đường dẫn động.
Đã Chứng minh hiệu suất vượt trội so với các phương pháp hiện có trong nhiều tiêu chuẩn khác nhau.
Limitations:
Việc phụ thuộc vào các nhà lập kế hoạch dựa trên bằng LLM vẫn còn tồn tại. Cần nghiên cứu thêm để xác định liệu các vấn đề về chi phí liên quan đến các cuộc gọi LLM có thể được giải quyết hoàn toàn hay không.
Cần phân tích thêm để xác định hiệu suất của cơ chế cải thiện đường dẫn động. Cũng cần xác minh chất lượng và độ ổn định của nhãn giả.
Cần xác nhận thêm để xác định liệu những cải tiến về hiệu suất cho các chuẩn mực KGQA cụ thể có thể được tổng quát hóa hay không.
👍