Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Suy luận đồ thị cảnh được hướng dẫn theo lược đồ dựa trên Hệ thống mô hình ngôn ngữ lớn đa tác nhân

Created by
  • Haebom

Tác giả

Yiye Chen, Harpreet Sawhney, Nicholas Gyd e, Yanan Jian, Jack Saunders, Patricio Vela, Ben Lundell

Phác thảo

Bài báo này trình bày một đồ thị cảnh như một biểu diễn môi trường có cấu trúc và có thể tuần tự hóa cho suy luận không gian dựa trên mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đề xuất SG², một khung suy luận đồ thị cảnh dựa trên lược đồ lặp, lặp lại dựa trên LLM đa tác tử. Mỗi tác tử bao gồm hai mô-đun: mô-đun suy luận (Reasoner), lập kế hoạch cho các tác vụ trừu tượng và tạo các truy vấn thông tin đồ thị, và mô-đun truy xuất (Retriever), trích xuất thông tin đồ thị có liên quan bằng cách viết mã dựa trên các truy vấn. Hai mô-đun này cộng tác lặp lại để cho phép suy luận tuần tự và chú ý thích ứng đến thông tin đồ thị. Một lược đồ đồ thị cảnh được trình bày cho cả hai mô-đun sẽ hợp lý hóa các quy trình suy luận và truy xuất, đồng thời hướng dẫn sự cộng tác của chúng. Điều này loại bỏ nhu cầu trình bày toàn bộ dữ liệu đồ thị cho LLM, do đó giảm khả năng gây ảo giác do thông tin không liên quan. Các thí nghiệm trong nhiều môi trường mô phỏng khác nhau chứng minh rằng khung đề xuất vượt trội hơn các phương pháp tiếp cận dựa trên LLM hiện có và các chiến lược suy luận trong khi truy xuất dựa trên công cụ, tác tử đơn lẻ cơ bản trong các tác vụ lập kế hoạch và trả lời câu hỏi số.

Takeaways, Limitations

Takeaways:
Cải thiện hiệu suất suy luận không gian của LLM thông qua khuôn khổ suy luận lặp dựa trên LLM đa tác nhân.
Giảm vấn đề ảo giác và tăng hiệu quả suy luận trong LLM bằng cách tận dụng lược đồ đồ thị cảnh.
Hiệu suất vượt trội so với các phương pháp tác nhân đơn lẻ hiện có đã được xác minh trong nhiều môi trường mô phỏng.
Thể hiện hiệu quả trong các nhiệm vụ lập kế hoạch và trả lời câu hỏi bằng số.
Limitations:
Cần nghiên cứu thêm để xác định khả năng khái quát hóa của khuôn khổ đề xuất.
Cần phải xác minh khả năng áp dụng cho nhiều loại biểu đồ cảnh và môi trường phức tạp.
Cần phải đánh giá hiệu suất và nghiên cứu khả năng áp dụng trong môi trường thực tế.
Cần có thêm nghiên cứu về các chiến lược hợp tác hiệu quả giữa các LLM đa tác nhân.
👍