Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SE-Agent: Tối ưu hóa quỹ đạo tự tiến hóa trong suy luận đa bước với các tác nhân dựa trên LLM

Created by
  • Haebom

Tác giả

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Lichen Wang, Mingguang Chen, Hongzhang Liu, Ronghao Chen, Yangfan He, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

Phác thảo

Bài báo này đề xuất SE-Agent, một khuôn khổ tự tiến hóa (SE) tận dụng hiệu quả các quỹ đạo tương tác xuất hiện trong quá trình giải quyết vấn đề của một tác tử dựa trên mô hình ngôn ngữ quy mô lớn (LLM) để cải thiện hiệu suất của nó. Để khắc phục những hạn chế của các phương pháp hiện có như MCTS, vốn dẫn đến kết quả không tối ưu do sự phụ thuộc lẫn nhau và thiếu tính đa dạng, SE-Agent tối ưu hóa quy trình suy luận theo chu kỳ lặp thông qua ba thao tác: sửa đổi, kết hợp lại và cải thiện các quỹ đạo trước đó. Điều này cho phép nó khám phá các đường dẫn giải pháp đa dạng, giảm thiểu tác động của các đường dẫn kém hiệu quả và nâng cao hiệu suất. Kết quả thử nghiệm sử dụng SWE-bench Verified cho thấy hiệu suất tiên tiến, đạt mức tăng hiệu suất lên đến 55% trên năm LLM mạnh mẽ.

Takeaways, Limitations

Takeaways:
Một cách tiếp cận mới để tối ưu hóa quá trình giải quyết vấn đề của các tác nhân dựa trên LLM được trình bày.
Giải quyết các vấn đề về sự phụ thuộc lẫn nhau và thiếu đa dạng của MCTS _____T43950____-.
Cải thiện hiệu suất hiệu quả và mở rộng không gian tìm kiếm thông qua việc tái sử dụng đường dẫn trước đó.
Hiệu suất tuyệt vời đã được chứng minh trong các tác vụ giải quyết sự cố thực tế trên GitHub.
Mở rộng nghiên cứu và đề xuất khả năng sử dụng thông qua việc công bố mã nguồn mở.
Limitations:
Hiệu quả của SE-Agent có thể phụ thuộc vào hiệu suất của LLM được sử dụng.
Vì những kết quả này dựa trên một lĩnh vực cụ thể (vấn đề GitHub) nên cần nghiên cứu thêm để xác định khả năng khái quát hóa.
Cần nghiên cứu thêm về các chiến lược tối ưu hóa cho ba hoạt động (sửa đổi, tái kết hợp và cải tiến).
Cần phải xác minh khả năng mở rộng của SE-Agent đối với các vấn đề có độ phức tạp rất cao.
👍