Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
Bài báo này đề xuất SE-Agent, một khuôn khổ mới để tối ưu hóa quy trình giải quyết vấn đề (đường dẫn tương tác) của các tác tử dựa trên các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi giải quyết các vấn đề của các phương pháp hiện có, chẳng hạn như MCTS, vốn bỏ qua sự phụ thuộc lẫn nhau giữa các đường dẫn tương tác và tính đa dạng không gian tìm kiếm không đủ, dẫn đến suy luận kém hiệu quả. SE-Agent tối ưu hóa quy trình suy luận theo chu kỳ lặp thông qua ba thao tác: sửa đổi, kết hợp lại và cải thiện các đường dẫn hiện có. Điều này cho phép nó khám phá các đường dẫn giải pháp đa dạng vượt ra ngoài tối ưu cục bộ và giảm thiểu tác động của các đường dẫn kém hiệu quả, do đó cải thiện hiệu suất. Kết quả thử nghiệm sử dụng bộ dữ liệu SWE-bench Verified chứng minh rằng phương pháp của chúng tôi đạt được hiệu suất tiên tiến, đạt mức tăng hiệu suất lên tới 55% trên năm LLM mạnh mẽ.
Takeaways, Limitations
•
Takeaways:
◦
Một cách tiếp cận mới để tối ưu hóa quá trình giải quyết vấn đề của các tác nhân dựa trên LLM.
◦
Giải quyết vấn đề bỏ qua sự phụ thuộc lẫn nhau và thiếu sự đa dạng không gian tìm kiếm trong các phương pháp hiện có (__T28601_____)
◦
Cải thiện hiệu suất hiệu quả và giảm thiểu tác động của đường dẫn kém hiệu quả thông qua các hoạt động sửa đổi, kết hợp lại và cải tiến.
◦
ĐạT được hiệu suất vượt trội trên SWE-bench Verified (cải thiện hiệu suất lên đến 55%)
◦
Bản phát hành mã nguồn mở để cải thiện khả năng truy cập
•
Limitations:
◦
Cải thiện hiệu suất của SE-Agent có thể bị giới hạn ở một tập dữ liệu cụ thể (SWE-bench Verified).
◦
Cần có thêm nghiên cứu về hiệu suất tổng quát cho các loại vấn đề hoặc môi trường khác.
◦
Cần nghiên cứu thêm về việc điều chỉnh thông số và tối ưu hóa ba hoạt động (sửa đổi, kết hợp lại và cải tiến).