Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Học tăng cường tích hợp công cụ cho Tìm kiếm sâu trong kho lưu trữ

Created by
  • Haebom

Tác giả

Zexiong Ma, Chao Peng, Qunhong Zeng, Pengfei Gao, Yanzhen Zou, Bing Xie

Phác thảo

Bài báo này đề cập đến việc bản địa hóa vấn đề phần mềm, quá trình xác định vị trí mã cần sửa đổi để giải quyết các vấn đề phần mềm. Khoảng cách ngữ nghĩa giữa mô tả vấn đề bằng ngôn ngữ tự nhiên và mã lỗi đòi hỏi quá trình suy luận phức tạp, nhiều bước thông qua các phụ thuộc mã. Các tác nhân dựa trên LLM hiện có cố gắng giải quyết vấn đề này bằng cách tích hợp các công cụ tìm kiếm kho lưu trữ, nhưng điều này chuyển thành một nhiệm vụ đầy thách thức được gọi là "Tìm kiếm Sâu Kho Lưu trữ", đòi hỏi các LLM phải tận dụng hiệu quả nhiều công cụ tìm kiếm kho lưu trữ trong suốt quá trình suy luận và khám phá nhiều bước. Để giải quyết thách thức này, bài báo này trình bày ToolTrain, một khuôn khổ đào tạo tích hợp công cụ hai bước kết hợp tinh chỉnh có giám sát lấy mẫu từ chối và học tăng cường tích hợp công cụ. Kết quả thực nghiệm chứng minh rằng các mô hình được đào tạo bằng ToolTrain đạt được hiệu suất tiên tiến, với mô hình 32B vượt trội hơn Claude-3.7 về bản địa hóa cấp hàm. Hơn nữa, chúng tôi chứng minh rằng hiệu suất bản địa hóa được cải thiện sẽ chuyển thành khả năng giải quyết vấn đề đầu cuối được cải thiện, chứng minh rằng đào tạo bản địa hóa vấn đề là một chiến lược khả thi và hiệu quả để cải thiện phát triển phần mềm tự động.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng khuôn khổ ToolTrain có thể cải thiện đáng kể hiệu suất bản địa hóa vấn đề phần mềm bằng cách nâng cao khả năng tận dụng các công cụ tìm kiếm kho lưu trữ của LLM.
Mô hình 32B vượt trội hơn Claude-3.7, cho thấy tiềm năng của việc bản địa hóa vấn đề dựa trên LLM.
Chúng tôi chứng minh tính hiệu quả của đào tạo bản địa hóa vấn đề bằng cách chứng minh rằng hiệu suất bản địa hóa được cải thiện sẽ dẫn đến hiệu suất giải quyết vấn đề toàn diện được cải thiện.
Trình bày chiến lược mới để cải thiện quá trình phát triển phần mềm tự động.
Limitations:
Cần nghiên cứu thêm về hiệu suất tổng quát của khuôn khổ ToolTrain và khả năng áp dụng của nó vào nhiều dự án phần mềm khác nhau.
Kết quả tập trung vào một quy mô cụ thể của LLM (32B) và thiếu đánh giá hiệu suất cho các LLM có quy mô khác.
Có khả năng xảy ra sai lệch hiệu suất tùy thuộc vào đặc điểm của tập dữ liệu thử nghiệm.
Cần đánh giá thêm về độ bền vững khi đối mặt với các cơ sở mã phức tạp hoặc nhiều ngôn ngữ lập trình.
👍