यह शोधपत्र सॉफ़्टवेयर समस्या स्थानीयकरण, यानी उन कोड स्थानों की पहचान करने की प्रक्रिया पर केंद्रित है जिनमें सॉफ़्टवेयर समस्याओं के समाधान हेतु संशोधन की आवश्यकता होती है। प्राकृतिक भाषा समस्या विवरणों और दोषपूर्ण कोड के बीच अर्थगत अंतर को कोड निर्भरताओं के माध्यम से जटिल, बहु-चरणीय तर्क की आवश्यकता होती है। मौजूदा LLM-आधारित एजेंट रिपॉजिटरी खोज उपकरणों को एकीकृत करके इस समस्या का समाधान करने का प्रयास करते हैं, लेकिन यह "रिपो डीप सर्च" नामक एक चुनौतीपूर्ण कार्य में परिवर्तित हो जाता है, जिसके लिए LLM को बहु-चरणीय अनुमान और अन्वेषण प्रक्रिया के दौरान कई रिपॉजिटरी खोज उपकरणों का प्रभावी ढंग से उपयोग करने की आवश्यकता होती है। इस चुनौती का समाधान करने के लिए, यह शोधपत्र ToolTrain प्रस्तुत करता है, जो एक द्वि-चरणीय उपकरण-एकीकरण प्रशिक्षण ढाँचा है जो अस्वीकृति-नमूना पर्यवेक्षित फ़ाइन-ट्यूनिंग और उपकरण-एकीकृत सुदृढीकरण अधिगम को संयोजित करता है। प्रायोगिक परिणाम दर्शाते हैं कि ToolTrain से प्रशिक्षित मॉडल अत्याधुनिक प्रदर्शन प्राप्त करते हैं, जिसमें 32B मॉडल फ़ंक्शन-स्तरीय स्थानीयकरण में क्लाउड-3.7 से बेहतर प्रदर्शन करता है। इसके अलावा, हम प्रदर्शित करते हैं कि बेहतर स्थानीयकरण प्रदर्शन बेहतर एंड-टू-एंड समस्या समाधान में परिवर्तित होता है, जो दर्शाता है कि समस्या स्थानीयकरण के लिए प्रशिक्षण स्वचालित सॉफ़्टवेयर विकास में सुधार के लिए एक व्यवहार्य और प्रभावी रणनीति है।