본 논문은 소프트웨어 이슈 지역화(issue localization), 즉 소프트웨어 문제 해결을 위해 수정이 필요한 코드 위치를 식별하는 과정을 다룹니다. 자연어로 된 이슈 설명과 결함이 있는 코드 간의 의미 차이로 인해 코드 의존성을 통한 복잡한 다단계 추론이 필요합니다. 기존의 LLM 기반 에이전트는 저장소 검색 도구를 통합하여 이 문제를 해결하려고 시도하지만, 이는 LLM이 다단계 추론 및 탐색 과정에서 다양한 저장소 검색 도구를 효과적으로 활용해야 하는 'Repo Deep Search'라는 어려운 작업으로 변환됩니다. 이러한 문제를 해결하기 위해 본 논문은 거부 샘플링(rejection-sampled) 감독 미세 조정과 도구 통합 강화 학습을 결합한 2단계 도구 통합 훈련 프레임워크인 ToolTrain을 제시합니다. 실험 결과, ToolTrain으로 훈련된 모델은 최첨단 성능을 달성하며, 32B 모델은 함수 수준 지역화에서 Claude-3.7을 능가합니다. 또한 지역화 성능 향상은 종단 간 이슈 해결 성능 향상으로 이어짐을 보여주며, 이슈 지역화를 위한 훈련이 자동화된 소프트웨어 개발을 개선하는 실행 가능하고 효과적인 전략임을 보여줍니다.