Este artículo aborda la localización de problemas de software, el proceso de identificar las ubicaciones del código que requieren modificaciones para resolverlos. La brecha semántica entre las descripciones de problemas en lenguaje natural y el código defectuoso requiere un razonamiento complejo de varios pasos mediante las dependencias del código. Los agentes existentes basados en LLM intentan abordar este problema integrando herramientas de búsqueda en repositorios, pero esto se traduce en una tarea compleja conocida como "Búsqueda Profunda en Repositorios", que requiere que los LLM aprovechen eficazmente múltiples herramientas de búsqueda en repositorios a lo largo del proceso de inferencia y exploración. Para abordar este desafío, este artículo presenta ToolTrain, un marco de entrenamiento de integración de herramientas en dos pasos que combina el ajuste fino supervisado con muestreo de rechazo y el aprendizaje de refuerzo integrado en herramientas. Los resultados experimentales demuestran que los modelos entrenados con ToolTrain alcanzan un rendimiento de vanguardia, con el modelo 32B superando a Claude-3.7 en la localización a nivel de función. Además, demostramos que un mejor rendimiento de la localización se traduce en una mejor resolución de problemas de principio a fin, lo que demuestra que el entrenamiento para la localización de problemas es una estrategia viable y eficaz para mejorar el desarrollo automatizado de software.