본 논문은 "How does this feature work?" 또는 "Where was the bug introduced?" 와 같은 질문에 대한 답변을 찾기 위해, 개발자와 AI 코딩 어시스턴트가 적절한 소스 파일을 찾는 데 어려움을 겪는 문제를 해결하고자 한다. 이를 위해 강력한 LLM (Qwen3-8B)을 QLoRA 및 Unsloth 최적화를 사용하여 미세 조정하여 자연어 질의에서 관련 파일 경로를 직접 예측하는 방법을 제시한다. 훈련 데이터를 구축하기 위해 AST 구조 및 리포지토리 내용을 사용하여 현실적인 질문-답변 쌍을 생성하는 6가지 코드 인식 전략을 도입했다. Python 프로젝트 (Flask, Click, Jinja, FastAPI, PyTorch 등)에 대해 미세 조정을 수행했으며, 높은 검색 정확도를 얻었다. PyTorch와 같은 대규모 코드베이스에서도 확장성을 보여준다.