본 논문은 대규모 언어 모델(LLM)을 Git bisect 프로세스에 통합하여 의미론적 결함 위치 파악을 위한 새로운 프레임워크를 제시한다. 전통적인 bisect의 한계를 극복하기 위해, 본 연구에서는 LLM을 활용한 구조화된 사고 연쇄 추론을 통해 잡음 환경에서도 커밋 단위 분석을 수행한다. 다양한 LLM을 평가하고, DeepSeekCoderV2를 의미론적으로 레이블된 diff 데이터셋으로 fine-tuning 했다. 약한 지도 학습 워크플로우를 채택하여 주석 부담을 줄이고, 사람이 개입하는 수정 및 자체 일관성 필터링을 통합했다. 여러 오픈 소스 프로젝트에서 실험을 통해 성공률을 6.4% 향상시켰으며, bisect 실패 횟수를 줄이고 평균 bisect 시간을 최대 2배까지 단축했다.