본 논문은 복잡하고 역동적인 환경에서 운영되는 소프트웨어 엔지니어링 작업을 위해, Monte Carlo Tree Search (MCTS)와 자기 개선 메커니즘을 통합한 다중 에이전트 프레임워크인 SWE-Search를 제안합니다. SWE-Search는 LLM을 활용한 하이브리드 가치 함수를 통해 수치적 평가와 정성적 평가를 모두 수행하며, 에이전트가 정량적 및 정성적 평가를 바탕으로 전략을 반복적으로 개선할 수 있도록 자기 피드백 루프를 구현합니다. SWE-Agent, Value Agent, Discriminator Agent의 세 가지 에이전트로 구성되며, SWE-bench 벤치마크에서 기존 오픈소스 에이전트 대비 23%의 성능 향상을 보였습니다. 더 깊은 탐색을 통한 추론 시간 증가에 따른 성능 향상을 보여주며, 대규모 모델이나 추가 학습 데이터 없이 소프트웨어 에이전트의 성능을 향상시킬 수 있는 가능성을 제시합니다.