본 논문은 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)의 신뢰성과 확장성 문제를 해결하기 위해, Git과 유사한 롤백 및 브랜칭 기능을 제공하는 AgentGit 프레임워크를 제시한다. LangGraph 기반으로 구축된 AgentGit은 상태 커밋, 되돌리기, 브랜칭을 지원하여 에이전트가 여러 궤적을 효율적으로 탐색, 비교, 탐험할 수 있도록 한다. AgentGit의 성능 평가를 위해, 더 나은 프롬프트를 선택하여 대상 에이전트를 최적화하는 실험을 수행하였다. 실제 작업(논문 초록 검색 및 분석)에 대한 A/B 테스트를 통해 LangGraph, AutoGen, Agno의 세 가지 기준선과 비교한 결과, AgentGit이 중복 계산을 현저히 줄이고, 런타임 및 토큰 사용량을 감소시키며, 여러 브랜치에서 병렬 탐색을 지원하여 MAS 개발의 신뢰성과 확장성을 향상시킴을 확인했다.