본 논문은 대규모 언어 모델(LLM)의 도구 학습(tool learning)에서 안정성, 확장성, 현실성을 향상시키기 위해 MirrorAPI 프레임워크를 제안합니다. MirrorAPI는 7,000개 이상의 API의 요청-응답 쌍 데이터셋을 사용하여, 실제 API 응답을 정확하게 시뮬레이션하는 전문화된 LLM을 훈련합니다. 지도 학습 미세조정과 사고 연쇄(chain-of-thought) 추론을 통해 시뮬레이션 정확도를 높였으며, 새롭게 구축된 MirrorAPI-Bench 및 StableToolBench에서 기존 최고 성능 방법보다 우수한 정확도와 안정성을 달성했습니다.