본 논문은 대규모 추론 모델(LRMs)의 등장이 기존의 실행 중심적인 대규모 언어 모델(LLMs) 기반 에이전트 프레임워크를 어떻게 변화시키는지 탐구한다. LaRMA 프레임워크를 제안하여 도구 사용, 계획 설계, 문제 해결 등 9가지 작업을 통해 3개의 주요 LLM과 5개의 주요 LRM을 평가한다. 연구 결과, LRMs는 계획 설계와 같은 추론 집약적인 작업에서 LLM보다 우수하며, 반복적인 반성을 통해 더 나은 결과를 얻는다는 것을 보여준다. 반면, LLM은 도구 사용과 같은 실행 중심적인 작업에서 효율성 측면에서 뛰어나다. 또한, LLM을 행위자로, LRM을 반성자로 사용하는 하이브리드 구성이 실행 속도와 추론 깊이를 결합하여 에이전트 성능을 최적화한다는 것을 발견했다. 하지만 LRMs의 향상된 추론은 높은 계산 비용, 긴 처리 시간, 과도한 사고 및 사실 무시 경향과 같은 행동상의 문제를 야기한다. 이 연구는 향후 에이전트 설계 발전을 위한 중요한 기반을 마련하며, LRMs의 심층 사고와 과도한 사고 사이의 균형에 대한 더 깊은 연구를 촉구한다.