본 논문은 역할극 수행 능력 향상을 위한 추론 기법 활용 가능성을 연구합니다. 6개의 역할극 벤치마크, 24개의 대규모 언어 모델(LLM), 3가지 역할극 전략(제로샷, Chain-of-Thought(CoT), 추론 최적화 LLM)을 사용하여 실험을 진행했습니다. 실험 결과, CoT는 역할극 성능을 저하시키고, 추론 최적화 LLM은 역할극에 부적합하며, 추론 능력은 역할극 확장 법칙을 방해한다는 것을 발견했습니다. 또한, 대규모 모델은 여전히 고급 역할극에 능숙하지 못하며, 중국어 역할극 성능이 영어보다 우수함을 확인했습니다. 마지막으로, 역할극 인식 CoT와 강화 학습을 활용한 향후 연구 방향을 제시합니다.