이 논문은 추천 시스템 평가의 기존 오프라인 A/B 테스트 방식이 온라인 성능과의 괴리가 있다는 문제를 지적하며, LLM 기반의 에이전트 시뮬레이션을 제안합니다. 제안된 ContextSim 프레임워크는 시간, 장소, 니즈와 같은 맥락적 요소를 고려하여 일상생활 활동에 기반한 현실적인 사용자 프록시를 시뮬레이션합니다. 이를 통해 기존 방법론보다 인간 행동과 더 유사한 상호작용을 생성하고, 실제 추천 시스템 성능 향상으로 이어짐을 실험적으로 검증했습니다.