대규모 언어 모델의 발전으로 대화 시스템이 정보 제공 도구에서 정서적 동반자로 변화하며, 사용자에게 개인화된 정서적 지원을 제공하는 Emotional Companionship Dialogue Systems (ECDs) 시대가 열리고 있다. ECDs에 대한 명확한 정의와 체계적인 평가 기준이 부족하여, 본 연구에서는 ECDs의 정의를 제시하고, "능력 계층-과제 계층(3단계)-데이터 계층-방법 계층"의 설계 원칙을 기반으로 최초의 ECD 평가 벤치마크인 MoodBench 1.0을 설계 및 구현했다. MoodBench 1.0을 통해 30개의 주류 모델을 평가한 결과, MoodBench 1.0이 뛰어난 변별력을 갖추고 모델 간의 정서적 동반 능력 차이를 효과적으로 정량화할 수 있음을 입증했다. 또한, 현재 모델들이 심층적인 정서적 동반 능력에서 부족함을 보였으며, 이는 향후 기술 최적화를 위한 지침이 될 것이고, ECDs의 사용자 경험을 향상시키는 데 기여할 것이다.