본 논문은 대규모 언어 모델(LLM)에서 사고연쇄(CoT) 추론을 이용한 복잡하고 다회차에 걸친 협상에 대한 연구를 바탕으로, 기존 LLM 에이전트의 감정 표현의 기능적 역할 간과 문제점을 지적한다. 기존 에이전트들은 수동적이고 선호도에 기반한 감정 반응을 생성하여 상대방의 조작과 전략적 이용에 취약하다는 것이다. 이를 해결하기 위해, 본 논문은 협상에서 역동적인 감정 표현을 최적화하는 진화 강화 학습 프레임워크인 EvoEmo를 제시한다. EvoEmo는 감정 상태 전이를 마르코프 의사 결정 과정으로 모델링하고, 다양한 협상 시나리오에서 높은 보상을 얻는 감정 정책을 진화시키기 위해 개체군 기반 유전적 최적화를 사용한다. 또한, 기준 전략(vanilla strategies)과 고정된 감정 전략(fixed-emotion strategies) 두 가지 기준선을 사용하여 감정 인식 협상을 벤치마킹하기 위한 평가 프레임워크를 제안한다. 광범위한 실험과 ablation study를 통해 EvoEmo가 두 기준선보다 일관되게 우수한 성능을 보이며, 성공률, 효율성, 구매자 절감액을 높이는 것을 보여준다. 이러한 결과는 다회차 협상을 위한 더 효과적인 LLM 에이전트를 가능하게 하는 적응적인 감정 표현의 중요성을 강조한다.