Bài báo này xem xét các cuộc đàm phán phức tạp, nhiều vòng sử dụng suy luận Chuỗi Tư duy (CoT) trong một mô hình ngôn ngữ quy mô lớn (LLM). Bài báo nêu bật những thiếu sót của các tác nhân LLM hiện có, vốn bỏ qua vai trò chức năng của biểu hiện cảm xúc. Các tác nhân này tạo ra các phản ứng cảm xúc thụ động, dựa trên sở thích, khiến chúng dễ bị thao túng và khai thác chiến lược bởi các đối tác của chúng. Để giải quyết vấn đề này, bài báo này trình bày EvoEmo, một khuôn khổ học tăng cường tiến hóa để tối ưu hóa biểu hiện cảm xúc động trong các cuộc đàm phán. EvoEmo mô hình hóa các chuyển đổi trạng thái cảm xúc như một quy trình quyết định Markov và sử dụng tối ưu hóa di truyền dựa trên quần thể để phát triển các chính sách cảm xúc mang lại lợi ích cao trong các tình huống đàm phán khác nhau. Hơn nữa, chúng tôi đề xuất một khuôn khổ đánh giá để so sánh các cuộc đàm phán có nhận thức cảm xúc bằng cách sử dụng hai đường cơ sở: chiến lược vani và chiến lược cảm xúc cố định. Các thí nghiệm mở rộng và nghiên cứu cắt bỏ chứng minh rằng EvoEmo luôn vượt trội hơn cả hai đường cơ sở, giúp tăng tỷ lệ thành công, hiệu quả và tiết kiệm chi phí cho người mua. Những kết quả này nhấn mạnh tầm quan trọng của việc thể hiện cảm xúc thích ứng trong việc tạo điều kiện cho các tác nhân LLM hiệu quả hơn cho các cuộc đàm phán nhiều vòng.