본 논문은 복잡하고 동적인 환경에서 자동화된 갈등 해결 및 합의 형성을 목표로 하는 종단간 다중 에이전트 강화 학습(MARL) 프레임워크인 Dialogue Diplomats를 소개합니다. 이 프레임워크는 심층 강화 학습 아키텍처와 대화 기반 협상 프로토콜을 통합하여 자율 에이전트가 반복적인 의사 소통과 전략적 적응을 통해 정교한 갈등 해결을 수행할 수 있도록 합니다. 주요 기여는 다음과 같습니다: 1) 에이전트 간 의존성 및 갈등 역학을 모델링하기 위해 어텐션 메커니즘과 그래프 신경망을 결합한 새로운 계층적 합의 네트워크(HCN) 아키텍처, 2) 적응형 양보 전략을 통해 다중 라운드 대화 상호 작용을 구성하는 Progressive Negotiation Protocol (PNP), 3) 개별 에이전트 목표와 집단적 합의 목표의 균형을 맞추는 Context-Aware Reward Shaping 메커니즘.