온라인 의사소통에서 감정과 암묵적 의도를 전달하는 데 널리 사용되는 스티커를 대화 맥락에 가장 적합하게 선택하는 스티커 응답 선택(SRS) 작업을 연구합니다. 기존 방법론의 한계점인 감정과 의도를 개별적으로 모델링하여 발생할 수 있는 불일치 문제를 해결하기 위해, 본 논문은 감정과 의도를 공동으로 모델링하는 Emotion and Intention Guided Multi-Modal Learning (EIGML) 프레임워크를 제안합니다. EIGML은 Dual-Level Contrastive Framework를 활용하여 감정 및 의도적 특징의 일관된 표현을 보장하고, Intention-Emotion Guided Multi-Modal Fusion 모듈을 통해 감정 및 의도 정보를 점진적으로 통합합니다. 두 개의 공개 SRS 데이터셋에 대한 실험 결과, EIGML은 기존 최첨단 기준선을 능가하며 감정 및 의도적 특징에 대한 더 나은 이해를 보여줍니다.
시사점, 한계점
•
시사점:
◦
감정과 의도를 공동으로 모델링하여 스티커 선택 정확도 향상.
◦
Dual-Level Contrastive Framework를 통한 감정 및 의도적 특징의 일관된 표현.
◦
Intention-Emotion Guided Multi-Modal Fusion 모듈을 통한 풍부한 정보 통합.