본 논문은 기존 감정 분석이 '어떤 감정인가'에만 초점을 맞춘 것과 달리, 감정의 원인을 분석하는 '감정 해석(Emotion Interpretation, EI)'이라는 새로운 접근법을 제안합니다. 명시적(관찰 가능한 객체, 대인 상호 작용 등) 또는 암시적(문화적 맥락, 화면 밖 사건 등) 인과 요인에 초점을 맞춰 감정 반응을 유발하는 요인을 추론하는 데 중점을 둡니다. 이를 위해 1,615개의 기본 EI 샘플과 50개의 복합 EI 샘플을 포함하는 대규모 벤치마크 EIBench를 제시하고, Vision-Language Model(VLLM)을 이용한 고품질 레이블 생성을 위한 Coarse-to-Fine Self-Ask (CFSA) 주석 파이프라인을 제안합니다. 다양한 실험 설정에서 오픈소스 및 독점적 대규모 언어 모델을 평가한 결과, 복잡한 시나리오에서 특히 성능 차이가 크게 나타나 EI가 공감 능력이 있고 맥락을 인식하는 AI 애플리케이션을 풍부하게 할 수 있는 잠재력을 보여줍니다. EIBench 및 관련 방법론은 공개적으로 제공됩니다.
시사점, 한계점
•
시사점:
◦
감정의 원인을 분석하는 새로운 감정 분석 패러다임인 EI 제시
◦
대규모 감정 해석 벤치마크 EIBench 제공
◦
고품질 레이블 생성을 위한 효율적인 주석 파이프라인 CFSA 개발
◦
EI 연구를 위한 기반 마련 및 공감 능력과 맥락 인식 능력 향상에 기여
◦
다양한 VLLM의 성능 비교를 통한 EI 연구의 방향 제시
•
한계점:
◦
EIBench의 샘플 수가 복잡한 EI 샘플에 비해 기본 EI 샘플에 치우쳐 있을 수 있음.
◦
CFSA 파이프라인의 일반화 가능성 및 다양한 감정 유형에 대한 적용성에 대한 추가 연구 필요.
◦
복잡한 감정 시나리오에 대한 VLLM의 성능 개선을 위한 추가적인 연구 필요.
◦
현재 벤치마크와 모델의 한계로 인해, 실제 세계의 복잡하고 다양한 감정 표현을 완벽하게 포착하지 못할 가능성 존재.