Sign In

Multilingual Target-Stance Extraction

Created by
  • Haebom
Category
Empty

저자

Ethan Mines, Bonnie Dorr

개요

본 논문은 사회적 미디어를 통해 논쟁적인 이슈에 대한 대중의 의견을 데이터 기반으로 분석하는 것을 목표로 한다. 특히, 문서에서 언급된 대상(Target)과 해당 대상에 대한 문서의 입장을 파악하는 Target-Stance Extraction (TSE)을 연구한다. 기존 TSE 연구는 영어에 국한되었으나, 본 논문은 카탈루냐어, 에스토니아어, 프랑스어, 이탈리아어, 만다린어, 스페인어를 포함하는 최초의 다국어 TSE 벤치마크를 제시한다. 별도의 언어별 모델 없이 기존 TSE 파이프라인을 다국어 환경으로 확장하는 데 성공했으며, F1 점수 12.78을 기록했다. 이는 다국어 환경의 어려움을 보여주며, 대상 예측의 중요성을 강조한다. 또한, TSE의 F1 점수가 다양한 대상 표현에 민감하다는 것을 처음으로 입증했다.

시사점, 한계점

최초의 다국어 TSE 벤치마크 제시
다국어 환경에서 기존 TSE 파이프라인 확장
다국어 환경의 어려움과 대상 예측의 중요성 강조
대상 표현의 다양성에 따른 F1 점수 민감도 입증
낮은 F1 점수 (12.78)는 개선의 여지를 보여줌
대상 예측이 주요 병목 현상임을 시사
언어별 모델을 사용하지 않은 단일 모델의 한계
👍