Sign In

LASTIST: LArge-Scale Target-Independent STance dataset

Created by
  • Haebom
Category
Empty

저자

DongJae Kim, Yaejin Lee, Minsu Park, Eunil Park

개요

본 연구는 한국어 저자료 환경에서 스탠스 감지 연구의 격차를 해소하기 위해 Large-Scale Target-Independent STance (LASTIST) 데이터 세트를 제안한다. 한국 정당의 보도자료에서 수집된 563,299개의 레이블링된 한국어 문장을 포함하며, 대상 독립적 스탠스 감지 및 시간적 변화 스탠스 감지와 같은 다양한 스탠스 감지 작업에 활용될 수 있도록 설계되었다. 연구에서는 데이터 세트 구축 과정과 최신 딥러닝 및 스탠스 감지 모델 학습에 대한 자세한 설명을 제공한다.

시사점, 한계점

시사점:
한국어 저자료 환경에서 스탠스 감지 연구를 위한 대규모 데이터 세트 제공.
대상 독립적 스탠스 감지 및 시간적 변화 스탠스 감지 연구 가능성 제시.
데이터 세트 구축 과정 및 모델 학습 방법론 제공.
한계점:
연구가 특정 분야(정치)에 한정되어 다른 분야로의 일반화에 대한 추가 연구 필요.
데이터 세트의 편향성 (양당의 보도자료)에 대한 고려 필요.
모델의 성능 평가에 대한 구체적인 내용 부족.
👍