Sign In

KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering

Created by
  • Haebom
Category
Empty

저자

Kibeom Nam

개요

본 논문은 한국어 산업 리뷰에 대한 측면 기반 감정 분석(ABSA) 연구의 부족을 해결하기 위해 저자원 언어인 한국어를 위한 직관적이고 효과적인 ABSA 프레임워크를 제안한다. 번역된 벤치마크 데이터와 비표제 한국어 데이터를 통합하여 예측 레이블을 최적화하는 방법을 제시한다. 번역된 데이터로 미세 조정된 모델을 사용하여 실제 한국어 NLI 집합에 의사 레이블을 부여하고, LaBSE 및 MSP 기반 필터링을 적용하여 측면 범주 탐지 및 극성 결정을 향상시킨다. 이중 필터링을 통합하여 데이터셋 간격을 해소하고 최소한의 자원으로 특징 정렬을 용이하게 한다. 고자원 데이터셋을 활용하여 저자원 언어 국가의 기업 또는 개인 커뮤니티 내에서 신뢰할 수 있는 예측 및 정제된 모델을 개발하는 것을 목표로 한다. 영어 ABSA와 비교하여 약 3%의 F1 점수 및 정확도 차이를 보였다. 한국어 ABSA를 위한 데이터셋과 코드를 공개할 예정이다.

시사점, 한계점

시사점:
저자원 언어인 한국어에 대한 효과적인 ABSA 프레임워크 제시
번역 데이터와 비표제 데이터 통합을 통한 예측 성능 향상
LaBSE 및 MSP 기반 필터링을 활용한 특징 정렬 및 성능 개선
한국어 ABSA를 위한 데이터셋 및 코드 공개를 통한 연구 확장 가능성 제시
고자원 언어 데이터셋을 활용한 저자원 언어 모델 개발 전략 제시
한계점:
영어 ABSA와 비교하여 여전히 약 3%의 성능 차이 존재
의사 레이블링에 대한 의존도로 인한 성능 저하 가능성
제안된 프레임워크의 일반화 성능에 대한 추가적인 검증 필요
다양한 산업 분야 및 리뷰 유형에 대한 일반화 가능성에 대한 추가 연구 필요
👍