Sign In

Solving Word-Sense Disambiguation and Word-Sense Induction with Dictionary Examples

Created by
  • Haebom
Category
Empty

저자

Tadej \v{S}kvorc, Marko Robnik-\v{S}ikonja

개요

본 논문은 저자원 언어에서 대규모 특정 작업 데이터셋의 부족 문제를 해결하기 위해 사전과 같은 기존 언어 자원을 활용하는 방법을 제시합니다. 트랜스포머 기반 대규모 언어 모델(LLM)을 이용하여 저자원 언어의 어휘 의미 구분(WSD) 및 어휘 의미 유도(WSI) 작업을 수행합니다. 이를 위해 문맥 내 단어(WiC) 작업을 중간 단계로 활용하는데, WiC 작업은 두 문장과 대상 단어가 주어졌을 때, 대상 단어의 의미가 두 문장에서 다른지 여부를 예측하는 과제입니다. 사전 예시를 LLM을 이용하여 WiC 작업에 필요한 문장 쌍을 생성하고, 이를 통해 훈련된 모델을 WSD 및 WSI 작업에 적용하여 기존 모델보다 성능이 우수한 결과를 슬로베니아어를 대상으로 보여줍니다. WiC 작업은 기존 WSD, WSI 작업과 달리 각 의미에 대한 충분한 예시가 필요하지 않다는 장점이 있습니다.

시사점, 한계점

시사점:
저자원 언어의 어휘 의미 구분(WSD) 및 어휘 의미 유도(WSI) 문제 해결에 새로운 접근 방식 제시
기존 언어 자원(사전)을 효과적으로 활용하여 대규모 데이터셋 부족 문제 완화
LLM을 활용하여 WiC 작업을 위한 데이터 생성 및 WSD, WSI 작업 수행
슬로베니아어 실험을 통해 제안된 방법의 유효성 검증
WiC 작업을 중간 단계로 사용하여 WSD, WSI 작업의 성능 향상
한계점:
제안된 방법의 일반성: 슬로베니아어에 대한 실험 결과만 제시되어 다른 저자원 언어에 대한 일반화 가능성은 추가 연구 필요
LLM의 성능 의존성: LLM의 성능에 따라 결과의 질이 영향받을 수 있음
사전의 질에 대한 의존성: 사용하는 사전의 질에 따라 성능이 달라질 수 있음
WiC task의 한계: WiC task가 모든 WSD, WSI 문제를 완벽하게 반영하지 못할 가능성 존재
👍