SEDA: A Self-Adapted Entity-Centric Data Augmentation for Boosting Gird-based Discontinuous NER Models
Created by
Haebom
Category
Empty
저자
Wen-Fang Su, Hsiao-Wei Chou, Wen-Yang Lin
개요
자연어 처리의 핵심 과제인 개체명 인식(NER)에서, 특히 불연속 개체에 대한 어려움을 해결하고자 함. 텍스트 분할의 문제점을 해결하기 위해 이미지 데이터 증강 기법을 그리드 기반 모델에 통합하여 불연속 개체 인식 능력을 향상시킴. CADEC, ShARe13, ShARe14 데이터셋에서 1-2.5%의 F1 점수 향상, 불연속 개체에 대해서는 3.7-8.4% 향상을 달성.
시사점, 한계점
•
시사점:
◦
이미지 데이터 증강 기법을 NER 모델에 적용하여 불연속 개체 인식 성능을 향상시킴.
◦
그리드 기반 모델의 유연한 태깅 방식과 이미지 데이터 증강 기법의 결합을 통해 텍스트 분할 문제 해결.