Sign In

Towards Robust Universal Information Extraction: Benchmark, Evaluation, and Solution

Created by
  • Haebom
Category
Empty

저자

Jizhao Zhu, Akang Shi, Zixuan Li, Long Bai, Xiaolong Jin, Jiafeng Guo, Xueqi Cheng

개요

본 논문은 Universal Information Extraction (UIE)의 강건성을 향상시키기 위해 새로운 벤치마크 데이터셋, 종합적인 평가, 그리고 실행 가능한 해결책을 제시합니다. 기존 강건성 벤치마크 데이터셋은 단일 정보 추출(IE) 작업에 제한된 범위의 섭동만 생성하고, UIE 모델의 강건성을 효과적으로 평가하지 못하며, 작은 모델이나 수작업 규칙에 의존하여 비자연스러운 적대적 예시를 생성하는 두 가지 주요 한계점을 가지고 있습니다. 본 논문에서는 대규모 언어 모델(LLM)의 강력한 생성 능력을 고려하여, 다양하고 현실적인 섭동을 다양한 IE 작업에 걸쳐 생성하는 Robust UIE를 위한 새로운 벤치마크 데이터셋인 RUIE-Bench를 제시합니다. 이 데이터셋을 기반으로 기존 UIE 모델을 종합적으로 평가하여 LLM 기반 모델과 다른 모델 모두 상당한 성능 저하를 겪는다는 것을 밝힙니다. 강건성을 개선하고 훈련 비용을 줄이기 위해 모델의 추론 손실을 기반으로 어려운 샘플을 동적으로 선택하여 반복적인 훈련을 수행하는 데이터 증강 솔루션을 제안합니다. 실험 결과에 따르면 데이터의 15%만으로 훈련하는 경우 세 가지 IE 작업에서 평균 7.5%의 상대적 성능 향상을 가져옵니다.

시사점, 한계점

시사점:
LLM을 활용하여 다양하고 현실적인 섭동을 생성하는 새로운 Robust UIE 벤치마크 데이터셋(RUIE-Bench)을 제시.
기존 UIE 모델의 취약점을 밝히고, 데이터 증강 기법을 통한 성능 향상 가능성을 제시.
데이터의 15%만 사용하여 효율적인 훈련이 가능함을 실험적으로 증명.
한계점:
RUIE-Bench 데이터셋의 생성 과정 및 규모에 대한 자세한 설명 부족.
제안된 데이터 증강 기법의 일반화 성능 및 다른 UIE 모델에 대한 적용 가능성에 대한 추가 연구 필요.
다양한 종류의 섭동 및 IE 작업에 대한 포괄적인 실험이 필요할 수 있음.
👍