본 논문은 Universal Information Extraction (UIE)의 강건성을 향상시키기 위해 새로운 벤치마크 데이터셋, 종합적인 평가, 그리고 실행 가능한 해결책을 제시합니다. 기존 강건성 벤치마크 데이터셋은 단일 정보 추출(IE) 작업에 제한된 범위의 섭동만 생성하고, UIE 모델의 강건성을 효과적으로 평가하지 못하며, 작은 모델이나 수작업 규칙에 의존하여 비자연스러운 적대적 예시를 생성하는 두 가지 주요 한계점을 가지고 있습니다. 본 논문에서는 대규모 언어 모델(LLM)의 강력한 생성 능력을 고려하여, 다양하고 현실적인 섭동을 다양한 IE 작업에 걸쳐 생성하는 Robust UIE를 위한 새로운 벤치마크 데이터셋인 RUIE-Bench를 제시합니다. 이 데이터셋을 기반으로 기존 UIE 모델을 종합적으로 평가하여 LLM 기반 모델과 다른 모델 모두 상당한 성능 저하를 겪는다는 것을 밝힙니다. 강건성을 개선하고 훈련 비용을 줄이기 위해 모델의 추론 손실을 기반으로 어려운 샘플을 동적으로 선택하여 반복적인 훈련을 수행하는 데이터 증강 솔루션을 제안합니다. 실험 결과에 따르면 데이터의 15%만으로 훈련하는 경우 세 가지 IE 작업에서 평균 7.5%의 상대적 성능 향상을 가져옵니다.