Sign In

Large Language Models Are Effective Human Annotation Assistants, But Not Good Independent Annotators

Created by
  • Haebom
Category
Empty

저자

Feng Gu, Zongxia Li, Carlos Rafael Colon, Benjamin Evans, Ishani Mondal, Jordan Lee Boyd-Graber

개요

본 논문은 시장 변화 식별, 속보 모니터링, 사회적 동향 이해에 중요한 이벤트 주석 작업에 대해 다룬다. 전문가 주석 작업이 표준으로 여겨지지만, 비용과 시간이 많이 소요된다는 단점이 있다. 본 연구는 단일 문맥에 집중하는 기존 정보 추출 실험과 달리, 무관한 문서 제거, 동일 이벤트 문서 병합, 이벤트 주석을 포함하는 전체 워크플로우를 평가한다. 대규모 언어 모델(LLM) 기반 자동 주석은 기존 TF-IDF 기반 방법이나 Event Set Curation보다 성능이 우수하지만, 여전히 전문가 수준에는 미치지 못한다. 그러나 Event Set Curation에 LLM을 보조적으로 활용하면 변수 주석에 필요한 시간과 노력을 줄일 수 있으며, 특히 전문가 주석자들이 LLM이 추출한 이벤트 변수에 더 많이 동의한다는 것을 보여준다.

시사점, 한계점

시사점:
LLM을 활용한 이벤트 주석 보조 시스템이 전문가의 작업 효율성을 높일 수 있음을 시사.
LLM 기반 자동 주석은 기존 방법보다 성능이 우수하지만, 전문가 수준에는 미치지 못함.
LLM이 전문가의 이벤트 변수 추출을 보조하는 방식이 완전 자동화된 LLM 주석보다 전문가의 동의를 더 많이 얻음.
한계점:
LLM 기반 자동 주석은 여전히 전문가 수준의 정확도를 달성하지 못함.
LLM을 활용한 이벤트 주석 보조 시스템의 실제 효용성과 경제성에 대한 추가 연구 필요.
다양한 이벤트 유형 및 데이터셋에 대한 일반화 가능성 검증 필요.
👍