Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Wiki-TabNER: Integrating Named Entity Recognition into Wikipedia Tables

Created by
  • Haebom
Category
Empty

저자

Aneta Koleva, Martin Ringsquandl, Ahmed Hatem, Thomas Runkler, Volker Tresp

개요

본 논문은 기존 표 해석 작업용 데이터셋의 단순화 문제를 지적하며, 보다 현실적인 복잡한 표를 포함하는 새로운 데이터셋 Wiki-TabNER를 제시합니다. Wiki-TabNER는 셀당 여러 개체를 포함하고 DBpedia 클래스를 사용하여 명명된 개체를 라벨링한 것이 특징입니다. 표 내부의 명명된 개체 인식(NER) 작업을 위한 설계이지만, 개체 연결 작업 평가에도 활용 가능합니다. 본 논문에서는 Wiki-TabNER 데이터셋의 특징과 라벨링 과정, 그리고 대규모 언어 모델 평가를 위한 프롬프팅 프레임워크를 설명하고, 모델의 어려움과 데이터셋의 한계를 분석하는 질적 분석 결과를 제시합니다.

시사점, 한계점

시사점:
현실적인 복잡성을 반영하는 새로운 표 데이터셋 Wiki-TabNER 제공
표 내 NER 작업 평가를 위한 새로운 기준 마련
대규모 언어 모델의 표 해석 성능 평가를 위한 프롬프팅 프레임워크 제시
표 해석 모델의 한계점과 데이터셋 개선 방향에 대한 통찰 제공
한계점:
Wiki-TabNER 데이터셋의 규모 및 다양성 제한 (향후 확장 필요성)
제시된 프롬프팅 프레임워크의 일반화 가능성 제한 (특정 모델/과제에 대한 최적화 가능성)
질적 분석의 주관성 (객관적인 평가 지표 추가 필요)
👍