Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Limited Generalizability in Argument Mining: State-Of-The-Art Models Learn Datasets, Not Arguments

Created by
  • Haebom

저자

Marc Feger, Katarina Boland, Stefan Dietze

개요

본 논문은 자동화된 담화 분석, 특히 정치적 논쟁, 온라인 토론, 과학적 추론과 같은 맥락에서 논증을 식별하는 것이 필수적이라는 점을 바탕으로, 최첨단 BERT 기반 변환기 모델들의 논증 식별 능력에 대한 대규모 재평가를 최초로 수행합니다. 17개의 영어 문장 수준 데이터셋을 사용하여 세 가지 표준 변환기 모델과 대조적 사전 훈련을 통해 일반화 능력을 향상시킨 한 가지 모델을 평가합니다. 연구 결과, 이러한 모델들이 내용어에 묶인 어휘적 지름길에 의존하는 경향이 있음을 보여주며, 명백한 진전이 실제 과제 정합성보다는 데이터셋 특유의 단서에 의해 주도될 수 있음을 시사합니다. 익숙한 벤치마크에서는 강력한 결과를 달성하지만, 보이지 않는 데이터셋에 적용하면 성능이 현저히 저하됩니다. 그러나 과제 특유의 사전 훈련과 공동 벤치마크 훈련을 통합하면 강건성과 일반화 능력을 향상시키는 데 효과적임을 보여줍니다.

시사점, 한계점

시사점: 과제 특유의 사전 훈련과 공동 벤치마크 훈련이 논증 식별 모델의 강건성과 일반화 능력 향상에 효과적임을 밝힘. 최첨단 모델의 일반화 능력에 대한 한계를 명확히 제시함으로써 향후 연구 방향을 제시.
한계점: 평가에 사용된 데이터셋이 영어 문장 수준 데이터셋에 국한됨. 다양한 언어 및 데이터 형태에 대한 일반화 능력은 추가 연구가 필요함. 모델이 어휘적 지름길에 의존하는 경향을 보이는 원인에 대한 심층적인 분석이 부족함.
👍