Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Can one size fit all?: Measuring Failure in Multi-Document Summarization Domain Transfer

Created by
  • Haebom
Category
Empty

저자

Alexandra DeLucia, Mark Dredze

개요

본 논문은 다중 문서 요약(MDS) 모델의 다양한 학습 접근 방식(end-to-end, chunk-then-summarize, extract-then-summarize, GPT 스타일 모델)을 뉴스, 과학, 대화 세 가지 도메인에 걸쳐 평가합니다. 특히, 특정 도메인에서 학습된 모델이 다른 도메인의 문서를 요약하는 제로샷 도메인 전이 설정에서 어떻게 실패하는지, 그리고 왜 실패하는지를 분석합니다. 도메인 전이 실패는 사실성 감소, 목표와의 높은 편차, 요약 품질 저하로 정의됩니다. 또한, 기존 요약 평가 지표의 적용 가능성에 대한 문제점도 함께 살펴봅니다.

시사점, 한계점

시사점: 다양한 MDS 모델 학습 방식과 도메인 간 성능 차이를 분석하여 제로샷 도메인 전이 설정에서의 모델 성능 저하 원인을 규명함. 기존 요약 평가 지표의 한계점을 제시함.
한계점: 특정 평가 지표에 의존하여 도메인 전이 실패를 정의함으로써 주관적인 평가 가능성 존재. 분석에 사용된 도메인의 종류와 수가 제한적일 수 있음. 모델의 내부 메커니즘에 대한 심층적인 분석 부족.
👍