Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Cross-Document Cross-Lingual Natural Language Inference via RST-enhanced Graph Fusion and Interpretability Prediction

Created by
  • Haebom

저자

Mengying Yuan, Wangzi Xuan, Fei Li

개요

본 논문은 다중 문서, 다국어 환경에서의 자연어 추론(NLI) 문제인 Cross-Document Cross-Lingual NLI (CDCL-NLI)에 대한 새로운 패러다임을 제시합니다. 기존 NLI의 능력을 다 문서, 다국어 시나리오로 확장하기 위해, 26개 언어를 포함하는 1,110개 인스턴스의 고품질 CDCL-NLI 데이터셋을 구축했습니다. 또한, RST(Rhetorical Structure Theory) 기반의 RGAT(Relation-aware Graph Attention Network)를 사용한 문서 간 맥락 모델링과 어휘 사슬을 기반으로 한 구조 인식 의미 정렬 메커니즘을 통합한 혁신적인 방법을 제안하여 기준 모델을 구축했습니다. 추론 해석성을 위해 EDU(Elementary Discourse Unit) 수준의 추출형 설명을 생성하는 프레임워크를 개발했습니다. 실험 결과, DocNLI, R2F와 같은 기존 NLI 모델 및 Llama3, GPT-4o와 같은 대형 언어 모델보다 성능이 우수함을 보였습니다. 본 연구는 NLI 연구에 새로운 시각을 제시하고, 다 문서 다국어 맥락 이해, 의미 검색 및 해석 가능한 추론에 대한 연구 관심을 불러일으킬 것입니다.

시사점, 한계점

시사점:
CDCL-NLI라는 새로운 과제를 제시하고, 이를 위한 고품질 데이터셋을 구축함.
RST와 RGAT를 결합한 혁신적인 CDCL-NLI 모델을 제안하고, 우수한 성능을 입증함.
EDU 수준의 추출형 설명을 제공하여 NLI의 해석성을 향상시킴.
다 문서 다국어 맥락 이해, 의미 검색 및 해석 가능한 추론 연구에 기여함.
한계점:
데이터셋의 규모가 상대적으로 작음 (1,110 인스턴스).
제안된 방법의 일반화 성능에 대한 추가적인 평가가 필요함.
특정 언어 또는 문서 유형에 대한 편향이 존재할 가능성이 있음.
👍