Sign In

Discourse-Aware Scientific Paper Recommendation via QA-Style Summarization and Multi-Level Contrastive Learning

Created by
  • Haebom
Category
Empty

저자

Shenghua Wang, Zhen Yin

개요

OA(Open-Access) 출판물의 급증으로 인해 관련 과학 논문을 식별하는 것이 어려워짐에 따라, 본 논문은 텍스트 정보에만 의존하는 content-based 추천에 초점을 맞추어, 논문의 담론 구조를 고려하지 않는 기존 모델의 한계를 극복하고자 함. 이를 위해 QA 스타일의 OMRC(Objective, Method, Result, Conclusion) 요약, 다단계 대비 학습, 구조 인식 재순위 지정을 통합하는 계층적 프레임워크인 OMRC-MR을 제안함. 이 프레임워크는 QA 스타일 요약을 통해 논문을 구조화된 표현으로 변환하고, 다단계 대비 학습을 통해 의미론적 표현을 정렬하며, 재순위 지정을 통해 검색 정밀도를 개선함. DBLP, S2ORC 및 새로 구축된 Sci-OMRC 데이터 세트에 대한 실험을 통해 OMRC-MR이 기존 SOTA(State-of-the-Art) 모델을 능가하며, Precision@10 및 Recall@10에서 최대 7.2% 및 3.8% 개선을 달성했음을 확인함.

시사점, 한계점

시사점:
QA 스타일 요약을 통해 보다 일관되고 사실적인 표현을 생성하여 논문 추천의 성능을 향상시킴.
다단계 대비 학습 및 구조 인식 재순위 지정을 통해 추천의 정확도를 높임.
DBLP, S2ORC, Sci-OMRC 데이터셋에서 SOTA 모델을 능가하는 성능을 보임.
신뢰할 수 있고 개인 정보 보호를 고려한 학술 정보 검색의 발전을 이끌 수 있는 통합적이고 해석 가능한 content-based 패러다임을 제시함.
한계점:
구체적인 한계점은 논문에 명시되지 않음.
👍