Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Towards Explainable Temporal Reasoning in Large Language Models: A Structure-Aware Generative Framework

Created by
  • Haebom

저자

Zihao Jiang, Ben Liu, Miao Peng, Wenjie Xu, Yao Xiao, Zhenyan Shan, Min Peng

개요

본 논문은 대규모 언어 모델(LLM)의 시간적 추론 능력을 평가하고 향상시키는 연구에 관한 논문입니다. 기존 연구들이 성능 향상에만 집중하는 경향이 있던 것과 달리, 본 논문은 LLM의 시간적 추론 과정에 대한 설명 가능성에 초점을 맞춥니다. 다양한 시간적 세분성을 포괄하는 종합적인 벤치마크를 제시하여 LLM의 설명 가능한 시간적 추론 능력을 체계적으로 평가하고, 텍스트 정보만으로는 설득력 있는 설명을 생성하는 데 어려움을 겪는다는 점을 밝힙니다. 이러한 문제를 해결하기 위해, 그래프 구조와 텍스트를 통합하는 새로운 구조 인식 생성 프레임워크인 GETER을 제안합니다. GETER은 시간적 지식 그래프를 활용하여 질의에 대한 구조적 정보를 포착하고, 그래프 구조 특징을 텍스트 임베딩 공간에 매핑하는 구조-텍스트 접두사 어댑터를 도입합니다. 최종적으로, 소프트 그래프 토큰과 instruction-tuning 프롬프트 토큰을 원활하게 통합하여 LLM이 설명 텍스트를 생성하도록 합니다. 실험 결과, GETER은 최첨단 성능을 달성하며 효과성과 강력한 일반화 능력을 보여줍니다. 데이터셋과 코드는 https://github.com/carryTatum/GETER 에서 공개됩니다.

시사점, 한계점

시사점:
LLM의 설명 가능한 시간적 추론 능력 평가를 위한 종합적인 벤치마크 제시
텍스트 정보만으로는 LLM의 설명 가능성이 부족하다는 점을 밝힘
그래프 구조와 텍스트를 통합하는 새로운 프레임워크 GETER 제안 및 성능 검증
GETER의 우수한 성능과 일반화 능력 확인
공개된 데이터셋과 코드를 통한 연구의 재현성 및 확장성 확보
한계점:
GETER의 성능 향상이 특정 데이터셋에 국한될 가능성
다양한 유형의 시간적 추론 문제에 대한 GETER의 일반화 능력에 대한 추가 연구 필요
시간적 지식 그래프의 완전성 및 정확성에 대한 의존성
복잡한 시간적 추론 문제에 대한 GETER의 확장성 및 효율성 평가 필요
👍