TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning

Created by

Haebom

저자

Zihao Jiang, Miao Peng, Zhenyan Shan, Wenjie Xu, Ben Liu, Gong Chen, Ziqi Gao, Min Peng

💡 개요

본 논문은 시계열 지식 그래프(TKG) 상에서 시간 제약이 복잡한 질문에 답하는 TKGQA 문제를 해결하기 위해 TKG-Thinker라는 새로운 에이전트를 제안합니다. TKG-Thinker는 LLM의 한계점인 환각 현상과 정적 프롬프팅 문제를 해결하기 위해 자율적인 계획 및 적응형 검색 기능을 갖추고, TKG 환경과의 동적 다중 턴 상호작용을 통해 깊이 있는 시간 추론을 수행합니다.

🔑 시사점 및 한계

•

LLM의 TKGQA 성능 향상: TKG-Thinker는 LLM이 복잡한 시간 제약 하에서도 더 정확하고 자율적인 추론을 할 수 있도록 지원합니다.

•

동적 추론 능력 강화: 정적 프롬프팅 방식에서 벗어나 TKG 환경과의 상호작용을 통해 추론 정책을 최적화함으로써 모델의 일반화 성능을 높였습니다.

•

복잡한 시간 제약 문제: 제안된 방법론이 매우 복잡하거나 모호한 시간적 관계를 가진 TKGQA 문제에 대해 어느 정도의 한계를 가질 수 있으며, 이에 대한 추가적인 연구가 필요할 수 있습니다.

PDF 보기

Made with Slashpage