Sign In

TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning

Created by
  • Haebom
Category
Empty

μ €μž

Zihao Jiang, Miao Peng, Zhenyan Shan, Wenjie Xu, Ben Liu, Gong Chen, Ziqi Gao, Min Peng

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ‹œκ³„μ—΄ 지식 κ·Έλž˜ν”„(TKG) μƒμ—μ„œ μ‹œκ°„ μ œμ•½μ΄ λ³΅μž‘ν•œ μ§ˆλ¬Έμ— λ‹΅ν•˜λŠ” TKGQA 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ TKG-ThinkerλΌλŠ” μƒˆλ‘œμš΄ μ—μ΄μ „νŠΈλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. TKG-ThinkerλŠ” LLM의 ν•œκ³„μ μΈ ν™˜κ° ν˜„μƒκ³Ό 정적 ν”„λ‘¬ν”„νŒ… 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 자율적인 κ³„νš 및 μ μ‘ν˜• 검색 κΈ°λŠ₯을 κ°–μΆ”κ³ , TKG ν™˜κ²½κ³Όμ˜ 동적 닀쀑 ν„΄ μƒν˜Έμž‘μš©μ„ 톡해 깊이 μžˆλŠ” μ‹œκ°„ 좔둠을 μˆ˜ν–‰ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM의 TKGQA μ„±λŠ₯ ν–₯상: TKG-ThinkerλŠ” LLM이 λ³΅μž‘ν•œ μ‹œκ°„ μ œμ•½ ν•˜μ—μ„œλ„ 더 μ •ν™•ν•˜κ³  자율적인 좔둠을 ν•  수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€.
β€’
동적 μΆ”λ‘  λŠ₯λ ₯ κ°•ν™”: 정적 ν”„λ‘¬ν”„νŒ… λ°©μ‹μ—μ„œ λ²—μ–΄λ‚˜ TKG ν™˜κ²½κ³Όμ˜ μƒν˜Έμž‘μš©μ„ 톡해 μΆ”λ‘  정책을 μ΅œμ ν™”ν•¨μœΌλ‘œμ¨ λͺ¨λΈμ˜ μΌλ°˜ν™” μ„±λŠ₯을 λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
λ³΅μž‘ν•œ μ‹œκ°„ μ œμ•½ 문제: μ œμ•ˆλœ 방법둠이 맀우 λ³΅μž‘ν•˜κ±°λ‚˜ λͺ¨ν˜Έν•œ μ‹œκ°„μ  관계λ₯Ό κ°€μ§„ TKGQA λ¬Έμ œμ— λŒ€ν•΄ μ–΄λŠ μ •λ„μ˜ ν•œκ³„λ₯Ό κ°€μ§ˆ 수 있으며, 이에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘