haebom
Sign In
TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning
Created by
Haebom
Category
Empty
μ μ
Zihao Jiang, Miao Peng, Zhenyan Shan, Wenjie Xu, Ben Liu, Gong Chen, Ziqi Gao, Min Peng
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μκ³μ΄ μ§μ κ·Έλν(TKG) μμμ μκ° μ μ½μ΄ 볡μ‘ν μ§λ¬Έμ λ΅νλ TKGQA λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ TKG-ThinkerλΌλ μλ‘μ΄ μμ΄μ νΈλ₯Ό μ μν©λλ€. TKG-Thinkerλ LLMμ νκ³μ μΈ νκ° νμκ³Ό μ μ ν둬νν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μμ¨μ μΈ κ³ν λ° μ μν κ²μ κΈ°λ₯μ κ°μΆκ³ , TKG νκ²½κ³Όμ λμ λ€μ€ ν΄ μνΈμμ©μ ν΅ν΄ κΉμ΄ μλ μκ° μΆλ‘ μ μνν©λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ TKGQA μ±λ₯ ν₯μ:
TKG-Thinkerλ LLMμ΄ λ³΅μ‘ν μκ° μ μ½ νμμλ λ μ ννκ³ μμ¨μ μΈ μΆλ‘ μ ν μ μλλ‘ μ§μν©λλ€.
β’
λμ μΆλ‘ λ₯λ ₯ κ°ν:
μ μ ν둬νν λ°©μμμ λ²μ΄λ TKG νκ²½κ³Όμ μνΈμμ©μ ν΅ν΄ μΆλ‘ μ μ± μ μ΅μ νν¨μΌλ‘μ¨ λͺ¨λΈμ μΌλ°ν μ±λ₯μ λμμ΅λλ€.
β’
볡μ‘ν μκ° μ μ½ λ¬Έμ :
μ μλ λ°©λ²λ‘ μ΄ λ§€μ° λ³΅μ‘νκ±°λ λͺ¨νΈν μκ°μ κ΄κ³λ₯Ό κ°μ§ TKGQA λ¬Έμ μ λν΄ μ΄λ μ λμ νκ³λ₯Ό κ°μ§ μ μμΌλ©°, μ΄μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν μ μμ΅λλ€.
PDF 보기
Made with Slashpage