haebom
Sign In
Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents
Created by
Haebom
Category
Empty
μ μ
Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ LLM κΈ°λ° μμ¨ μμ΄μ νΈμ μ₯κΈ° μ μ± μ΄ λͺ¨λΈ κ°μ€μΉμ νΈλμ€ν¬λ¦½νΈμ μ묡μ μΌλ‘ λ΄μ¬λμ΄ μμ μ±μ΄ μ¬νμ μΌλ‘ 보κ°λλ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ Traversal-as-Policy λ°©λ²μ μ μν©λλ€. μ΄ λ°©λ²μ μλλ°μ€ νκ²½μμμ μ€ν λ‘κ·Έλ₯Ό Gated Behavior Tree(GBT)λ‘ μ¦λ₯νκ³ , νΈλ¦¬ μνλ₯Ό μ μ΄ μ μ± μΌλ‘ μ¬μ©νμ¬ μμ νκ³ ν¨μ¨μ μΈ μμ΄μ νΈλ₯Ό ꡬμΆν©λλ€. GBTλ μν μ‘°κ±΄λΆ νλ λ§€ν¬λ‘μ κ²½ν κΈ°λ°μ μ격ν κ²μ΄ν λ©μ»€λμ¦μ ν΅ν΄ μμ μ±μ 보μ₯νλ©°, λ°νμ μ νΈλ¦¬ μνμ 볡ꡬ μ λ΅μ ν΅ν΄ μ±λ₯μ ν₯μμν΅λλ€.
π μμ¬μ λ° νκ³
β’
μμ μ± λ° ν¨μ¨μ± ν₯μ
: GBTλ κΈ°μ‘΄ LLM μμ΄μ νΈμ μμ μλ°μ νκΈ°μ μΌλ‘ μ€μ΄κ³ μμ μ±κ³΅λ₯ μ λμ΄λ©°, λΉμ©μ μ κ°νλ ν¨κ³Όλ₯Ό 보μ¬μ€λλ€.
β’
λͺ μμ μ΄κ³ κ²μ¦ κ°λ₯ν μ μ±
: νλ λ§€ν¬λ‘μ κ²μ΄ν λ©μ»€λμ¦μ ν΅ν΄ μ μ± μ λͺ μμ μΌλ‘ νννκ³ κ²μ¦ κ°λ₯νκ² λ§λ€μ΄ μμ΄μ νΈμ λμμ λ μ μ΄ν΄νκ³ μ μ΄ν μ μμ΅λλ€.
β’
κΈ°μ‘΄ λͺ¨λΈ νμ©λ μ¦λ
: λ μμ λͺ¨λΈ(8B νλΌλ―Έν°)μμλ GBTλ₯Ό ν΅ν΄ μ±λ₯μ ν¬κ² ν₯μμν¬ μ μμ΄, κΈ°μ‘΄ LLM μμ΄μ νΈμ νμ© λ²μλ₯Ό λν μ μμ΅λλ€.
β’
GBT μμ± λ° μ μ§λ³΄μ 볡μ‘μ±
: λ€μν μμ κ³Ό νκ²½μ λν GBTλ₯Ό μμ±νκ³ μ μ§λ³΄μνλ κ³Όμ μ΄ λ³΅μ‘νκ³ λΉμ©μ΄ λ§μ΄ λ€ μ μμ΅λλ€.
β’
λμ νκ²½ λ³νμ λν λμ
: GBTκ° κ³ μ λ μ μ± μ κΈ°λ°μΌλ‘ νλ―λ‘, μμμΉ λͺ»ν λμ νκ²½ λ³νμ λν μ μμ±μ΄ μ νμ μΌ μ μμ΅λλ€.
PDF 보기
Made with Slashpage