haebom
Sign In
Pushing Forward Pareto Frontiers of Proactive Agents with Behavioral Agentic Optimization
Created by
Haebom
Category
Empty
μ μ
Yihang Yao, Zhepeng Cen, Haohong Lin, Shiqi Liu, Zuxin Liu, Jiacheng Zhu, Zhang-Wei Hong, Laixi Shi, Ding Zhao
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λ₯λμ μΈ κ³ν, μ§μ, μνΈμμ©μ ν΅ν΄ ν¨μ¨μ μΈ νμ€ν¬ μμλ₯Ό λͺ©νλ‘ νλ λ₯λν LLM μμ΄μ νΈ νλ ¨μ ν΅μ¬ κ³Όμ μΈ νμ€ν¬ μ±λ₯κ³Ό μ¬μ©μ μ°Έμ¬ κ°μ κ· ν λ¬Έμ λ₯Ό ν΄κ²°νκ³ μ ν©λλ€. μ΄λ₯Ό μν΄ λ₯λμ μΆλ‘ λ° μ 보 μμ§ λ₯λ ₯μ κ°ννλ νλ κ°ν κΈ°λ²κ³Ό λΉν¨μ¨μ μ΄κ±°λ μ€λ³΅μ μΈ μνΈμμ©μ μ΅μ νκ³ μ¬μ©μ κΈ°λμ λΆν©νλλ‘ μμ΄μ νΈ νλμ κ·μ νλ νλ κ·μ κΈ°λ²μ κ²°ν©ν BAO(Behavioral Agentic Optimization) νλ μμν¬λ₯Ό μ μν©λλ€. BAOλ μ¬μ©μRL λ²€μΉλ§ν¬μμ κΈ°μ‘΄ λ₯λν μμ΄μ νΈ RL κΈ°λ° λͺ¨λΈ λλΉ μ°μν μ±λ₯μ 보μμΌλ©°, μμ μ© LLM μμ΄μ νΈμ μ μ¬νκ±°λ λ λμ μ±λ₯μ λ¬μ±νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
λ₯λν LLM μμ΄μ νΈ νλ ¨ μ νμ€ν¬ μ±λ₯κ³Ό μ¬μ©μ λ§μ‘±λλΌλ λ κ°μ§ λͺ©ν κ°μ μμΆ© κ΄κ³λ₯Ό ν¨κ³Όμ μΌλ‘ κ΄λ¦¬ν μ μλ μλ‘μ΄ λ°©λ²λ‘ μ μ μν©λλ€.
β’
νλ κ°νμ νλ κ·μ λ₯Ό κ²°ν©ν¨μΌλ‘μ¨ μμ΄μ νΈμ λ₯λμ±κ³Ό μ¬μ©μ μ€μ¬μ μΈ μνΈμμ©μ λμμ κ°μ ν μ μμμ μ μ¦ν©λλ€.
β’
볡μ‘ν λ€μ€ ν΄ μλ리μ€μμ μ¬μ©μ μλμ λΆν©νλ λ₯λμ μ΄κ³ ν¨μ¨μ μΈ LLM μμ΄μ νΈ κ°λ°μ κΈ°μ¬ν μ μμ΅λλ€.
β’
μ μλ BAO νλ μμν¬κ° λͺ¨λ μ’ λ₯μ λ₯λν μμ΄μ νΈ λ° μ¬μ©μ μλ리μ€μ μ΅μ μΌλ‘ μ μ©λ μ μλμ§, λλ νΉμ νμ€ν¬ μ νμ΄λ μ¬μ©μ νΉμ±μ λ°λΌ μΆκ°μ μΈ μ‘°μ μ΄ νμνμ§μ λν νκ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage