Sign In

Pushing Forward Pareto Frontiers of Proactive Agents with Behavioral Agentic Optimization

Created by
  • Haebom
Category
Empty

μ €μž

Yihang Yao, Zhepeng Cen, Haohong Lin, Shiqi Liu, Zuxin Liu, Jiacheng Zhu, Zhang-Wei Hong, Laixi Shi, Ding Zhao

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŠ₯동적인 κ³„νš, 질의, μƒν˜Έμž‘μš©μ„ 톡해 효율적인 νƒœμŠ€ν¬ μ™„μˆ˜λ₯Ό λͺ©ν‘œλ‘œ ν•˜λŠ” λŠ₯λ™ν˜• LLM μ—μ΄μ „νŠΈ ν›ˆλ ¨μ˜ 핡심 과제인 νƒœμŠ€ν¬ μ„±λŠ₯κ³Ό μ‚¬μš©μž μ°Έμ—¬ κ°„μ˜ κ· ν˜• 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ λŠ₯동적 μΆ”λ‘  및 정보 μˆ˜μ§‘ λŠ₯λ ₯을 κ°•ν™”ν•˜λŠ” 행동 κ°•ν™” 기법과 λΉ„νš¨μœ¨μ μ΄κ±°λ‚˜ 쀑볡적인 μƒν˜Έμž‘μš©μ„ μ–΅μ œν•˜κ³  μ‚¬μš©μž κΈ°λŒ€μ— λΆ€ν•©ν•˜λ„λ‘ μ—μ΄μ „νŠΈ 행동을 κ·œμ œν•˜λŠ” 행동 규제 기법을 κ²°ν•©ν•œ BAO(Behavioral Agentic Optimization) ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. BAOλŠ” μ‚¬μš©μžRL λ²€μΉ˜λ§ˆν¬μ—μ„œ κΈ°μ‘΄ λŠ₯λ™ν˜• μ—μ΄μ „νŠΈ RL 기반 λͺ¨λΈ λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ˜€μœΌλ©°, μƒμ—…μš© LLM μ—μ΄μ „νŠΈμ™€ μœ μ‚¬ν•˜κ±°λ‚˜ 더 λ‚˜μ€ μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λŠ₯λ™ν˜• LLM μ—μ΄μ „νŠΈ ν›ˆλ ¨ μ‹œ νƒœμŠ€ν¬ μ„±λŠ₯κ³Ό μ‚¬μš©μž λ§Œμ‘±λ„λΌλŠ” 두 κ°€μ§€ λͺ©ν‘œ κ°„μ˜ 상좩 관계λ₯Ό 효과적으둜 관리할 수 μžˆλŠ” μƒˆλ‘œμš΄ 방법둠을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
행동 강화와 행동 규제λ₯Ό κ²°ν•©ν•¨μœΌλ‘œμ¨ μ—μ΄μ „νŠΈμ˜ λŠ₯동성과 μ‚¬μš©μž 쀑심적인 μƒν˜Έμž‘μš©μ„ λ™μ‹œμ— κ°œμ„ ν•  수 μžˆμŒμ„ μž…μ¦ν•©λ‹ˆλ‹€.
β€’
λ³΅μž‘ν•œ 닀쀑 ν„΄ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ μ‚¬μš©μž μ˜λ„μ— λΆ€ν•©ν•˜λŠ” λŠ₯동적이고 효율적인 LLM μ—μ΄μ „νŠΈ κ°œλ°œμ— κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ BAO ν”„λ ˆμž„μ›Œν¬κ°€ λͺ¨λ“  μ’…λ₯˜μ˜ λŠ₯λ™ν˜• μ—μ΄μ „νŠΈ 및 μ‚¬μš©μž μ‹œλ‚˜λ¦¬μ˜€μ— 졜적으둜 적용될 수 μžˆλŠ”μ§€, λ˜λŠ” νŠΉμ • νƒœμŠ€ν¬ μœ ν˜•μ΄λ‚˜ μ‚¬μš©μž νŠΉμ„±μ— 따라 좔가적인 쑰정이 ν•„μš”ν•œμ§€μ— λŒ€ν•œ 탐ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘