Sign In

HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents

Created by
  • Haebom
Category
Empty

μ €μž

Hongbo Jin, Rongpeng Zhu, Jiayu Ding, Wenhao Zhang, Ge Li

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ΄ μ‹œκ°„ λ²”μœ„λ₯Ό κ°–λŠ” λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” LLM μ—μ΄μ „νŠΈμ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄ HiMACμ΄λΌλŠ” 계측적 ν•™μŠ΅ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. HiMAC은 μ˜μ‚¬κ²°μ •μ„ κ±°μ‹œμ  κ³„νšκ³Ό λ―Έμ‹œμ  μ‹€ν–‰μœΌλ‘œ λͺ…ν™•νžˆ λΆ„ν•΄ν•˜μ—¬, 기쑴의 단일 토큰 μ‹œν€€μŠ€ λ°©μ‹μ—μ„œ λ°œμƒν•˜λŠ” λΉ„νš¨μœ¨μ„±κ³Ό 였λ₯˜ 확산을 μ™„ν™”ν•©λ‹ˆλ‹€. λ˜ν•œ, 비평가 기반 계측적 μ •μ±… μ΅œμ ν™”μ™€ 반볡적인 곡동 μ§„ν™” ν•™μŠ΅ μ „λž΅μ„ 톡해 효율적인 ν•™μŠ΅μ„ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM μ—μ΄μ „νŠΈκ°€ μž₯기적인 μž‘μ—…μ„ 효과적으둜 μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄μ„œλŠ” λͺ…μ‹œμ μΈ 계측 ꡬ쑰 섀계가 λͺ¨λΈ 크기 ν™•μž₯을 λ„˜μ–΄ μ€‘μš”ν•œ μš”μ†Œμž„μ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
계측적 μ˜μ‚¬κ²°μ • κ΅¬μ‘°λŠ” LLM 기반 μ—μ΄μ „νŠΈμ˜ κ°•κ±΄ν•œ κ³„νš λŠ₯λ ₯을 ν–₯μƒμ‹œν‚€κ³ , 였λ₯˜ 확산을 쀄여 신뒰성을 λ†’μž…λ‹ˆλ‹€.
β€’
계측적 ν•™μŠ΅μ—μ„œ λ°œμƒν•˜λŠ” 비정상성 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ 곡동 μ§„ν™” ν•™μŠ΅ μ „λž΅μ€ ν–₯ν›„ λ³΅μž‘ν•œ 닀쀑 계측 μ—μ΄μ „νŠΈ ν•™μŠ΅μ— λŒ€ν•œ κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬μ˜ λ³΅μž‘μ„±κ³Ό κ΅¬ν˜„μ˜ 어렀움은 좔가적인 연ꡬ와 μ΅œμ ν™”κ°€ ν•„μš”ν•œ λΆ€λΆ„μž…λ‹ˆλ‹€.
πŸ‘