Sign In

Iterative Critique-and-Routing Controller for Multi-Agent Systems with Heterogeneous LLMs

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Wenzhi Fang, Liangqi Yuan, Guangchen Lan, Dong-Jun Han, Christopher G. Brinton

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ‹€μˆ˜μ˜ 이질적인 LLM μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ—μ„œ ν˜‘μ—…μ„ μ‘°μœ¨ν•˜λŠ” 기쑴의 λ‹¨λ°œμ„± λΌμš°νŒ… λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, 비평 및 λΌμš°νŒ… κΈ°λŠ₯을 ν†΅ν•©ν•œ μƒˆλ‘œμš΄ 컨트둀러λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이 μ»¨νŠΈλ‘€λŸ¬λŠ” 각 λ‹¨κ³„μ—μ„œ ν˜„μž¬ μ΄ˆμ•ˆμ„ ν‰κ°€ν•˜κ³ , μž‘μ—…μ„ 계속할지 쀑단할지 κ²°μ •ν•˜λ©°, ν•„μš”μ‹œ λ‹€μŒ μ—μ΄μ „νŠΈλ₯Ό μ„ νƒν•˜μ—¬ 순차적으둜 μ΄ˆμ•ˆμ„ κ°œμ„ ν•˜λŠ” 과정을 순차 κ²°μ • 문제둜 λͺ¨λΈλ§ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, μ œμ•ˆλœ 방법이 μ΅œμ‹  κΈ°μˆ μ„ λŠ₯κ°€ν•˜λ©° κ°€μž₯ κ°•λ ₯ν•œ μ—μ΄μ „νŠΈ λŒ€λΉ„ μ„±λŠ₯ 격차λ₯Ό 크게 μ€„μ΄λŠ” λ™μ‹œμ—, 총 μ—μ΄μ „νŠΈ 호좜 횟수λ₯Ό 25% 미만으둜 μœ μ§€ν•˜λŠ” νš¨μœ¨μ„±μ„ λ³΄μ˜€μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
닀쀑 LLM μ‹œμŠ€ν…œμ—μ„œ λ‹¨λ°œμ„± λΌμš°νŒ…μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ , 순차적 비평 및 κ°œμ„ μ„ 톡해 μ„±λŠ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ μ»¨νŠΈλ‘€λŸ¬λŠ” 마λ₯΄μ½”ν”„ κ²°μ • κ³Όμ •(MDP)으둜 λͺ¨λΈλ§λ˜μ–΄ μ΅œμ ν™”λ  수 있으며, μ œν•œλœ μ—μ΄μ „νŠΈ 호좜둜 높은 μ„±λŠ₯을 λ‹¬μ„±ν•©λ‹ˆλ‹€.
β€’
μ—μ΄μ „νŠΈ κ°„μ˜ 효과적인 비평 및 μˆ˜μ • 과정을 μžλ™ν™”ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©μ‹μ˜ νš¨μœ¨μ„±μ€ μ‹€ν—˜μ—μ„œ μž…μ¦λ˜μ—ˆμœΌλ‚˜, μ‹€μ œ λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ ν™•μž₯μ„± 및 λ‹€μ–‘ν•œ μ’…λ₯˜μ˜ 이질적인 LLM 쑰합에 λŒ€ν•œ 좔가적인 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘