Sign In

LiteCoOp: Lightweight Multi-LLM Shared-Tree Reasoning for Model-Serving Compiler Optimizations

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Annabelle Sujun Tang, Christopher Priebe, Lianhui Qin, Hadi Esmaeilzadeh

πŸ’‘ κ°œμš”

λ³Έ 논문은 단일 λŒ€κ·œλͺ¨ LLM에 μ˜μ‘΄ν•˜λŠ” κΈ°μ‘΄ 컴파일러 μ΅œμ ν™” λ°©μ‹μ˜ 높은 λΉ„μš© 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, 이기쒅 LLM듀이 ν˜‘λ ₯ν•˜λ©΄μ„œλ„ λΉ„μš©μ„ μ ˆκ°ν•˜λŠ” LiteCoOp ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. LiteCoOpλŠ” μ΅œμ ν™” 탐색 트리 자체λ₯Ό ν˜‘λ ₯ λ©”μ»€λ‹ˆμ¦˜μœΌλ‘œ ν™œμš©ν•˜μ—¬, 각 LLM이 λ‹€μŒ LLM μ„ νƒκΉŒμ§€ μ œμ•ˆν•¨μœΌλ‘œμ¨ μƒν˜Έ 정보λ₯Ό κ³΅μœ ν•˜κ³ , MCTS 트리λ₯Ό 톡해 보상을 μ—­μ „νŒŒν•˜μ—¬ ν˜‘μ—…μ„ μ΄λ£Ήλ‹ˆλ‹€. 이λ₯Ό 톡해 μ—μ΄μ „νŠΈ ν”„λ ˆμž„μ›Œν¬ 없이도 λΉ„μš© νš¨μœ¨μ„±μ„ λ†’μ΄λ©΄μ„œ μ΅œμ ν™” μ„±λŠ₯을 μœ μ§€ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
이기쒅 LLM ν˜‘μ—…μ„ ν†΅ν•œ λΉ„μš© 절감: μ—¬λŸ¬ LLM을 효율적으둜 ν˜‘λ ₯μ‹œμΌœ 단일 λŒ€κ·œλͺ¨ LLM μ‚¬μš© λŒ€λΉ„ 컴파일 μ‹œκ°„ 및 API λΉ„μš©μ„ 크게 쀄일 수 μžˆμŒμ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ΅œμ ν™” 트리 자체λ₯Ό ν˜‘λ ₯ λ©”μ»€λ‹ˆμ¦˜μœΌλ‘œ ν™œμš©: μ™ΈλΆ€ μ—μ΄μ „νŠΈλ‚˜ λ³΅μž‘ν•œ 톡신 없이도 LLM κ°„μ˜ 정보 곡유 및 μ˜μ‚¬κ²°μ • ν•™μŠ΅μ„ κ°€λŠ₯ν•˜κ²Œ ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν–ˆμŠ΅λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ LLM κ΅¬μ„±μ—μ„œμ˜ ν™•μž₯μ„±: 8개의 이기쒅 LLMκΉŒμ§€ ν˜‘μ—… 규λͺ¨λ₯Ό ν™•μž₯ν–ˆμ„ λ•Œ μ„±λŠ₯이 λ”μš± ν–₯μƒλ˜λŠ” 것을 ν™•μΈν•˜μ—¬, ν˜‘μ—…μ˜ ν™•μž₯ κ°€λŠ₯성을 λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.
β€’
LLM 호좜 λΉ„μš© μ ˆκ°μ„ μœ„ν•œ λͺ¨λΈ 선택 편ν–₯: μ΅œμ ν™” μ„±λŠ₯을 μœ μ§€ν•˜λ©΄μ„œλ„ λΉ„μš© μ ˆκ°μ„ μœ„ν•΄ μž‘μ€ LLM을 μš°μ„ μ μœΌλ‘œ ν˜ΈμΆœν•˜λ„λ‘ ν•˜λŠ” LLM-aware UCT λ©”μ»€λ‹ˆμ¦˜μ˜ νš¨κ³ΌλŠ” κ²€μ¦λ˜μ—ˆμœΌλ‚˜, μ—¬μ „νžˆ 일정 λΉ„μœ¨μ˜ λŒ€κ·œλͺ¨ LLM ν˜ΈμΆœμ€ λΆˆκ°€ν”Όν•©λ‹ˆλ‹€.
β€’
ν–₯ν›„ 과제: 졜적의 LLM μ‘°ν•© 및 μŠ€μΌ€μΌλ§ μ „λž΅μ„ νƒμƒ‰ν•˜κ³ , 더 넓은 λ²”μœ„μ˜ 컴파일러 μ΅œμ ν™” λ¬Έμ œμ— LiteCoOpλ₯Ό μ μš©ν•˜λŠ” 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘