Sign In

SpecMD: A Comprehensive Study On Speculative Expert Prefetching

Created by
  • Haebom
Category
Empty

μ €μž

Duc Hoang, Ajay Jaiswal, Mohammad Samragh, Minsik Cho

πŸ’‘ κ°œμš”

λ³Έ 논문은 Mixture-of-Experts (MoE) λͺ¨λΈμ˜ 효율적인 좔둠을 μœ„ν•œ 캐싱 λ©”μ»€λ‹ˆμ¦˜μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•˜λ©°, λ‹€μ–‘ν•œ ν•˜λ“œμ›¨μ–΄ ꡬ성과 캐싱 μ •μ±… κ°„μ˜ μƒν˜Έμž‘μš©μ„ μ΄ν•΄ν•˜λŠ” 데 어렀움이 μžˆμŒμ„ μ§€μ ν•©λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ €μžλ“€μ€ λ‹€μ–‘ν•œ 캐싱 정책을 ν‘œμ€€ν™”λœ λ°©μ‹μœΌλ‘œ λ²€μΉ˜λ§ˆν‚Ήν•  수 μžˆλŠ” SpecMD ν”„λ ˆμž„μ›Œν¬λ₯Ό κ°œλ°œν•˜κ³ , 이λ₯Ό 톡해 MoE μ „λ¬Έκ°€ μ ‘κ·Ό νŒ¨ν„΄μ΄ 일반적인 μ‹œκ°„μ  μ§€μ—­μ„± κ°€μ •κ³Ό λΆ€ν•©ν•˜μ§€ μ•ŠμŒμ„ λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. λ‚˜μ•„κ°€, μ΄λŸ¬ν•œ 예츑 κ°€λŠ₯ν•œ μ ‘κ·Ό νŒ¨ν„΄μ„ ν™œμš©ν•˜μ—¬ 좩돌 미슀λ₯Ό μ΅œλŒ€ 85λ°°κΉŒμ§€ μ€„μ΄λŠ” μƒˆλ‘œμš΄ ν‡΄μΆœ 정책인 Least-Stale을 μ œμ•ˆν•˜μ—¬, 적은 μΊμ‹œ μš©λŸ‰μœΌλ‘œλ„ 높은 λͺ…쀑λ₯ κ³Ό μƒλ‹Ήν•œ μΆ”λ‘  μ‹œκ°„ 단좕을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
MoE λͺ¨λΈμ˜ μ„±λŠ₯ μ΅œμ ν™”λ₯Ό μœ„ν•΄μ„œλŠ” ν•˜λ“œμ›¨μ–΄ 및 λͺ¨λΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ 깊이 μžˆλŠ” 이해λ₯Ό λ°”νƒ•μœΌλ‘œ ν•œ 캐싱 μ „λž΅ 섀계가 ν•„μˆ˜μ μž…λ‹ˆλ‹€.
β€’
기쑴의 일반적인 캐싱 μ •μ±…(LRU, LFU)은 MoE의 κ³ μœ ν•œ μ „λ¬Έκ°€ μ ‘κ·Ό νŒ¨ν„΄μ„ μ œλŒ€λ‘œ ν™œμš©ν•˜μ§€ λͺ»ν•˜λ©°, MoE에 νŠΉν™”λœ μƒˆλ‘œμš΄ 정책이 ν•„μš”ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ Least-Stale 정책은 MoE의 μ „λ¬Έκ°€ μ ‘κ·Ό νŒ¨ν„΄ μ˜ˆμΈ‘μ„ 톡해 μΊμ‹œ νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŒμ„ μ‹€ν—˜μ μœΌλ‘œ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” νŠΉμ • MoE λͺ¨λΈ 및 ν•˜λ“œμ›¨μ–΄ 섀정에 λŒ€ν•œ μ‹€ν—˜ κ²°κ³Όλ₯Ό 기반으둜 ν•˜λ©°, λ‹€λ₯Έ MoE μ•„ν‚€ν…μ²˜λ‚˜ λ‹€μ–‘ν•œ ν•˜λ“œμ›¨μ–΄ μ œμ•½ μ‘°κ±΄μ—μ„œμ˜ μΌλ°˜ν™” κ°€λŠ₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘