Sign In

SDG-MoE: Signed Debate Graph Mixture-of-Experts

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Stepan Kulibaba, Kirill Labzin, Artem Dzhalilov, Roman Pakhomov, Oleg Svidchenko, Alexander Gasnikov, Aleksei Shpilman

πŸ’‘ κ°œμš”

λ³Έ 논문은 Sparse MoE λͺ¨λΈμ—μ„œ 토큰이 λΌμš°νŒ…λœ μ „λ¬Έκ°€λ“€ κ°„μ˜ μƒν˜Έμž‘μš©μ„ 톡해 μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” μƒˆλ‘œμš΄ μ•„ν‚€ν…μ²˜μΈ SDG-MoE(Signed Debate Graph Mixture-of-Experts)λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. SDG-MoEλŠ” ν•™μŠ΅ κ°€λŠ₯ν•œ μƒν˜Έμž‘μš© ν–‰λ ¬κ³Ό λΆ€ν˜Έν™”λœ λ©”μ‹œμ§€ 전달 단계λ₯Ό λ„μž…ν•˜μ—¬ 전문가듀이 μ΅œμ’… 집계 전에 μ„œλ‘œ 'ν† λ‘ 'ν•˜κ³  각자의 ν‘œν˜„μ„ μ—…λ°μ΄νŠΈν•˜λ„λ‘ ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 κΈ°μ‘΄ MoE λͺ¨λΈ λŒ€λΉ„ μ„±λŠ₯ ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ „λ¬Έκ°€ κ°„ 직접적인 μƒν˜Έμž‘μš©μ„ 톡해 MoE λͺ¨λΈμ˜ ν‘œν˜„λ ₯을 κ°•ν™”ν•  수 μžˆλ‹€λŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
'μ§€μ§€'와 'λΉ„νŒ' κ·Έλž˜ν”„λ₯Ό ν™œμš©ν•œ κ΅¬μ‘°ν™”λœ ν† λ‘  과정은 μ „λ¬Έκ°€μ˜ νŠΉν™”μ„±μ„ μœ μ§€ν•˜λ©΄μ„œλ„ μƒν˜Έμž‘μš©μ˜ 강도λ₯Ό μ‘°μ ˆν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 이둠적인 μ•ˆμ •μ„± 뢄석을 μ œκ³΅ν•˜λ©°, μ „λ¬Έκ°€ κ°„ μƒν˜Έμž‘μš©μ— λ”°λ₯Έ 계산 μ˜€λ²„ν—€λ“œκ°€ 크지 μ•ŠμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ‹€ν—˜ κ²°κ³ΌλŠ” SDG-MoEκ°€ 검증 및 μ™ΈλΆ€ λ°μ΄ν„°μ…‹μ—μ„œ κΈ°μ‘΄ MoE 및 λ‹€λ₯Έ 베이슀라인 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ˜€μŒμ„ μž…μ¦ν•©λ‹ˆλ‹€.
πŸ‘