Sign In

Progressive Refinement Regulation for Accelerating Diffusion Language Model Decoding

Created by
  • Haebom
Category
Empty

μ €μž

Lipeng Wan, Jianhui Gu, Junjie Ma, Jianguo Huang, Shiguang Sun, Siyuan Li, Xuguang Lan

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν™•μ‚° μ–Έμ–΄ λͺ¨λΈμ˜ λ””μ½”λ”© κ³Όμ •μ—μ„œ λͺ¨λ“  토큰에 λ™μΌν•˜κ²Œ μ μš©λ˜λŠ” κ· μΌν•œ μ •μ œ κ·œμΉ™μ˜ λΉ„νš¨μœ¨μ„±μ„ μ§€μ ν•©λ‹ˆλ‹€. ν† ν°λ§ˆλ‹€ μ•ˆμ •ν™” 속도가 λ‹€λ₯΄λ‹€λŠ” 점에 μ°©μ•ˆν•˜μ—¬, λ³Έ μ—°κ΅¬λŠ” ν† ν°μ˜ 미래 μ •μ œ ꢀ적을 기반으둜 κ²½ν—˜μ  수렴 μ§„ν–‰ 상황을 νŒŒμ•…ν•˜λŠ” "점진적 μ •μ œ 쑰절(Progressive Refinement Regulation, PRR)"μ΄λΌλŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. PRR은 μ΄λŸ¬ν•œ μ‹ ν˜Έλ₯Ό ν™œμš©ν•˜μ—¬ κ²½λŸ‰μ˜ 토큰별 컨트둀러λ₯Ό ν•™μŠ΅μ‹œν‚€κ³ , 점진적 자기 μ§„ν™” ν›ˆλ ¨ 방식을 톡해 λ””μ½”λ”© 속도λ₯Ό 크게 ν–₯μƒμ‹œν‚€λ©΄μ„œλ„ 생성 ν’ˆμ§ˆμ„ μœ μ§€ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λ‹€μ–‘ν•œ 토큰 μ•ˆμ •ν™” 속도 κ³ λ €: 토큰별 수렴 속도 차이λ₯Ό μΈμ§€ν•˜κ³  이λ₯Ό λ°”νƒ•μœΌλ‘œ μ •μ œ 과정을 λ™μ μœΌλ‘œ μ‘°μ ˆν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
생성 속도 및 ν’ˆμ§ˆ λ™μ‹œ ν–₯상: κΈ°μ‘΄ 연ꡬ듀이 λ””μ½”λ”© 속도 ν–₯상에 μ΄ˆμ μ„ λ§žμΆ”μ—ˆλ‹€λ©΄, λ³Έ μ—°κ΅¬λŠ” 속도와 ν•¨κ»˜ 생성 ν’ˆμ§ˆ μ €ν•˜ 없이 이λ₯Ό 달성함을 μ‹€ν—˜μ μœΌλ‘œ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ‹€ν–‰ κ°€λŠ₯ν•œ κ²½λŸ‰ 컨트둀러: λ³΅μž‘ν•œ λͺ¨λΈ ꡬ쑰 λ³€κ²½ 없이 κ²½λŸ‰μ˜ 토큰별 컨트둀러λ₯Ό 톡해 효과적으둜 μ •μ œ 과정을 κ΄€λ¦¬ν•˜μ—¬ μ‹€μ œ 적용 κ°€λŠ₯성을 λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
미래 ꢀ적 예츑의 λΆˆν™•μ‹€μ„±: 미래 μ •μ œ ꢀ적을 기반으둜 μˆ˜λ ΄μ„ νŒλ‹¨ν•˜λŠ” 방식은 예츑 자체의 λΆˆν™•μ‹€μ„±μ— 영ν–₯을 받을 수 있으며, μ΄λŠ” λͺ¨λΈμ˜ 견고성에 λŒ€ν•œ 좔가적인 탐ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘