DMax: Aggressive Parallel Decoding for dLLMs

작성자

Haebom

카테고리

Empty

저자

Zigeng Chen, Gongfan Fang, Xinyin Ma, Ruonan Yu, Xinchao Wang

💡 개요

본 연구는 디퓨전 언어 모델(dLLMs)의 효율성을 높이는 새로운 패러다임인 DMax를 제안합니다. DMax는 기존의 이진 마스크-토큰 전환 방식과 달리, 디코딩 과정을 마스크 임베딩에서 토큰 임베딩으로 점진적인 자기 정제 과정으로 재해석하여 디코딩 병렬성을 공격적으로 높이면서도 생성 품질을 유지합니다. 핵심 기술인 On-Policy Uniform Training은 마스크드 및 유니폼 dLLM을 효과적으로 통합하여 오류가 포함된 예측에서도 정확한 토큰을 복구하도록 모델을 훈련합니다.

🔑 시사점 및 한계

•

기존 dLLM의 오류 누적 문제를 해결하여 디코딩 병렬성을 크게 향상시켰습니다.

•

생성 품질 저하 없이 TPF(Tokens Per Second)를 획기적으로 개선하여 실제 적용 가능성을 높였습니다.

•

제안된 On-Policy Uniform Training 전략은 마스크드 및 유니폼 dLLM 훈련을 통합하는 새로운 방향을 제시합니다.

•

DMax의 성능이 특정 벤치마크에서 검증되었지만, 더 다양한 태스크와 모델 규모에서의 추가적인 실험이 필요할 수 있습니다.

PDF 보기

Made with Slashpage