본 논문은 저비트율에서 기존 코덱보다 우수한 성능을 보이는 신경망 음성 코덱(NSCs)에 대해 다룬다. GAN 기반 NSCs가 주류를 이루지만, 이미지 생성에서 GAN보다 우수한 성능을 보이는 확산 모델(DMs)이 대안으로 떠오르고 있다. 본 논문은 확산 모델 기반 NSCs의 설계를 체계적으로 분석하여 세 가지 기여를 제공한다. 첫째, DM의 조건화 및 출력 도메인을 기반으로 분류 체계를 제안하여 확산 모델 기반 NSCs의 설계 공간을 정의하고 기존 연구들을 분류한다. 둘째, 제안된 개념적 틀 내에서 새로운 확산 모델 기반 NSCs를 생성하고 평가하여 아직 탐구되지 않은 설계들을 조사한다. 셋째, 제안된 모델들을 기존 GAN 및 DM 기준 모델들과 객관적 지표 및 주관적 청취 테스트를 통해 비교한다.