본 논문은 최첨단 언어 모델의 한계점인 이미 생성된 토큰 수정 불가능성을 해결하기 위해 일반화된 마스크 확산(GIDD, General Interpolating Discrete Diffusion) 프로세스를 제안합니다. 기존 마스크 확산의 단점을 극복하고, 소음 프로세스 설계의 유연성을 높이는 이론적 기반을 제공합니다. 새로운 확산 ELBO를 활용하여 계산 성능 측면에서 최첨단 성능을 달성하며, 마스킹과 균일 노이즈를 결합한 하이브리드 접근 방식을 통해 샘플 품질을 향상시키고 모델의 자체 수정 능력을 가능하게 합니다. 이는 자기회귀 모델의 어려움을 극복하는 데 기여합니다. 소스 코드와 모델은 공개되어 있습니다.