본 논문은 이산 확산 언어 모델(dLLM)과 이산 확산 다중 모달 언어 모델(dMLLM)에 대한 체계적인 조사를 제공합니다. 자동회귀(AR) 모델과 달리, dLLM과 dMLLM은 전체 어텐션과 잡음 제거 기반 생성 전략을 사용하는 다중 토큰 병렬 디코딩 패러다임을 채택합니다. 이 패러다임은 자연스럽게 병렬 생성, 세분화된 출력 제어 및 동적이고 응답 인식적인 인식을 가능하게 합니다. 이러한 기능들은 이전에는 AR 모델로 달성하기 어려웠습니다. 최근 많은 산업 규모의 독점 d(M)LLM과 다수의 오픈소스 학술 d(M)LLM이 자동회귀 모델과 비슷한 성능을 보이면서 추론 속도를 최대 10배까지 향상시켰습니다. dLLM과 dMLLM의 발전은 자동회귀 LLMs 및 MLLMs의 발전과 이산 확산의 수학적 모델의 발전이라는 두 가지 영역의 진보에 크게 힘입었습니다. 본 논문에서는 dLLM 및 dMLLM 분야의 연구에 대한 포괄적인 개요를 제시하며, dLLM 및 dMLLM의 역사적 발전을 추적하고, 기본 수학적 프레임워크를 공식화하고, 대표적인 모델을 분류합니다. 또한 훈련 및 추론을 위한 주요 기술을 분석하고, 언어, 비전-언어 및 생물학적 영역에서 나타나는 응용 프로그램을 요약합니다. 마지막으로 미래 연구 및 배포 방향에 대해 논의합니다.