저화질 비트 전송률에서 픽셀 정확도를 위해 최적화된 기존의 비디오 코덱은 심각한 인공물을 생성하며 성능이 저하됩니다. 본 논문에서는 의미 있는 정보만 전송하고 세부 정보 합성을 위해 생성적 사전 정보를 사용하는 DiSCo라는 의미 기반 비디오 압축 프레임워크를 제안합니다. 소스 비디오는 텍스트 설명, 시공간적으로 저하된 비디오, 선택적으로 스케치 또는 포즈의 세 가지 압축된 양식으로 분해됩니다. 조건부 비디오 확산 모델은 이러한 압축 표현으로부터 고품질의 시간적으로 일관성 있는 비디오를 재구성합니다. 다중 양식 생성 및 양식 압축을 개선하기 위해 시간적 전진 채우기, 토큰 인터리빙 및 양식별 코덱이 제안되었습니다. 실험 결과, 제안된 방법은 저비트 전송률에서 지각적 메트릭에 대해 기본 의미 기반 코덱 및 기존 코덱보다 2~10배 더 우수한 성능을 보였습니다.