본 논문은 고품질 3D 댄스 동작 생성을 위한 새로운 방법인 DanceMosaic을 제안합니다. 기존 방법들이 현실감, 음악과의 정확한 동기화, 다양한 동작, 물리적 타당성을 동시에 만족하는 고품질 댄스 시퀀스 생성에 어려움을 겪는다는 점을 지적하며, DanceMosaic는 다양한 안내 신호(음악 프롬프트, 포즈 제약, 액션 레이블, 장르 설명 등)에 따른 편집 기능을 제공하여 생성 품질과 편집성을 향상시킵니다. 텍스트-모션 모델과 음악 및 포즈 어댑터를 결합한 다중 모드 마스크 모션 모델을 사용하여 다양한 안내 신호로부터 고품질 댄스 모션 시퀀스를 확률적으로 매핑하고, 생성된 동작과 다중 모드 안내 간의 정렬을 강화하기 위해 다중 모드 분류기 없는 안내 및 추론 시간 최적화 메커니즘을 제안합니다.