GarmentDiffusion은 텍스트, 이미지, 불완전한 재봉 패턴 등 다중 모달 입력으로부터 센티미터 단위의 정밀한 벡터화된 3D 재봉 패턴을 생성할 수 있는 새로운 생성 모델입니다. 3D 재봉 패턴 매개변수를 압축된 엣지 토큰 표현으로 효율적으로 인코딩하여, DressCode의 autoregressive SewingGPT보다 10배 짧은 시퀀스 길이를 달성합니다. 확산 트랜스포머를 사용하여 데이터셋 특정 엣지 및 패널 통계에 관계없이 일정한 탈잡음 단계 수를 유지하면서 시간 축을 따라 모든 엣지 토큰의 잡음을 동시에 제거합니다. 모델 설계의 모든 조합을 통해 SewingGPT에 비해 재봉 패턴 생성 속도가 100배 빨라졌으며, DressCodeData와 GarmentCodeData에서 최첨단 결과를 달성했습니다.