Ctrl-Crash: Controllable Diffusion for Realistic Car Crashes
Created by
Haebom
저자
Anthony Gosselin, Ge Ya Luo, Luis Lara, Florian Golemo, Derek Nowrouzezahrai, Liam Paull, Alexia Jolicoeur-Martineau, Christopher Pal
개요
본 논문은 제한된 교통사고 데이터셋으로 인해 현실적인 자동차 충돌 영상 생성에 어려움을 겪는 기존 비디오 확산 기술의 문제점을 해결하기 위해, 제어 가능한 자동차 충돌 영상 생성 모델인 Ctrl-Crash를 제안합니다. Ctrl-Crash는 바운딩 박스, 충돌 유형, 초기 이미지 프레임과 같은 신호를 조건으로 하여 반실제 시나리오 생성을 가능하게 합니다. 각 조건 신호에 대해 독립적으로 조정 가능한 스케일을 사용하는 분류기 없는 안내(classifier-free guidance)를 활용하여 추론 시 미세 조정 제어를 지원합니다. 실험 결과, 기존 확산 기반 방법에 비해 정량적 비디오 품질 지표(예: FVD 및 JEDi)와 물리적 현실감 및 비디오 품질에 대한 인간 평가를 기반으로 한 정성적 측정에서 최첨단 성능을 달성했습니다.