본 논문은 물리 법칙을 위반하는 비디오 생성 문제를 해결하기 위해 물리적 일관성 평가 벤치마크인 PhyCoBench를 제안합니다. 7가지 물리적 원리를 포함하는 120개의 프롬프트로 구성된 PhyCoBench는 4개의 최첨단 텍스트-비디오(T2V) 모델을 평가하는 데 사용되었으며, 수동 평가와 더불어 자동 평가 모델인 PhyCoPredictor를 제시합니다. PhyCoPredictor는 광학 흐름과 비디오 프레임을 계단식으로 생성하는 확산 모델이며, 수동 평가와의 일관성 평가를 통해 인간의 평가와 가장 잘 일치하는 것으로 나타났습니다. PhyCoBench는 프롬프트, PhyCoPredictor, 생성된 비디오 데이터셋을 포함하여 GitHub에 공개되었습니다.