Bài báo này đề xuất một phương pháp phát hiện mới, tận dụng các hiện vật thời gian để giải quyết vấn đề ngày càng gia tăng về phân phối nội dung tổng hợp do sự gia tăng của các video do AI tạo ra. Chúng tôi thiết lập một khuôn khổ lý thuyết dựa trên phân tích động lực học bậc hai theo cơ học Newton và sử dụng các đặc trưng hiệu trung tâm bậc hai để khám phá những khác biệt cơ bản trong phân phối các đặc trưng bậc hai giữa video thực và video do AI tạo ra. Dựa trên điều này, chúng tôi đề xuất D3 (Phát hiện bằng Hiệu số của Hiệu số), một phương pháp phát hiện mới không yêu cầu đào tạo. Chúng tôi chứng minh bằng thực nghiệm rằng D3 vượt trội hơn các phương pháp tiên tiến hiện có trên bốn tập dữ liệu nguồn mở (Gen-Video, VideoPhy, EvalCrafter và VidProM). Đáng chú ý, trên tập dữ liệu GenVideo, phương pháp của chúng tôi đạt được mức cải thiện độ chính xác trung bình là 10,39%, thể hiện hiệu quả tính toán và độ mạnh mẽ tuyệt vời.