Trong bài báo này, chúng tôi đề xuất MOGO (Tạo chuyển động với một lần truyền), một khuôn khổ tự hồi quy mới cho việc tạo chuyển động 3D hiệu quả, thời gian thực. MOGO bao gồm hai thành phần chính. Đầu tiên, mô-đun Lượng tử hóa vectơ dư thích ứng tỷ lệ chuyển động (MoSA-VQ), phân rã theo thứ bậc các chuỗi chuyển động bằng cách sử dụng tỷ lệ có thể học được để tạo ra các biểu diễn ngắn gọn nhưng biểu cảm. Thứ hai, Bộ chuyển đổi nhân quả phân cấp lượng tử dư (RQHC-Transformer), tạo ra các mã thông báo chuyển động nhiều lớp trong một lần truyền tiếp, giảm đáng kể độ trễ suy luận. Chúng tôi tiếp tục cải thiện khả năng giải mã chuyển động được điều khiển bằng văn bản bằng cách thêm cơ chế căn chỉnh có điều kiện văn bản. Các thử nghiệm mở rộng trên các tập dữ liệu chuẩn như HumanML3D, KIT-ML và CMP chứng minh rằng MOGO đạt được chất lượng tạo có tính cạnh tranh hoặc vượt trội so với các phương pháp dựa trên Transformer hiện đại, đồng thời mang lại những cải tiến đáng kể về hiệu suất thời gian thực, tạo luồng và khái quát hóa trong cài đặt zero-shot.