Bài báo này đề xuất Mô hình Không gian Trạng thái Thời gian Thống nhất (UST-SSM) để giải quyết vấn đề hỗn loạn không gian thời gian trong video đám mây điểm. UST-SSM mở rộng Mô hình Không gian Trạng thái Chọn lọc (SSM) sang video đám mây điểm và giới thiệu kỹ thuật Quét Chọn lọc Không gian Thời gian (STSS), kỹ thuật này tái tạo các điểm hỗn loạn thành các chuỗi được nhận dạng ngữ nghĩa thông qua phân cụm dựa trên dấu nhắc. Hơn nữa, nó sử dụng Tổng hợp Cấu trúc Không gian Thời gian (STSA) để bù đắp cho thông tin hình học và chuyển động 4D bị thiếu, và đề xuất Lấy mẫu Tương tác Thời gian (TIS) để tăng cường các phụ thuộc thời gian chi tiết bằng cách tận dụng các khung không neo và mở rộng các trường tiếp nhận. Kết quả thử nghiệm trên các tập dữ liệu MSR-Action3D, NTU RGB+D và Synthia 4D chứng minh tính hiệu quả của phương pháp được đề xuất. Mã nguồn được công khai.