Bài báo này đề xuất một khuôn khổ giao tiếp ngữ nghĩa (SemCom) mới cho việc truyền phát video tốc độ bit thích ứng thời gian thực bằng cách tích hợp Mô hình khuếch tán tiềm ẩn (LDM) vào các kỹ thuật FFmpeg. Để giải quyết vấn đề sử dụng băng thông cao, hiệu quả lưu trữ không cao và suy giảm QoE liên quan đến truyền phát CBR và ABR thông thường, chúng tôi nén các khung I vào không gian tiềm ẩn để tiết kiệm lưu trữ và truyền ngữ nghĩa trong khi vẫn duy trì chất lượng hình ảnh cao. Các khung B và P được giữ lại dưới dạng siêu dữ liệu phối hợp để cho phép tái tạo video hiệu quả ở phía người dùng. Hơn nữa, các kỹ thuật giảm nhiễu và nội suy khung video (VFI) tiên tiến được tích hợp để giảm thiểu sự mơ hồ về ngữ nghĩa và khôi phục tính nhất quán về thời gian giữa các khung, ngay cả trong môi trường không dây nhiễu. Kết quả thử nghiệm chứng minh rằng phương pháp được đề xuất đạt được khả năng truyền phát video chất lượng cao với việc sử dụng băng thông được tối ưu hóa và vượt trội hơn các giải pháp tiên tiến về QoE và hiệu quả tài nguyên. Nghiên cứu này mở ra những khả năng mới cho việc truyền phát video thời gian thực có khả năng mở rộng trong mạng 5G và mạng 5G thế hệ tiếp theo.