Bài báo này trình bày nhiệm vụ Dự đoán Chiếm dụng Ngữ nghĩa (SOP), đồng thời suy ra hình học cảnh và nhãn ngữ nghĩa từ hình ảnh để giải quyết các thách thức về che khuất vật thể và dữ liệu cảnh không đầy đủ trong các hệ thống nhận thức lái xe tự động. Để khắc phục những hạn chế của các phương pháp dựa trên camera hiện có, vốn xử lý tất cả các hạng mục một cách bình đẳng và chủ yếu dựa vào các đặc điểm cục bộ, dẫn đến hiệu suất dự đoán kém, đặc biệt là đối với các vật thể tiền cảnh động, chúng tôi đề xuất một khuôn khổ SOP Lấy Đối tượng Làm Trung tâm (OC-SOP). OC-SOP cải thiện đáng kể độ chính xác dự đoán đối tượng tiền cảnh bằng cách kết hợp các tín hiệu lấy đối tượng làm trung tâm cấp cao được trích xuất thông qua các nhánh phát hiện vào quy trình dự đoán chiếm dụng ngữ nghĩa, đạt được hiệu suất tiên tiến trên tất cả các hạng mục trên tập dữ liệu SemanticKITTI.