Cet article présente la tâche de prédiction sémantique d'occupation (SOP), qui déduit simultanément la géométrie de la scène et les étiquettes sémantiques à partir d'images afin de relever les défis de l'occlusion d'objets et des données de scène incomplètes dans les systèmes de perception de conduite autonome. Pour pallier les lacunes des méthodes existantes basées sur les caméras, qui traitent toutes les catégories de manière égale et s'appuient principalement sur des caractéristiques locales, ce qui entraîne de faibles performances de prédiction, en particulier pour les objets dynamiques de premier plan, nous proposons un cadre SOP centré sur l'objet (OC-SOP). OC-SOP améliore significativement la précision de la prédiction des objets de premier plan en intégrant des indices de haut niveau centrés sur l'objet, extraits via des branches de détection, dans le pipeline de prédiction sémantique d'occupation, atteignant ainsi des performances de pointe pour toutes les catégories de l'ensemble de données SemanticKITTI.