Cet article propose OmniUnet, un modèle de segmentation sémantique basé sur des images multimodales (RVB, profondeur, thermique) pour la navigation autonome et sécurisée des rovers martiens. Entraîné à partir d'un jeu de données multimodales collectées dans le désert des Bardenas en Espagne, OmniUnet utilise une architecture réseau basée sur Transformer et est conçu pour permettre l'inférence en temps réel, même sur des Jetson Orin Nano aux ressources limitées. Les résultats expérimentaux démontrent d'excellentes performances dans la segmentation de terrains complexes et non structurés, avec une précision de 80,37 % au pixel près. Le jeu de données et le code source collectés sont ouverts et disponibles pour de futures recherches.