Este artículo propone OmniUnet, un modelo de segmentación semántica basado en imágenes multimodales (RGB, profundidad, térmicas) para la navegación autónoma segura de exploradores de Marte. Entrenado con un conjunto de datos multimodales recopilados en el desierto de las Bardenas (España), OmniUnet emplea una arquitectura de red basada en transformadores y está diseñado para permitir la inferencia en tiempo real incluso en Jetson Orin Nano con recursos limitados. Los resultados experimentales demuestran un excelente rendimiento en la segmentación de terrenos complejos y no estructurados, alcanzando una precisión de píxel del 80,37 %. El conjunto de datos recopilados y el código fuente están abiertos y disponibles para futuras investigaciones.