En este artículo, proponemos VLN-PE, una plataforma de VLN físicamente realista. Esta plataforma señala que, a pesar de los avances en el campo de la navegación visual-lenguaje (VLN), se basa en suposiciones idealistas que no reflejan las dificultades de la implementación real de robots. VLN-PE admite robots humanoides, cuadrúpedos y con ruedas, y evalúa sistemáticamente diversos métodos en entornos robóticos reales, incluyendo un modelo de clasificación para la predicción de movimiento discreto de un solo paso, un modelo de difusión para la predicción densa de puntos de referencia y un modelo de lenguaje a gran escala (LLM) supervisado que puede utilizarse sin entrenamiento e integrado con la planificación de rutas. Los resultados experimentales muestran que el rendimiento se degrada debido a dificultades físicas como el espacio de visión limitado del robot, los cambios en la iluminación ambiental, las colisiones y las caídas, y que, en particular, los robots con patas presentan limitaciones de movimiento en entornos complejos. VLN-PE es extensible para integrar sin problemas nuevas escenas más allá de MP3D y permite una evaluación de VLN más completa. A pesar del bajo rendimiento de generalización de los modelos actuales en entornos de implementación reales, VLN-PE proporciona un método novedoso para mejorar la adaptabilidad a diversas morfologías de robots.