Dans cet article, nous proposons VLN-PE, une plateforme VLN physiquement réaliste. Malgré les avancées dans le domaine de la navigation en langage visuel (VLN), elle repose sur des hypothèses idéalistes qui ne reflètent pas les difficultés du déploiement réel de robots. VLN-PE prend en charge les robots humanoïdes, quadrupèdes et à roues, et évalue systématiquement diverses méthodes dans des environnements robotiques réels, notamment un modèle de classification pour la prédiction de mouvements discrets en une seule étape, un modèle de diffusion pour la prédiction de points de cheminement denses et un modèle de langage à grande échelle supervisé (LLM) utilisable sans formation et intégré à la planification de trajectoire. Les résultats expérimentaux montrent que la dégradation des performances est due à des difficultés physiques telles qu'un espace de visualisation limité du robot, des variations d'éclairage ambiant, des collisions et des chutes. De plus, les robots à pattes, en particulier, ont des contraintes de mouvement dans des environnements complexes. VLN-PE est extensible pour intégrer de manière transparente de nouvelles scènes au-delà de MP3D et permet une évaluation VLN plus complète. Malgré les faibles performances de généralisation des modèles actuels dans les environnements de déploiement réels, VLN-PE fournit une nouvelle méthode pour améliorer l'adaptabilité à diverses morphologies de robots.