Cet article présente une nouvelle approche pour surmonter les limites du lancer de rayons sans fil (RT), une technologie qui s'impose comme un outil clé pour la modélisation 3D des canaux sans fil. Les méthodes d'apprentissage en ligne existantes peinent à modéliser avec précision les signaux des réseaux de nouvelle génération (Beyond 5G, B5G), sensibles aux variations environnementales à hautes fréquences. De plus, elles nécessitent une supervision environnementale en temps réel, coûteuse et incompatible avec le traitement par GPU. Dans cet article, nous proposons SANDWICH (Scene-Aware Neural Decision Wireless Channel Raytracing Hierarchy), une nouvelle méthode qui redéfinit la génération de trajectoires de rayons comme un problème de prise de décision séquentielle et exploite des modèles génératifs pour apprendre conjointement les caractéristiques optiques, physiques et de signal de chaque environnement. SANDWICH est une approche hors ligne entièrement différentiable, entièrement entraînable sur GPU et qui surpasse les méthodes d'apprentissage en ligne existantes.