Cet article présente une revue systématique de la littérature sur les approches d'ancrage spatial basées sur Transformer de 2018 à 2025. L'introduction de modèles basés sur Transformer a entraîné des développements rapides dans le domaine de l'ancrage spatial, qui relie les représentations en langage naturel et les domaines de l'image. Cependant, une analyse complète des méthodologies, de l'utilisation des ensembles de données, des indicateurs d'évaluation et de l'applicabilité industrielle faisait défaut. En identifiant les architectures de modèles clés, les ensembles de données largement utilisés et les indicateurs d'évaluation, et en mettant en évidence les principales tendances méthodologiques et les meilleures pratiques, cette étude fournit aux chercheurs et aux praticiens des informations essentielles et des conseils structurés pour développer des modèles d'ancrage spatial basés sur Transformer robustes, fiables et applicables industriellement.