Cet article aborde l'importance des GPT multimodaux dans l'interaction entre l'ingénierie logicielle et l'IA générative. Plus précisément, nous explorons des cas d'utilisation en ingénierie logicielle basés sur les capacités améliorées de GPT-4, qui accepte non seulement le langage naturel, mais aussi les images et les saisies textuelles. Il s'agit de la première étude similaire sur des GPT multimodaux exécutant des tâches d'ingénierie logicielle à l'aide d'invites combinant diagrammes et langage naturel.