Este artículo aborda la importancia de las GPT multimodales en la interacción entre la ingeniería de software y la IA generativa. En concreto, exploramos casos de uso de ingeniería de software basados en las capacidades mejoradas de GPT-4, que acepta no solo lenguaje natural, sino también imágenes y texto. Este es el primer estudio similar de GPT multimodales que realizan tareas de ingeniería de software mediante indicaciones que combinan diagramas y lenguaje natural.