AttnMod es una técnica sin entrenamiento que modula la atención cruzada en un modelo de difusión preentrenado para generar estilos artísticos generativos novedosos y sin indicaciones. Se inspira en la forma en que los artistas humanos reinterpretan las imágenes generadas, por ejemplo, resaltando características específicas, dispersando colores, distorsionando siluetas y especificando elementos ocultos. AttnMod simula esta intención modificando cómo las indicaciones textuales condicionan la imagen mediante la atención durante la eliminación de ruido. Esta modulación dirigida a objetivos permite diversas transiciones de estilo sin cambiar las indicaciones ni reentrenar el modelo, ampliando el poder expresivo de la generación de texto a imagen.