Cet article explore la capacité d'un modèle d'images d'IA générative à générer des images remarquablement réalistes et créatives en utilisant des milliards d'images provenant d'Internet comme données d'entraînement. Cependant, des problèmes de violation de droits d'auteur ont été soulevés lors de ce processus, et cet article présente une méthode efficace pour déterminer si une image ou un ensemble d'images spécifique a été utilisé pour entraîner le modèle. Cette méthode fonctionne sans connaissance explicite de la structure ou des pondérations du modèle (inférence d'appartenance en boîte noire) et devrait jouer un rôle crucial dans l'audit des modèles existants et le développement de modèles d'IA générative équitables.