Cet article présente un nouveau défi : la décomposition couche par couche d'images alpha-composites. Nous constatons que les méthodes de décomposition d'images existantes peinent à traiter les artefacts d'occlusion dans les couches semi-transparentes ou transparentes, et nous abordons des défis tels que les dépendances a priori des masques, les hypothèses statiques sur les objets et l'insuffisance de données. Pour y parvenir, nous introduisons AlphaBlend, un jeu de données à grande échelle et de haute qualité pour la décomposition des couches transparentes et semi-transparentes, et présentons DiffDecompose, un cadre basé sur un transformateur de diffusion. DiffDecompose apprend les probabilités a posteriori des décompositions de couches possibles conditionnées par l'image d'entrée, les invites sémantiques et les types de fusion. Au lieu de régresser directement les masques alpha, nous effectuons une décomposition en contexte pour prédire une ou plusieurs couches sans supervision spécifique à chaque couche, et introduisons le clonage du codage de position des couches pour préserver les correspondances au niveau des pixels entre les couches. Nous validons l'efficacité de DiffDecompose par des expériences approfondies sur le jeu de données AlphaBlend proposé et le jeu de données LOGO accessible au public.