Dans cet article, nous proposons DMQ, une version améliorée de la technique de quantification post-entraînée (PTQ), pour relever les défis du déploiement de modèles de diffusion dans des environnements aux ressources limitées. DMQ combine la mise à l'échelle équivalente apprise (LES) et la mise à l'échelle puissance de deux par canal (PTS) afin de réduire les erreurs de quantification. Plus précisément, nous introduisons un schéma de pondération adaptative des pas de temps qui prend en compte l'importance de l'étape initiale de suppression du bruit et appliquons la PTS par canal à des couches telles que les connexions sautées présentant une variance inter-canaux importante. Nous utilisons un algorithme de vote pour une sélection stable des coefficients PTS, même dans les petits ensembles de compensation. Les résultats expérimentaux montrent que DMQ surpasse les méthodes existantes, notamment à faible largeur de bit comme W4A6 et W4A8, tout en maintenant une qualité de génération d'images élevée et une stabilité du modèle. Le code source est disponible sur GitHub.