Este artículo propone SegQuant, un novedoso marco de cuantificación para reducir el coste computacional de los modelos de difusión. Para abordar los desafíos de los métodos de cuantificación post-entrenamiento (PTQ) existentes, que presentan dificultades de generalización debido a su especificidad en la estructura del modelo, SegQuant combina la estrategia SegLinear, que captura la semántica estructural y la heterogeneidad espacial, con la técnica DualScale, que preserva la activación asimétrica polar, para lograr un alto rendimiento y aplicabilidad a una amplia gama de modelos. Es aplicable a una amplia gama de modelos, incluidos los modelos de difusión basados en transformadores, y garantiza la compatibilidad con las principales herramientas de implementación.