Dans cet article, nous proposons une nouvelle technique de quantification post-apprentissage à précision mixte, la quantification par circuit de tâches (TaCQ), pour résoudre le problème de dégradation des performances en quantification low-bit (2-3 bits). TaCQ conditionne directement le processus de quantification sur le circuit de pondération, un ensemble de pondérations liées à la performance d'une tâche spécifique. Les pondérations importantes pour la performance d'une tâche spécifique sont conservées sur 16 bits, tandis que les pondérations restantes sont quantifiées, réduisant ainsi efficacement l'utilisation de la mémoire tout en minimisant la dégradation des performances. Nous utilisons les informations de gradient pour prédire les variations de pondération dues à la quantification et leur impact sur les performances des tâches. Nous démontrons expérimentalement qu'elle surpasse les méthodes existantes sur diverses tâches (AQ, raisonnement mathématique, texte-à-SQL) et modèles (Llama-3, Qwen2.5), en utilisant des données génériques et spécifiques à une tâche. En particulier, elle permet d'obtenir des améliorations significatives des performances par rapport aux méthodes de pointe existantes dans les environnements de quantification 2 et 3 bits.