Dans cet article, nous proposons une technique améliorée de quantification vectorielle (VQ) pour les modèles de langage légers à grande échelle (LLM). Alors que la VQ conventionnelle quantifie à la fois la direction et la magnitude d'un vecteur, nous constatons que la direction est beaucoup plus sensible à la quantification que la magnitude. Par conséquent, nous proposons une technique de quantification vectorielle séparable en coordonnées polaires (PCDVQ) qui transforme les vecteurs en coordonnées polaires et quantifie la direction et la magnitude indépendamment. PCDVQ inclut également un module de construction de livre de codes aligné sur la distribution (DACC) qui optimise le livre de codes en fonction de la distribution de la direction et de la magnitude. Les résultats expérimentaux montrent que PCDVQ améliore la précision du zéro-shot d'au moins 1,5 % par rapport aux méthodes conventionnelles en quantification 2 bits.