यह पत्र क्वांटिज़ेशन पर चर्चा करता है, जो पूर्व-प्रशिक्षित बड़े-स्केल मॉडल की मेमोरी और कम्प्यूटेशनल लागत को कम करने के लिए व्यापक रूप से उपयोग की जाने वाली संपीड़न तकनीक है। विशेष रूप से, स्केल किए गए पूर्णांक ग्रिड पर मानों के साथ भार मानों को बदलने के लिए एक उपयुक्त स्केलिंग कारक का चयन करना चैनल-वार पोस्ट-ट्रेनिंग क्वांटिज़ेशन (PTQ) में एक महत्वपूर्ण चुनौती है। मौजूदा विधियाँ आमतौर पर हेयुरिस्टिक ट्यूनिंग या ग्रिड सर्च के माध्यम से पहले से ही स्केल तय कर लेती हैं। इस पत्र में, हम बीकन का प्रस्ताव करते हैं, जो एक सरल और प्रभावी एल्गोरिथ्म है जो मैनुअल ट्यूनिंग की आवश्यकता को समाप्त करता है। बीकन एक अनस्केल्ड ग्रिड का उपयोग करके सीधे चैनल-वार PTQ करता है और स्केलर क्वांटिज़ेशन के ज्यामितीय गुणों का लाभ उठाकर स्वचालित रूप से इष्टतम स्केलिंग कारक निर्धारित करता है।