इस शोधपत्र में, हम मशीनों के लिए ऑडियो कोडिंग (ACoM) पर केंद्रित, पूर्व-प्रशिक्षित वाक्/श्रव्य मॉडलों के मध्यवर्ती फ़ीचर निरूपणों को कुशलतापूर्वक संपीड़ित और परिमाणित करने की एक नवीन विधि प्रस्तुत करते हैं। उच्च-निष्ठा पुनर्निर्माण पर केंद्रित पारंपरिक न्यूरल ऑडियो कोडेक्स के विपरीत, हमारे अध्ययन का उद्देश्य उप-कार्य प्रदर्शन को प्राथमिकता देकर अति-निम्न बिटरेट (<200 bps) पर भी उप-मॉडल प्रदर्शन में गिरावट को कम करना है। अवशिष्ट वेक्टर परिमाणीकरण (RVQ) हानि और कार्य-विशिष्ट हानि मार्गदर्शन का लाभ उठाकर, हम एक टोकनाइज़र बनाते हैं जिसे विभिन्न बिटरेट और मॉडल आकारों पर लागू किया जा सकता है, और स्वचालित वाक् पहचान और ऑडियो वर्गीकरण कार्यों पर इसकी प्रभावशीलता प्रदर्शित करते हैं।