यह शोधपत्र SegQuant का प्रस्ताव करता है, जो प्रसार मॉडलों की गणना लागत को कम करने के लिए एक नवीन परिमाणीकरण ढाँचा है। मौजूदा प्रशिक्षण-पश्चात परिमाणीकरण (PTQ) विधियों की चुनौतियों का समाधान करते हुए, जो मॉडल संरचना में अपनी विशिष्टता के कारण सामान्यीकरण में कठिनाई का सामना करती हैं, SegQuant, SegLinear रणनीति, जो संरचनात्मक अर्थविज्ञान और स्थानिक विषमता को समाहित करती है, को DualScale तकनीक, जो ध्रुवीय असममित सक्रियण को संरक्षित करती है, के साथ संयोजित करता है, जिससे मॉडलों की एक विस्तृत श्रृंखला में उच्च प्रदर्शन और प्रयोज्यता प्राप्त होती है। यह ट्रांसफॉर्मर-आधारित प्रसार मॉडलों सहित मॉडलों की एक विस्तृत श्रृंखला पर लागू होता है, और प्रमुख परिनियोजन उपकरणों के साथ संगतता सुनिश्चित करता है।