यह शोधपत्र Comp-Comp प्रस्तुत करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) के डोमेन-विशिष्ट मूल्यांकन हेतु एक बेंचमार्किंग ढाँचा है। मौजूदा बड़े पैमाने के डेटा-आधारित बेंचमार्किंग विधियों के विपरीत, Comp-Comp व्यापकता और संक्षिप्तता के आधार पर डोमेन-व्यापी पहलुओं का सटीक और कुशलतापूर्वक मूल्यांकन करता है। बोधगम्यता अर्थ-बोध को बढ़ाती है, जबकि संक्षिप्तता अतिरेक और शोर को कम करती है, जिससे परिशुद्धता में सुधार होता है। एक विश्वविद्यालय पर केंद्रित एक केस स्टडी के माध्यम से, यह शोधपत्र Comp-Comp का उपयोग करके एक उच्च-गुणवत्तापूर्ण, बड़े पैमाने के शैक्षणिक बेंचमार्क, PolyBench, के विकास की प्रक्रिया को प्रदर्शित करता है। यह Comp-Comp ढाँचे की विभिन्न क्षेत्रों में प्रयोज्यता को प्रदर्शित करता है।