इस पत्र में, हम चट्टान आकार वर्गीकरण की सटीकता में सुधार के लिए ConvNeXt पर आधारित एक बेहतर गहन शिक्षण मॉडल प्रस्तावित करते हैं। प्रस्तावित मॉडल, CNSCA, स्व-ध्यान और चैनल-ध्यान तंत्रों को जोड़कर ConvNeXt की मूल संरचना में सुधार करता है। स्व-ध्यान तंत्र लंबी दूरी की स्थानिक निर्भरताओं को पकड़ता है, जबकि चैनल-ध्यान तंत्र सूचना-समृद्ध फ़ीचर चैनलों पर ज़ोर देता है, और सूक्ष्म स्थानीय पैटर्न और व्यापक संदर्भ संबंधों को प्रभावी ढंग से पकड़ता है। हम एक चट्टान आकार वर्गीकरण डेटासेट का उपयोग करके मॉडल का मूल्यांकन करते हैं और इसकी तुलना तीन मज़बूत आधारभूत मॉडलों से करते हैं। हमारे परिणाम दर्शाते हैं कि ध्यान तंत्र को शामिल करने से चट्टानों जैसी प्राकृतिक बनावटों से जुड़े सूक्ष्म वर्गीकरण कार्यों में मॉडल के प्रदर्शन में उल्लेखनीय सुधार होता है।