En este artículo, proponemos un modelo mejorado de aprendizaje profundo basado en ConvNeXt para optimizar la precisión de la clasificación del tamaño de rocas. El modelo propuesto, CNSCA, mejora la estructura básica de ConvNeXt al incorporar mecanismos de autoatención y atención de canal. El mecanismo de autoatención captura dependencias espaciales de largo alcance, mientras que el mecanismo de atención de canal enfatiza los canales de características ricos en información, capturando eficazmente patrones locales de grano fino y relaciones contextuales amplias. Evaluamos el modelo utilizando un conjunto de datos de clasificación del tamaño de rocas y lo comparamos con tres modelos de referencia robustos. Nuestros resultados demuestran que la incorporación del mecanismo de atención mejora significativamente el rendimiento del modelo en tareas de clasificación de grano fino que involucran texturas naturales como las rocas.