본 논문은 ConvNeXt 계열의 CNN 모델이 얼굴 표정 인식(FER)을 포함한 다양한 영상 분류 작업에서 효과적임을 재확인하고, Triplet attention과 Squeeze-and-Excitation을 결합한 새로운 attention mechanism인 TripSE를 제안합니다. ResNet18, DenseNet, ConvNeXt 세 가지 기본 구조에 TripSE 블록을 추가하여 다양한 데이터셋(CIFAR100, ImageNet, FER2013, AffectNet)에서 성능을 평가했습니다. 그 결과, 특히 ConvNeXt 구조에서 TripSE 블록이 성능 향상에 기여하며, ConvNeXt와 TripSE 조합은 FER2013 데이터셋에서 78.27%의 정확도를 달성하여 최첨단 성능을 보였습니다.