본 연구는 심층 학습 모델 훈련을 위한 널리 사용되는 얼굴 표정 인식(FER) 데이터셋의 주요 특징과 적합성을 조사합니다. 24개의 FER 데이터셋(아동, 성인, 노인 등 특정 연령대를 대상으로 하는 데이터셋 포함)을 수집하고 분석하여 포괄적인 정규화 과정을 거쳤으며, 나이와 성별에 대한 자동 주석을 추가하여 인구 통계적 특성에 대한 보다 세부적인 평가를 가능하게 했습니다. 데이터셋의 효율성을 평가하기 위해 데이터셋의 어려움, 일반화 능력 및 데이터셋 간 전이 가능성을 정량적으로 측정하는 세 가지 새로운 지표(Local, Global, Paired Similarity)를 제시했습니다. 최첨단 신경망을 사용한 벤치마크 실험을 통해 대규모 자동 수집 데이터셋(예: AffectNet, FER2013)은 라벨링 노이즈 및 인구 통계적 편향 문제에도 불구하고 더 나은 일반화 성능을 보이는 반면, 통제된 데이터셋은 더 높은 주석 품질을 제공하지만 변동성이 제한적임을 밝혔습니다. 본 연구 결과는 더욱 강력하고 공정하며 효과적인 FER 시스템 개발을 위한 데이터셋 선택 및 설계에 대한 실행 가능한 권장 사항을 제공합니다.