본 논문은 비디오의 감정적 영향을 이해하는 데 있어 시각적 주목도(visual saliency)의 역할을 강조하며, 딥러닝을 활용한 새로운 주목도 기반 감정 예측 방법을 제시합니다. HD2S 주목도 모델과 OpenFace 얼굴 액션 유닛 분석을 사용하여 비디오의 주목도 영역 크기와 주목도 영역 개수라는 두 가지 주요 특징을 추출하고, 이를 시청자의 감정과 연관시켜 분석합니다. 연구 결과, 다수의 주목도 영역을 가진 비디오는 고쾌감(high-valence), 저각성(low-arousal) 감정을 유발하고, 단일 지배적 주목도 영역을 가진 비디오는 저쾌감(low-valence), 고각성(high-arousal) 감정을 유발하는 경향이 있음을 밝힙니다. 또한, 자가 보고된 감정과 얼굴 표정 기반 감정 탐지는 종종 불일치하는 것을 발견하여 주관적 보고의 한계를 시사합니다. 본 연구는 주목도 기반 통찰력을 활용하여 계산 효율적이고 해석 가능한 감정 모델링 대안을 제공하며, 콘텐츠 제작, 개인 맞춤형 미디어 경험, 그리고 감성 컴퓨팅 연구에 시사점을 제공합니다.