본 논문은 이미지가 어떻게 풍부한 의미를 전달하고 인간의 인식에서 감정을 불러일으키는지 이해하려는 관심이 증가함에 따라 주목받고 있는 시각적 감정 분석에 대해 다룹니다. 기존의 시각적 감정 분석 방법들이 일반적인 시각적 특징과 그것이 불러일으키는 다양한 정서적 상태 사이의 복잡한 관계(정서적 간극)를 간과하는 문제점을 지적하며, 이를 해결하기 위해 밝기, 채도, 장면 이해, 얼굴 표정 등 네 가지 주요 속성을 활용하는 심층 표현 네트워크 A4Net을 제안합니다. A4Net은 속성 인식과 시각적 감정 분석의 모든 측면을 융합하고 공동으로 학습하여 이미지의 감정적 내용에 대한 더 나은 통찰력을 제공하고자 합니다. 다양한 시각적 감정 데이터 세트에서 최첨단 방법과 비교하여 경쟁력 있는 성능을 보여주는 실험 결과와 A4Net에 의해 생성된 활성화 맵의 시각화를 통해 다양한 시각적 감정 데이터 세트에서의 일반화 능력을 보여줍니다.