본 논문은 얼굴 표정 인식의 핵심이 얼굴 표정 역학을 내포하는 차별적인 시공간 표현을 학습하는 데 있다는 점에 착안하여, 기존 연구들이 얼굴 외관 표현 학습에 사전 훈련된 CNN에 의존하고 얼굴 영역 간의 관계를 간과하는 문제점을 해결하고자 한다. 이를 위해, ARPGNet이라는 외관 및 관계 인식 병렬 그래프 어텐션 융합 네트워크를 제안한다. ARPGNet은 얼굴 영역 관계 그래프를 구축하고 그래프 어텐션 메커니즘을 활용하여 얼굴 영역 간의 관계를 모델링한다. CNN 기반 외관 표현 시퀀스와 함께 생성된 관계 표현 시퀀스는 병렬 그래프 어텐션 융합 모듈에 입력되어 상호 작용 및 향상을 이룬다. 이 모듈은 서로 다른 표현 시퀀스 간의 상호 보완성과 각 시퀀스 내의 시간적 역학을 동시에 탐구한다. 세 가지 얼굴 표정 인식 데이터셋에 대한 실험 결과, 제안된 ARPGNet이 최첨단 방법과 비교하여 우수한 성능을 보이거나 동등한 성능을 달성함을 입증했다.