만화와 같은 멀티모달 스토리텔링을 위한 계층적 지식 그래프 프레임워크를 제시한다. 이 프레임워크는 패널, 이벤트, 매크로 이벤트의 세 가지 레벨로 서사 내용을 구성하며, 의미적, 공간적, 시간적 관계를 인코딩하는 심볼릭 그래프를 통합한다. 패널 레벨에서는 캐릭터, 객체, 액션과 같은 시각적 요소와 대화 및 내레이션과 같은 텍스트 요소를 모델링한다. 이들은 서사 시퀀스 및 추상적인 스토리 구조를 포착하는 상위 레벨 그래프에 체계적으로 연결된다. Manga109 데이터셋의 수동으로 주석이 달린 하위 집합에 적용하여, 액션 검색, 대화 추적, 캐릭터 등장 매핑, 타임라인 재구성과 같은 4가지 대표적인 작업에 대해 해석 가능한 심볼릭 추론을 지원한다. 예측 성능을 우선시하기보다는, 서사 모델링의 투명성을 강조하고 사건 분할 및 시각적 스토리텔링에 대한 인지 이론에 맞춰 구조화된 추론을 가능하게 한다.