본 논문은 시각적 스토리 생성에서 등장인물의 일관성과 지칭 일치 문제를 해결하기 위해 등장인물 중심 스토리 생성이라는 새로운 과제를 제시합니다. 기존 시각적 스토리 생성 방법론이 등장인물을 제대로 다루지 못해 스토리가 일반적이고 부정확하다는 문제점을 지적하며, VIST 벤치마크를 기반으로 시각 및 텍스트적 등장인물 공참조 체인으로 강화된 새로운 데이터셋을 구축합니다. 이를 통해 등장인물의 일관성과 지칭 일치를 향상시킨 모델을 제시하고, 새로운 평가 지표를 제안하여 실험적으로 모델의 우수성을 검증합니다.