본 논문은 Text-to-Image (TTI) 확산 모델이 생성하는 이미지의 역사적 정확성을 평가하는 체계적이고 재현 가능한 방법론을 제시합니다. 세 개의 최첨단 확산 모델을 사용하여 다양한 역사 시대를 묘사하는 신중하게 설계된 프롬프트로 30,000개의 합성 이미지를 생성한 HistVis 데이터셋을 소개합니다. 이 데이터셋을 이용하여 생성된 이미지의 암묵적 스타일 연관성, 역사적 일관성, 인구 통계적 표현 세 가지 측면을 평가합니다. 결과적으로 TTI 모델이 과거 시대를 고정관념화하고, 시대착오적인 요소를 도입하며, 사실적인 인구 통계적 패턴을 반영하지 못하는 등 체계적인 부정확성을 보이는 것을 발견했습니다. 본 연구는 생성 이미지의 역사적 표현을 평가하기 위한 확장 가능한 방법론과 벤치마크를 제공하여, 역사적으로 정확하고 문화적으로 일치하는 TTI 모델을 구축하기 위한 초기 단계를 제시합니다.