본 연구는 확산적 사고 과제에서 대규모 언어 모델이 인간의 창의적 수행 능력에 필적한다는 최근 연구와 달리, 시각적 창의성은 아직 충분히 연구되지 않았다는 점에 주목했다. 이에 이미지 생성 인공지능 모델과 인간 참여자(시각 예술가 및 비예술가) 간의 이미지 생성을 비교했다. 인간 심사자(N=255)와 GPT-4o는 생성된 이미지의 창의성을 평가했다. 그 결과, 시각 예술가가 가장 창의적이고, 다음으로 비예술가, 인간의 지시를 받은 생성형 AI, 그리고 자체적으로 생성된 AI 순으로 창의성 등급이 나타났다. 인간의 지시가 증가할수록 생성형 AI의 창의적 결과물이 크게 향상되었으며, 비예술가의 결과물에 근접했다. 또한, 인간 심사자와 AI 심사자는 창의성 판단 패턴에서 큰 차이를 보였다.