본 논문은 창작 활동에 사용되는 언어 모델의 사회적 영향에 대한 우려를 제기하며, 기존 벤치마크의 한계와 실제 사용 사례 간의 불일치를 지적한다. 2백만 개의 사용자 프롬프트를 분석하여 창작 활동이 주요 사용 사례임을 밝히고, 이러한 활동에서 AI 생성 콘텐츠의 부정적 영향이 나타날 가능성을 강조한다. 따라서 창작 활동에 초점을 맞춘 새로운 벤치마크 개발의 필요성을 주장하며, 모델의 발전과 영향을 효과적으로 측정하기 위한 사용 패턴의 투명성 확보를 촉구한다.