본 논문은 AI 기반 코드 생성 기술의 발전으로 자연어 명령어를 통해 기존 코드를 수정하여 시각적 결과(그림이나 이미지)를 변경하는 것이 가능해졌지만, 전문 개발자조차도 관련 코드 영역 식별, 유효한 코드 변형 생성, 사용자 의도와의 일치성 확보 등의 어려움을 겪는다는 점을 지적합니다. 이에 따라, LLMs(대규모 언어 모델)이 시각적 결과의 일관성을 유지하면서 코드를 수정하는 능력을 평가하기 위한 첫 번째 벤치마크인 vTikZ를 제안합니다. vTikZ는 신중하게 선별된 vTikZ 편집 시나리오, 매개변수화된 정답, 그리고 시각적 피드백을 활용하여 정확성을 평가하는 검토 도구로 구성됩니다. 최첨단 LLMs를 이용한 실험적 평가 결과, 기존 솔루션은 시각적 의도와 일치하게 코드를 수정하는 데 어려움을 겪는다는 것을 보여주며, 현재 AI 지원 코드 편집 방식의 한계를 강조합니다. vTikZ는 TikZ를 넘어 이미지 처리, 예술 창작, 웹 디자인, 3D 모델링 등 다양한 분야에서 시각적 피드백 메커니즘과 LLMs를 통합하는 새로운 연구 방향을 제시합니다.