본 논문은 멀티모달 대규모 언어 모델(MLLMs)의 구조화된 차트 이해 능력을 평가하기 위한 새로운 벤치마크인 ChartAnchor를 제안합니다. Chart grounding은 차트의 시각적 표현과 구조화된 의미론 간의 양방향 정렬을 의미하며, 이는 차트의 시각적 및 구조적 의도를 충실하게 포착하는 기호적 사양을 생성하고 정확한 값과 관계를 가진 기본 테이블 데이터를 복구하는 것을 요구합니다. ChartAnchor는 30가지 차트 유형을 포함하는 8,000개 이상의 차트-테이블-코드 트리플로 구성되며, 차트-코드 생성 및 제어된 차트-테이블 재구성을 포함하는 두 가지 상호 보완적인 작업을 도입하여 시각적 및 수치적 충실도를 교차 검증합니다. 또한, 의미론적 유효성 검사, 스타일 분석, 지각적 메트릭을 통합한 다단계 평가 프레임워크를 활용합니다. MLLMs에 대한 광범위한 실험을 통해 수치적 정밀도 및 코드 생성의 한계점을 발견하고, 표면적인 인식 이상의 구조적 추론의 필요성을 강조합니다.