본 논문은 다중 모달 대규모 언어 모델(MLLM)의 기하학적 추론 능력 향상을 위해 고품질의 대규모 데이터를 생성하는 새로운 신경-기호 프레임워크인 NeSyGeo를 제안합니다. 기존 방법들의 다양성 및 수치적 일반화의 한계를 극복하기 위해, 엔티티-관계-제약 패러다임에 기반한 도메인 특화 언어를 제안하고, 이를 통해 기하학 문제를 포괄적으로 표현하고 생성적 행동을 정의합니다. 이를 기반으로 기호 시퀀스를 생성하고 시각 및 텍스트 표현으로 매핑하여 다양한 질문-답변(Q&A) 쌍을 생성하는 기호-시각-텍스트 파이프라인을 설계합니다. NeSyGeo 프레임워크를 사용하여 10만 개의 샘플을 포함하는 NeSyGeo-CoT 및 NeSyGeo-Caption 데이터셋을 구축하고, MLLM의 기하학적 추론 능력 평가를 위한 새로운 벤치마크인 NeSyGeo-Test를 공개합니다. 실험 결과, NeSyGeo는 강화 학습 및 지도 학습 미세 조정 모두에서 여러 MLLM의 성능을 상당하고 일관되게 향상시키는 것을 보여줍니다.