본 논문은 대규모 언어 모델(LLM)이 생성하는 3D 모델의 기하학적 및 구조적 정확도를 정량적으로 평가하기 위한 인간 참여 프레임워크를 제시합니다. LLM이 2D 정투영도, 등각 스케치, 기하 구조 트리, 코드 기반 수정 프롬프트 등 다양한 입력 모드를 통해 L 브라켓 구성 요소를 생성하는 실험을 통해, 부피 정확도, 표면 정렬, 치수 정확도, 위상 복잡성 등의 유사성 및 복잡성 측정 기준을 사용하여 생성된 모델을 기준 CAD 모델과 비교 평가합니다. 결과적으로, 의미론적 풍부함이 증가할수록 생성 정확도가 향상되며, 코드 수준 프롬프트는 모든 측정 기준에서 완벽한 재구성을 달성함을 보여줍니다. 본 논문의 정량적 평가 접근 방식은 기존의 정성적 방법보다 지상 진실에 대한 수렴 속도를 훨씬 빠르게 한다는 것을 보여주며, AI 지원 형태 합성에 대한 이해를 높이고 다양한 CAD 응용 프로그램을 위한 생성 모델을 검증하고 개선하기 위한 확장 가능한 방법론을 제공합니다.