본 논문은 GPT-4o와 Claude 3.5 두 시스템을 이용하여 팔라디오의 건축물(빌라 로톤다와 팔라초 포르토)을 대상으로 3D 건축 모델 합성 작업의 비교 평가를 수행한 연구입니다. 텍스트 및 이미지 프롬프트를 순차적으로 사용하여, 시스템의 2D 및 3D 건축물 해석, CAD 스크립트 생성, 그리고 출력 기반 자기 개선 능력을 평가했습니다. 두 시스템 모두 개별 부품 생성에는 성공하였으나, 공간적 관계를 정확하게 조합하는 데 어려움을 보였으며, Claude 3.5가 특히 자기 수정 능력에서 더 나은 성능을 보였습니다. 이 연구는 전문 지식이 필요한 지능적인 인간 작업 수행에 있어 상용 AI 시스템의 강점과 약점을 벤치마킹하는 연구에 기여합니다.