본 논문은 텍스트 기반 계산 그래프 내에서 코드를 대상으로 시뮬레이터 구성을 인스턴스 최적화로 처리하는 종단간 에이전트 프레임워크인 SOCIA-Nabla를 제시합니다. LLM 기반 에이전트가 그래프 노드로 임베딩되고, 워크플로 관리자가 손실 기반 루프(코드 합성 -> 실행 -> 평가 -> 코드 복구)를 실행합니다. 최적화기는 Textual-Gradient Descent (TGD)를 수행하며, 인간의 개입은 작업 관련 확인에만 사용되어 전문 지식을 최소화하고 코드를 훈련 가능한 객체로 유지합니다. User Modeling, Mask Adoption, Personal Mobility의 세 가지 CPS 작업에서 SOCIA-Nabla는 최고 수준의 전체 정확도를 달성했습니다. 다중 에이전트 오케스트레이션을 손실 정렬 최적화 관점으로 통합하여, SOCIA-Nabla는 깨지기 쉬운 프롬프트 파이프라인을 도메인 및 시뮬레이션 세분성에 걸쳐 확장 가능한, 제약 조건 인식 시뮬레이터 코드 생성으로 변환합니다.