대규모 언어 모델(LLM)이 자동 코드 생성을 통해 소프트웨어 개발을 혁신했지만, 실제 배포를 제한하는 체계적인 오류를 자주 겪는다. 본 논문은 LLM의 두 가지 주요 실패 모드인 논리적 환각(잘못된 제어/데이터 흐름 추론)과 개략적 환각(유형 불일치, 서명 위반, 아키텍처 불일치)을 식별한다. 이러한 오류는 저장소 전체 의미론에 대한 명시적이고 쿼리 가능한 표현이 부재하기 때문에 발생한다. 본 논문은 의미론적 인식을 갖춘 코드 생성을 위한 SemanticForge를 제시하며, (1) 정적 및 동적 지식 그래프를 통합하는 자동 조정 알고리즘, (2) 자연어로부터 구조화된 그래프 쿼리를 생성하는 신경망 기반 접근 방식(73% 정밀도), (3) 생성 중 실시간 제약 검증을 가능하게 하는 빔 서치 알고리즘, (4) 의미론적 등가성을 유지하면서 $O(|\Delta R| \cdot \log n)$ 시간에 지식 그래프를 업데이트하는 점진적 유지 관리 알고리즘의 네 가지 알고리즘적 발전을 소개한다.