Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SemanticForge: Repository-Level Code Generation through Semantic Knowledge Graphs and Constraint Satisfaction

Created by
  • Haebom
Category
Empty

저자

Wuyang Zhang, Chenkai Zhang, Zhen Luo, Jianming Ma, Wangming Yuan, Chuqiao Gu, Chenwei Feng

개요

대규모 언어 모델(LLM)이 자동 코드 생성을 통해 소프트웨어 개발을 혁신했지만, 실제 배포를 제한하는 체계적인 오류를 자주 겪는다. 본 논문은 LLM의 두 가지 주요 실패 모드인 논리적 환각(잘못된 제어/데이터 흐름 추론)과 개략적 환각(유형 불일치, 서명 위반, 아키텍처 불일치)을 식별한다. 이러한 오류는 저장소 전체 의미론에 대한 명시적이고 쿼리 가능한 표현이 부재하기 때문에 발생한다. 본 논문은 의미론적 인식을 갖춘 코드 생성을 위한 SemanticForge를 제시하며, (1) 정적 및 동적 지식 그래프를 통합하는 자동 조정 알고리즘, (2) 자연어로부터 구조화된 그래프 쿼리를 생성하는 신경망 기반 접근 방식(73% 정밀도), (3) 생성 중 실시간 제약 검증을 가능하게 하는 빔 서치 알고리즘, (4) 의미론적 등가성을 유지하면서 $O(|\Delta R| \cdot \log n)$ 시간에 지식 그래프를 업데이트하는 점진적 유지 관리 알고리즘의 네 가지 알고리즘적 발전을 소개한다.

시사점, 한계점

시사점:
컴파일 시점과 런타임 프로그램 의미론을 통합하는 새로운 자동 조정 알고리즘 제시.
자연어로부터 구조화된 그래프 쿼리를 생성하는 신경망 기반 접근 방식 개발.
실시간 제약 검증을 가능하게 하는 빔 서치 알고리즘 도입.
지식 그래프를 효율적으로 업데이트하는 점진적 유지 관리 알고리즘 개발.
한계점:
논문 내용 요약에 구체적인 한계점이 명시적으로 언급되지 않음.
👍