Retrieval-Augmented Generation (RAG) 기반 대규모 코드 생성에서 중요한 역할을 하는 chunking(문서를 검색 가능한 단위로 분할하는 과정)의 문제점을 지적하고, 이를 해결하기 위해 Abstract Syntax Trees (AST)를 활용한 구조 인식 chunking 방법론을 제안한다. 제안하는 방법론은 AST 노드를 재귀적으로 분할하고, 크기 제한을 준수하면서 형제 노드를 병합하여 언어 및 작업에 걸쳐 의미적으로 일관된 자체 포함 단위를 생성한다. RepoEval 검색에서 Recall@5를 4.3점, SWE-bench 생성에서 Pass@1을 2.67점 향상시키는 등 다양한 코드 생성 작업에서 성능 향상을 보인다.