Cet article souligne l'importance du découpage, qui divise les documents en unités interrogeables, dans la génération de code à grande échelle basée sur la génération augmentée par récupération (RAG). La méthode actuelle de découpage par lignes présente le problème de la rupture de la structure sémantique et de la baisse de la qualité de la génération. Dans cet article, nous proposons une méthode de découpage sensible à la structure utilisant l'arbre de syntaxe abstrait (AST). Le découpage basé sur l'AST divise récursivement les grands nœuds AST en segments plus petits et fusionne les nœuds frères tout en respectant la contrainte de taille pour générer des unités sémantiquement cohérentes et auto-complètes. Il montre une amélioration des performances dans diverses tâches de génération de code, améliorant Recall@5 de 4,3 points dans la recherche RepoEval et Pass@1 de 2,67 points dans la génération SWE-bench. Cette étude démontre l'importance du découpage sensible à la structure pour étendre l'intelligence du code basée sur la récupération.