본 논문은 Retrieval-Augmented Code Generation (RACG)에서 코드 검색의 특징을 분석하고, 기능을 유지하면서 특정 특징을 체계적으로 마스킹하는 실험을 수행합니다. 실험 결과, 기존 코드 검색 모델이 docstring이나 식별자 이름과 같은 표면적인 문자 특징에 크게 의존하고, 관련성이 없더라도 잘 문서화된 코드에 편향되어 있음을 발견했습니다. 이를 바탕으로, 코드 또는 구조적 지식에 의미 정보를 추가하여 문자 정보를 풍부하게 하고 편향성을 줄이는 SACL 프레임워크를 제안합니다. 실험 결과, SACL은 HumanEval, MBPP, SWE-Bench-Lite에서 코드 검색 성능을 크게 향상시키고 (예: Recall@1에서 각각 12.8%, 9.4%, 7.0% 향상), 코드 생성 성능 또한 향상시킴을 보여줍니다 (예: HumanEval에서 Pass@1 기준 4.88% 향상).