본 논문은 소스 코드 분석에 점점 더 많이 사용되고 있는 대규모 언어 모델(LLM)과 트랜스포머 기반 아키텍처의 역할을 탐구한다. 복잡해지는 소프트웨어 시스템에서 LLM을 코드 분석 워크플로에 통합하는 것은 효율성, 정확성 및 자동화를 향상시키기 위해 필수적이다. 논문은 세 가지 주요 측면, 즉 1) LLM이 분석할 수 있는 대상 및 응용 분야, 2) 사용되는 모델, 3) 사용되는 데이터셋 및 직면하는 과제에 초점을 맞춰 LLM의 역할을 조사한다. 연구 목표는 소스 코드 분석에 LLM을 사용하는 학술 논문을 조사하여 연구 개발, 현재 동향 및 이 신흥 분야의 지적 구조를 밝히는 것이다. 또한, 한계점을 요약하고 향후 연구에 귀중한 도움이 될 수 있는 필수 도구, 데이터셋 및 주요 과제를 강조한다.