이 논문은 LLM(거대 언어 모델) API 호출이 기존 프로그램 분석의 한계를 넘어선다는 문제를 제기합니다. LLM 호출은 런타임 값을 자연어 프롬프트로 전달하고, 불투명한 LLM 내부 처리를 거쳐 코드, SQL, JSON 등으로 다시 출력되므로 기존 데이터 흐름 분석을 방해합니다. 연구진은 정보 보존 수준과 출력 형식을 기준으로 24가지 라벨을 정의하는 새로운 분류 체계를 개발하여 이 NL/PL(자연어/프로그래밍 언어) 경계를 효과적으로 연결합니다.