본 논문은 Python, JavaScript와 같은 인기 프로그래밍 언어가 중앙 집중식 패키지 저장소와 오픈소스 소프트웨어에 의존하고, 코드 생성 대규모 언어 모델(LLM)이 등장함에 따라 소프트웨어 공급망에 새로운 유형의 위협인 "패키지 환각(package hallucinations)"을 제시한다. LLM을 사용하여 코드를 생성할 때 발생하는 사실과 상충되는 오류로 인해 발생하는 이러한 환각은 소프트웨어 공급망의 무결성에 심각한 위협이 되는 새로운 유형의 패키지 혼란 공격을 나타낸다. 본 논문은 다양한 프로그래밍 언어, 설정 및 매개변수에 걸쳐 패키지 환각을 엄격하고 포괄적으로 평가하여 다양한 모델과 구성이 잘못된 패키지 권장 사항을 생성할 가능성에 어떻게 영향을 미치는지, 그리고 이 현상의 근본 원인을 파악한다. 코드 생성을 위한 16개의 인기 있는 LLM과 두 개의 고유한 프롬프트 데이터 세트를 사용하여 두 가지 프로그래밍 언어로 576,000개의 코드 샘플을 생성하고 패키지 환각을 분석한다. 연구 결과, 상용 모델의 경우 평균 환각 패키지 비율이 최소 5.2%, 오픈소스 모델의 경우 21.7%이며, 205,474개의 고유한 환각 패키지 이름 사례가 더 추가되어 이 위협의 심각성과 만연성을 더욱 강조한다. 이 문제를 해결하기 위해 여러 가지 환각 완화 전략을 구현하고 코드 품질을 유지하면서 패키지 환각 수를 크게 줄일 수 있음을 보여준다. 실험 및 연구 결과는 최첨단 LLM을 코드 생성에 사용할 때 패키지 환각이 지속적이고 전반적인 현상이며 연구 커뮤니티의 긴급한 관심이 필요한 중요한 과제임을 강조한다.