Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

HFuzzer: Testing Large Language Models for Package Hallucinations via Phrase-based Fuzzing

Created by
  • Haebom

저자

Yukai Zhao, Menghan Wu, Xing Hu, Xin Xia

개요

대규모 언어 모델(LLM)은 코드 생성에 널리 사용되지만, 존재하지 않는 패키지를 추천하는 패키지 환각으로 인해 실제 생산에 적용할 때 심각한 보안 위험에 직면한다. 이러한 환각은 악의적인 공격자가 유해한 패키지를 등록하기 위해 이를 악용하는 소프트웨어 공급망 공격에 악용될 수 있다. 본 연구에서는 패키지 환각을 완화하고 잠재적 공격으로부터 방어하기 위해 LLM의 패키지 환각 테스트가 중요함을 강조하며, 이를 위해 새로운 구문 기반 퍼징 프레임워크인 HFUZZER를 제안한다. HFUZZER는 퍼징 기술을 채택하고 구문을 기반으로 모델이 더 광범위한 합리적인 정보를 추론하도록 유도하여 충분하고 다양한 코딩 작업을 생성한다. 또한, 패키지 정보 또는 코딩 작업에서 구문을 추출하여 구문과 코드의 관련성을 보장함으로써 생성된 작업과 코드의 관련성을 향상시킨다. 여러 LLM에 대한 HFUZZER의 평가 결과, 모든 선택된 모델에서 패키지 환각이 유발되었으며, 돌연변이 퍼징 프레임워크에 비해 HFUZZER는 2.60배 더 많은 고유한 환각 패키지를 식별하고 더 다양한 작업을 생성했다. 또한 GPT-4o를 테스트했을 때, HFUZZER는 46개의 고유한 환각 패키지를 발견했다. 추가 분석 결과, GPT-4o의 경우 LLM은 코드 생성뿐만 아니라 환경 구성 지원 시에도 패키지 환각을 보이는 것으로 나타났다.

시사점, 한계점

시사점:
패키지 환각 문제를 해결하기 위한 새로운 프레임워크 HFUZZER 제안
HFUZZER는 다양한 LLM에서 패키지 환각을 유발하는 데 효과적임을 입증
GPT-4o와 같은 최신 모델에서도 패키지 환각 현상 확인
코드 생성뿐 아니라 환경 구성 지원 시에도 패키지 환각 발생 가능성 확인
한계점:
구체적인 한계점에 대한 정보는 논문에 명시되지 않음 (요약본 기준)
👍