Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ShED-HD: A Shannon Entropy Distribution Framework for Lightweight Hallucination Detection on Edge Devices

Created by
  • Haebom
Category
Empty

저자

Aneesh Vathul, Daniel Lee, Sheryl Chen, Arthi Tasmia

개요

본 논문은 대규모 언어 모델(LLM)의 환각(hallucination) 문제를 해결하기 위해, 경량화된 BiLSTM 아키텍처와 단일 헤드 어텐션을 사용하는 새로운 환각 검출 프레임워크인 Shannon Entropy Distribution Hallucination Detector (ShED-HD)를 제안합니다. ShED-HD는 기존 방법들과 달리, 전체 출력 시퀀스의 엔트로피 패턴을 효율적으로 분석하여 문맥 정보를 유지하면서 환각을 검출합니다. BioASQ, TriviaQA, Jeopardy Questions 세 가지 데이터셋에 대한 실험 결과, ShED-HD는 다른 계산 효율적인 방법들보다 분포 외 설정에서 성능이 뛰어나며, 분포 내 설정에서는 비슷한 성능을 보임을 보여줍니다. 따라서 ShED-HD는 자원 제약 환경에서 LLM이 생성한 콘텐츠의 신뢰성을 향상시키는 데 기여합니다.

시사점, 한계점

시사점:
자원 제약 환경(예: 에지 디바이스)에서 효율적인 환각 검출 가능.
기존 단일 패스 기반 방법보다 높은 정확도 달성.
분포 외 설정에서 우수한 일반화 성능.
전체 출력 시퀀스의 문맥 정보 고려.
한계점:
제안된 방법의 성능은 사용된 데이터셋에 의존적일 수 있음.
다양한 종류의 환각에 대한 일반화 성능에 대한 추가 연구 필요.
실제 환경에서의 적용 및 성능 평가 추가 연구 필요.
👍