Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ShED-HD: A Shannon Entropy Distribution Framework for Lightweight Hallucination Detection on Edge Devices

Created by
  • Haebom

저자

Aneesh Vathul, Daniel Lee, Sheryl Chen, Arthi Tasmia

개요

본 논문은 대규모 언어 모델(LLM)의 환각(hallucination) 문제 해결을 위한 새로운 검출 프레임워크인 Shannon Entropy Distribution Hallucination Detector (ShED-HD)를 제안합니다. ShED-HD는 경량 BiLSTM 아키텍처와 단일 헤드 어텐션을 사용하여 시퀀스 수준의 엔트로피 패턴을 분류함으로써, 여러 추론 과정 없이도 효율적으로 환각을 검출합니다. 세 가지 데이터셋(BioASQ, TriviaQA, Jeopardy Questions)에 대한 평가 결과, ShED-HD는 기존의 계산 효율적인 방법들보다 분포 외 설정에서 상당히 우수한 성능을 보였으며, 분포 내 설정에서는 비슷한 성능을 달성했습니다. 이는 자원 제약 환경에서 신뢰할 수 있는 AI 기능이 중요한 경우 LLM이 생성한 콘텐츠의 신뢰성을 향상시키는 데 기여합니다.

시사점, 한계점

시사점:
자원 제약 환경(예: 에지 디바이스)에서 효율적으로 LLM의 환각을 검출하는 새로운 방법을 제시합니다.
단일 패스 접근 방식으로 계산 비용을 줄이면서 높은 정확도를 유지합니다.
다양한 데이터셋에서 기존 방법보다 우수하거나 비슷한 성능을 보임으로써 일반화 가능성을 입증합니다.
LLM 기반 애플리케이션의 신뢰성 향상에 기여합니다.
한계점:
제시된 데이터셋 외 다른 데이터셋에 대한 일반화 성능은 추가적인 연구가 필요합니다.
BiLSTM과 단일 헤드 어텐션의 구조적 한계로 인해, 더욱 복잡한 환각 패턴에 대한 검출 성능이 제한될 수 있습니다.
특정 유형의 환각에 대해서는 다른 방법보다 성능이 떨어질 수 있습니다.
👍