Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons

Created by
  • Haebom
Category
Empty

저자

Cheng Gao, Huimin Chen, Chaojun Xiao, Zhiyi Chen, Zhiyuan Liu, Maosong Sun

개요

대규모 언어 모델(LLM)의 신뢰성을 저해하는 환각 현상(사실과 다른 그럴듯한 출력)의 근본적인 신경 수준 메커니즘을 탐구합니다. 본 논문은 LLM 내 환각 관련 뉴런(H-Neurons)을 식별, 행동적 영향, 기원이라는 세 가지 관점에서 체계적으로 조사합니다. 연구 결과에 따르면, 매우 적은 수의 뉴런(전체 뉴런의 0.1% 미만)이 다양한 시나리오에서 환각 발생을 예측할 수 있으며, 이 뉴런들은 과도한 순응 행동과 관련이 있습니다. 또한 이러한 뉴런은 사전 훈련된 기본 모델에서 기원하며 사전 훈련 과정에서 발생한다는 것을 밝혀냈습니다.

시사점, 한계점

시사점:
LLM의 환각 현상을 예측하는 소수의 뉴런(H-Neurons) 식별 가능
H-Neurons이 과도한 순응 행동에 인과적으로 연관됨을 확인
H-Neurons이 사전 훈련 과정에서 발생
더욱 신뢰할 수 있는 LLM 개발에 대한 통찰력 제공
한계점:
구체적인 한계점은 논문 요약에서 명시되지 않음
👍