Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Polysemantic Dropout: Conformal OOD Detection for Specialized LLMs

Created by
  • Haebom

저자

Ayush Gupta, Ramneet Kaur, Anirban Roy, Adam D. Cobb, Rama Chellappa, Susmit Jha

개요

본 논문은 특정 분야에 특화된 대규모 언어 모델(LLM)을 위한 새로운 추론 시간 도메인 외(OOD) 감지 알고리즘을 제안한다. 특화된 LLM은 미세 조정을 통해 도메인 내 작업에서 최첨단 성능을 달성하지만, OOD 입력이 주어지면 잘못되거나 신뢰할 수 없는 출력에 취약하여 중요한 응용 분야에서 위험을 초래한다. 본 논문의 방법은 모델의 dropout 허용 오차를 기반으로 하는 새로운 비순응 척도를 사용하여 유도적 준거적 이상 감지(ICAD) 프레임워크를 활용한다. LLM의 다의성과 중복성에 대한 최근 연구 결과에 착안하여, 도메인 내 입력은 OOD 입력보다 더 높은 dropout 허용 오차를 나타낸다는 가설을 세운다. 유효한 앙상블 접근 방식을 통해 여러 계층에서 dropout 허용 오차를 집계하여 감지 성능을 향상시키는 동시에 ICAD의 이론적 오경보 한계를 유지한다. 의료 전문 LLM을 사용한 실험 결과, 제안된 접근 방식이 기준 방법보다 OOD 입력을 더 잘 감지하며, OOD 데이터 포인트를 양성으로, 도메인 내 테스트 데이터 포인트를 음성으로 처리할 때 AUROC가 2%에서 37%까지 향상됨을 보여준다.

시사점, 한계점

시사점: 특화된 LLM의 OOD 감지 성능을 향상시키는 새로운 알고리즘을 제시하여, 의료 분야와 같이 신뢰성이 중요한 응용 분야에서 안전성을 높일 수 있다. dropout 허용 오차 기반의 비순응 척도와 앙상블 접근 방식을 통해 기존 방법보다 우수한 성능을 달성하였다.
한계점: 실험은 의료 전문 LLM에 국한되어 있으며, 다른 도메인이나 LLM 아키텍처에 대한 일반화 가능성은 추가 연구가 필요하다. AUROC 향상 폭이 데이터셋이나 모델에 따라 다르게 나타날 수 있으며, 실제 응용 환경에서의 성능은 추가적인 검증이 필요하다.
👍