Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Credal Ensemble Distillation for Uncertainty Quantification

Created by
  • Haebom
Category
Empty

저자

Kaizheng Wang, Fabio Cuzzolin, David Moens, Hans Hallez

개요

심층 앙상블(DE)은 예측 불확실성을 정량화하고, 모델 견고성 및 신뢰성을 향상시키기 위해 aleatoric 및 epistemic 구성 요소를 구별하는 강력한 방법으로 부상했습니다. 그러나 추론 시 높은 계산 및 메모리 비용은 실제 적용에 큰 어려움을 야기합니다. 이러한 문제를 해결하기 위해, 우리는 DE를 단일 모델, 즉 분류 작업을 위한 CREDIT으로 압축하는 새로운 프레임워크인 credal ensemble distillation (CED)을 제안합니다. CREDIT은 단일 softmax 확률 분포 대신, 불확실성 정량화를 위해 credal set(확률 분포의 볼록 집합)을 정의하는 클래스별 확률 간격을 예측합니다. out-of-distribution 감지 벤치마크에 대한 실험 결과는 CED가 DE에 비해 추론 오버헤드를 실질적으로 줄이면서도 여러 기존 기준선보다 우수하거나 유사한 불확실성 추정을 달성함을 보여줍니다.

시사점, 한계점

DE를 단일 모델로 압축하여 추론 오버헤드를 줄이는 새로운 프레임워크 제안 (CED, CREDIT)
credal set을 활용하여 불확실성을 정량화하는 새로운 방법 제시
out-of-distribution 감지 벤치마크에서 기존 방법보다 우수한 성능 또는 유사한 성능 달성
DE에 비해 추론 비용 감소
단일 모델의 불확실성 추정의 정확성, 일반화 성능 검증 필요
다양한 데이터셋과 task에 대한 일반화 성능 평가 필요
CREDIT 모델 학습에 대한 추가적인 연구 필요
👍