Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Conformal Information Pursuit for Interactively Guiding Large Language Models

Created by
  • Haebom
Category
Empty

저자

Kwan Ho Ryan Chan, Yuyan Ge, Edgar Dobriban, Hamed Hassani, Rene Vidal

개요

Instruction-finetuned Large Language Models (LLMs)를 활용한 대화형 질문-응답 태스크에서, 쿼리 횟수를 최소화하는 시퀀셜 쿼리 전략을 연구합니다. 정보 획득 (Information Pursuit, IP)과 같은 그리디 알고리즘이 사용되지만, LLM의 확률 추정의 어려움으로 인해 최적의 쿼리 선택이 어려워집니다. 이 논문은 예측 집합(prediction sets) 기반의 Conformal Information Pursuit (C-IP)를 제안하여 불확실성을 더 정확하게 추정합니다. C-IP는 예측 집합의 평균 크기를 기반으로 불확실성을 측정하며, 실험 결과 C-IP가 기존 IP 방식 및 불확실성 기반 Chain-of-Thought 방법보다 우수한 성능을 보였습니다. MediQ 데이터셋을 사용한 의료 환경에서도 C-IP는 해석 가능성을 높이며 단일 턴 예측과 경쟁력 있는 성능을 달성했습니다.

시사점, 한계점

시사점:
C-IP는 LLM의 불확실성을 robust하게 측정하기 위해 conformal prediction sets을 활용하여 정보 획득 전략을 개선했습니다.
20 Questions 실험에서 C-IP는 기존 방식보다 예측 성능과 쿼리-응답 체인 길이를 개선했습니다.
의료 환경에서의 실험을 통해 C-IP의 실용성을 입증했으며, 단일 턴 예측과 경쟁하는 성능을 보이면서 해석 가능성을 높였습니다.
한계점:
논문에 구체적인 한계점 언급은 없지만, conformal prediction sets의 계산 복잡성이나 특정 데이터셋에 대한 의존성 등 추가적인 분석이 필요할 수 있습니다.
👍