Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

From Token to Action: State Machine Reasoning to Mitigate Overthinking in Information Retrieval

Created by
  • Haebom

저자

Dohyeon Lee, Yeonseok Jeong, Seung-won Hwang

개요

본 논문은 Chain-of-Thought (CoT) 프롬프팅을 사용한 정보 검색(IR)에서 발생하는 과도한 추론(overthinking) 문제를 해결하기 위해 State Machine Reasoning (SMR) 프레임워크를 제안합니다. SMR은 'Refine', 'Rerank', 'Stop'과 같은 이산적인 행동들로 구성된 전이 기반 추론 프레임워크로, 조기 중단 및 세분화된 제어를 지원하여 중복된 경로 및 사용자 의도와 다른 추론을 방지합니다. BEIR 및 BRIGHT 벤치마크 실험 결과, SMR은 기존 CoT 추론 대비 검색 성능(nDCG@10)을 3.4% 향상시키고 토큰 사용량을 74.4% 감소시키는 효과를 보였으며, 특정 작업에 대한 조정 없이 다양한 LLMs 및 검색기에 일반화될 수 있음을 보여줍니다.

시사점, 한계점

시사점:
과도한 추론으로 인한 비효율적인 CoT 프롬프팅 문제 해결에 대한 새로운 접근 방식 제시.
SMR 프레임워크를 통해 정보 검색 성능 향상 및 토큰 사용량 감소 달성.
다양한 LLMs 및 검색기에 적용 가능한 일반적인 방법론 제시.
조기 중단 및 세분화된 제어를 통한 효율적인 추론 가능.
한계점:
제시된 SMR 프레임워크의 성능이 특정 벤치마크 및 LLM에 국한될 가능성.
다른 유형의 추론 문제에 대한 SMR 프레임워크의 일반화 가능성에 대한 추가 연구 필요.
'Refine', 'Rerank', 'Stop' 이외의 다른 행동들을 포함하는 프레임워크 확장 필요성.
👍