Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

STaR: Towards Cognitive Table Reasoning via Slow-Thinking Large Language Models

Created by
  • Haebom
Category
Empty

저자

Huajian Zhang, Mingyue Cheng, Yucong Luo, Xiaoyu Tao

개요

대규모 언어 모델(LLM)을 활용한 테이블 추론은 구조화된 데이터를 이해하고 분석하는 지능형 시스템 구축에 필수적입니다. 최근의 발전에도 불구하고, (i) 인간 인지 특성인 심층적이고 반복적인 개선이 부족하고, (ii) 추론 과정의 불안정성으로 인해 다운스트림 애플리케이션의 신뢰성이 저하되는 두 가지 주요 한계점이 존재합니다. 본 연구에서는 LLM에 단계별 사고와 불확실성 인식을 명시적으로 모델링하여 느린 사고 능력을 부여하는 새로운 프레임워크인 STaR(slow-thinking for table reasoning)을 제시합니다. STaR은 훈련 과정에서 복합 보상 하에 단순 질의에서 복잡 질의로 점진적으로 학습하는 2단계 난이도 인식 강화 학습(DRL)을 사용합니다. 추론 과정에서 토큰 수준 신뢰도와 답변 일관성을 통합하여 궤적 수준 불확실성 정량화를 수행, 더 신뢰할 수 있는 추론 경로를 선택할 수 있게 합니다. 벤치마크 실험을 통해 STaR이 우수한 성능과 향상된 추론 안정성을 달성함을 입증했습니다. 또한, 도메인 외부 데이터 세트에 대한 강력한 일반화는 STaR이 LLM을 이용한 테이블 추론을 위한 신뢰할 수 있고 인지적으로 영감을 받은 솔루션으로의 가능성을 보여줍니다.

시사점, 한계점

시사점:
LLM 기반 테이블 추론에서 인간 인지 방식을 모방한 새로운 프레임워크(STaR) 제시.
난이도 인식 강화 학습(DRL)을 통한 효율적인 학습 방법론 제시.
불확실성 정량화를 통해 추론 안정성 및 신뢰도 향상.
다양한 벤치마크 및 도메인 외부 데이터셋에서 우수한 성능 입증.
한계점:
논문에서 구체적인 한계점 언급은 없음. (abstract만으로는 알 수 없음)
👍