대규모 언어 모델(LLM)을 활용한 테이블 추론은 구조화된 데이터를 이해하고 분석하는 지능형 시스템 구축에 필수적입니다. 최근의 발전에도 불구하고, (i) 인간 인지 특성인 심층적이고 반복적인 개선이 부족하고, (ii) 추론 과정의 불안정성으로 인해 다운스트림 애플리케이션의 신뢰성이 저하되는 두 가지 주요 한계점이 존재합니다. 본 연구에서는 LLM에 단계별 사고와 불확실성 인식을 명시적으로 모델링하여 느린 사고 능력을 부여하는 새로운 프레임워크인 STaR(slow-thinking for table reasoning)을 제시합니다. STaR은 훈련 과정에서 복합 보상 하에 단순 질의에서 복잡 질의로 점진적으로 학습하는 2단계 난이도 인식 강화 학습(DRL)을 사용합니다. 추론 과정에서 토큰 수준 신뢰도와 답변 일관성을 통합하여 궤적 수준 불확실성 정량화를 수행, 더 신뢰할 수 있는 추론 경로를 선택할 수 있게 합니다. 벤치마크 실험을 통해 STaR이 우수한 성능과 향상된 추론 안정성을 달성함을 입증했습니다. 또한, 도메인 외부 데이터 세트에 대한 강력한 일반화는 STaR이 LLM을 이용한 테이블 추론을 위한 신뢰할 수 있고 인지적으로 영감을 받은 솔루션으로의 가능성을 보여줍니다.