Thought Branches: Interpreting LLM Reasoning Requires Resampling
Created by
Haebom
Category
Empty
저자
Uzay Macar, Paul C. Bogdan, Senthooran Rajamanoharan, Neel Nanda
개요
이 논문은 추론 모델을 해석하는 기존 연구가 단일 사고 과정(CoT)에만 집중하는 한계를 지적하며, 모델이 생성하는 다양한 CoT 분포를 연구해야 함을 주장합니다. 재샘플링을 활용하여 모델의 의사 결정을 조사하는 사례 연구를 제시하며, 에이전트 정렬 불일치 시나리오에서 특정 문장의 인과적 영향 측정, CoT에 대한 인위적인 수정의 효과, 추론 단계 제거의 영향, 그리고 불성실한 CoT 상황에서의 힌트의 영향을 분석합니다.
시사점, 한계점
•
시사점:
◦
재샘플링을 통한 CoT 분포 연구는 모델 추론에 대한 신뢰할 수 있는 인과 분석을 가능하게 함.