Are Your Reasoning Models Reasoning or Guessing? A Mechanistic Analysis of Hierarchical Reasoning Models

Created by

Haebom

저자

Zirui Ren, Ziming Liu

💡 개요

계층적 추론 모델(HRM)은 복잡한 추론 과제에서 뛰어난 성능을 보이지만, 본 연구는 HRM이 진정으로 추론하는 것인지 아니면 추측하는 것인지에 대한 기계론적 분석을 수행합니다. 분석 결과, HRM은 단순한 퍼즐에서의 실패, 추론 과정에서의 갑작스러운 정확도 향상("grokking" 현상), 그리고 잘못된 고정점에 빠지는 "추측"과 같은 동작을 보이는 것으로 나타났습니다. 이러한 발견을 바탕으로 데이터 증강, 입력 교란, 모델 부트스트래핑을 포함하는 새로운 전략을 제안하며, 이를 통해 Sudoku-Extreme 데이터셋에서 성능을 크게 향상시켰습니다.

🔑 시사점 및 한계

•

HRM의 성능은 실제 추론 능력보다는 "추측" 메커니즘에 기반할 가능성이 있으며, 이는 모델의 실패 모드를 이해하는 데 중요한 단서를 제공합니다.

•

"Grokking" 현상과 다중 고정점의 존재는 추론 모델의 학습 및 동작 방식에 대한 새로운 통찰을 제공하며, 이를 활용한 성능 향상 전략의 가능성을 보여줍니다.

•

제안된 "추측" 기반 전략들은 실제 성능을 크게 향상시키지만, 여전히 HRM이 진정한 의미의 추론을 달성하는지에 대한 근본적인 의문을 남깁니다.

PDF 보기

Made with Slashpage