Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Mitigating Overthinking in Large Reasoning Models via Manifold Steering

Created by
  • Haebom

저자

Yao Huang, Huanran Chen, Shouwei Ruan, Yichi Zhang, Xingxing Wei, Yinpeng Dong

개요

본 논문은 대규모 추론 모델(LRMs)의 과도한 사고(overthinking) 현상을 완화하기 위한 새로운 방법인 Manifold Steering을 제안합니다. LRMs는 수학 및 코딩과 같은 복잡한 작업을 해결하는 데 뛰어난 능력을 보이지만, 과도한 검증 루프와 중복된 숙고로 인해 계산 비용이 과다하게 발생하는 과도한 사고 현상을 보입니다. 본 연구는 기계적 해석 가능성(mechanistic interpretability) 관점에서 과도한 사고의 근본적인 메커니즘을 조사하여 이 문제를 해결하고자 합니다. 모델의 활성화 공간에서 과도한 사고 경향을 단일 방향으로 효과적으로 포착하고, 이 방향을 따라 활성화를 조절하여 문제를 완화할 수 있음을 보여줍니다. 하지만 이러한 효과는 증가하는 조절 강도에 따라 한계에 도달하고 악화됩니다. 따라서 활성화 공간을 체계적으로 탐색하여 과도한 사고 현상이 저차원 다양체(manifold)와 관련되어 있음을 발견하고, 간섭 노이즈의 이론적 근사치를 고려하여 조절 방향을 저차원 활성화 다양체에 투영하는 새로운 방법인 Manifold Steering을 제안합니다. DeepSeek-R1 증류 모델에 대한 광범위한 실험을 통해 제안된 방법이 여러 수학 벤치마크에서 정확도를 유지하거나 개선하면서 출력 토큰을 최대 71%까지 줄이는 것을 검증했습니다. 또한 코드 생성 및 지식 기반 QA 작업에서 일관된 토큰 감소 성능을 제공하여 견고한 도메인 간 전이성을 보여줍니다.

시사점, 한계점

시사점:
LRMs의 과도한 사고 현상을 효과적으로 완화하는 새로운 방법인 Manifold Steering 제시.
저차원 다양체를 활용하여 과도한 사고 현상의 근본적인 메커니즘을 밝힘.
수학, 코딩, 지식 기반 QA 등 다양한 작업에서 뛰어난 성능 및 도메인 간 전이성을 보임.
출력 토큰 수를 최대 71%까지 감소시켜 계산 비용을 절감.
한계점:
Manifold Steering의 효과가 활성화 조절 강도에 따라 한계를 보일 수 있음.
간섭 노이즈의 이론적 근사치에 대한 의존도가 높을 수 있음.
특정 모델(DeepSeek-R1)에 대한 실험 결과만 제시되어 일반화 가능성에 대한 추가 연구 필요.
👍