본 논문은 추론 과제에서 언어 모델의 성능을 향상시키기 위해 제안된 중간 토큰 생성(ITG) 기법에 대한 비판을 제기한다. ITG에서 생성되는 중간 토큰은 '추론 과정' 또는 '생각'으로 불리며, 이는 모델을 의인화하여 인간의 문제 해결 과정과 유사하게 해석하는 경향을 야기한다. 본 논문은 이러한 의인화가 무해한 은유가 아니며, 모델의 본질과 효과적인 사용법에 대한 오해를 불러일으키고, 부적절한 연구를 초래한다는 주장을 제시한다.
시사점, 한계점
•
시사점: 언어 모델의 중간 토큰 생성 결과를 인간의 사고 과정과 단순 비교하는 것의 위험성을 경고하며, 모델 해석에 대한 신중한 접근을 촉구한다. 모델의 내부 동작에 대한 오해를 방지하고, 더욱 엄밀한 연구 설계 및 해석을 위한 기반을 마련한다.
•
한계점: 특정 ITG 기법이나 모델에 대한 구체적인 기술적 분석보다는, 주로 의인화의 문제점에 초점을 맞추고 있다. 따라서 ITG 기법 자체의 유용성에 대한 객관적인 평가는 부족할 수 있다. 또한, 어떤 수준의 의인화가 허용 가능한지에 대한 명확한 기준을 제시하지 않는다.