본 논문은 대규모 언어 모델(LLM)의 추론 능력 향상을 위해 사용되는 테스트 시간 계산(test-time compute)에서 발생하는 과도한 중복성 문제를 해결하기 위한 새로운 프레임워크인 PI(Test-time Prompt Intervention)를 제안합니다. PI는 추론 과정 중 적절한 시점에(When module) 적절한 방식으로(How module) 개입하여 추론 경로를 동적으로 안내하고 조절하며, 개입 후 샘플링(Which module)을 통해 인간의 문제 해결 전문성과 인지 과학 원리를 LLM의 추론 과정에 통합합니다. 이를 통해 LLM의 제어 가능성과 해석 가능성을 향상시키고, 과도한 중복을 포함한 비효율적인 사고 과정(CoTs)을 줄이며, 더 간결하고 신뢰할 수 있는 추론 결과를 얻을 수 있습니다.
시사점, 한계점
•
시사점:
◦
LLM의 추론 과정에서 발생하는 과도한 중복성 문제를 효과적으로 해결할 수 있는 새로운 프레임워크 제시.
◦
인간의 전문성과 인지 과학 원리를 LLM 추론 과정에 통합하여 모델의 제어 가능성과 해석 가능성 향상.