Chopping Trees: Semantic Similarity Based Dynamic Pruning for Tree-of-Thought Reasoning
Created by
Haebom
Category
Empty
저자
Joongho Kim, Xirui Huang, Zarreen Reza, Gabriel Grand, Kevin Zhu, Ryan Lagasse
Semantic Similarity-Based Dynamic Pruning (SSDP)
개요
SSDP는 대규모 언어 모델(LLM)의 문제 해결 능력을 향상시키는 Tree-of-Thought (ToT) 추론의 계산 비용 문제를 해결하기 위해 고안되었습니다. SSDP는 실시간으로 중복 단계를 클러스터링하고 가지치기하는 온라인 의미 병합을 병렬 트리 검색에 통합하는 최초의 프레임워크입니다. 이를 통해 SSDP는 경쟁력 있는 정확도를 유지하면서 최첨단 트리 검색 기반보다 최대 2.3배 빠른 속도를 달성하고, 탐색된 노드 수를 85-90% 줄여 효율적이고 확장 가능한 LLM 추론에 대한 실용적인 접근 방식을 제시합니다.