Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CTTS: Collective Test-Time Scaling

Created by
  • Haebom

저자

Zhende Song, Shengji Tang, Peng Ye, Jiayuan Fan, Tao Chen

개요

본 논문은 단일 에이전트 기반의 기존 Test-time scaling (TTS) 방법들의 한계를 극복하기 위해 다중 에이전트와 다중 보상 모델을 활용한 Collective Test-Time Scaling (CTTS)을 제시합니다. 세 가지 주요 패러다임 (SA-MR, MA-SR, MA-MR)을 비교 분석하여 MA-MR이 최적임을 확인하고, 다중 에이전트 협업을 위한 Agent Collaboration Search (ACS)와 다중 보상 모델 협업을 위한 Mixture of Reward Models (MoR)을 포함하는 CTTS-MM 프레임워크를 제안합니다. MoR은 질문 풀과 Prior Reward model Ensemble Selection (PRES)을 이용하며, 최적의 보상 모델 조합은 Pair-wise Reward Ranking (PRR) metric으로 선택합니다. 7개의 주요 벤치마크 실험 결과, CTTS-MM이 우수한 성능을 보임을 확인했습니다.

시사점, 한계점

시사점:
기존 단일 에이전트 기반 TTS의 한계를 극복하고 성능을 향상시키는 새로운 CTTS 프레임워크 제시
다중 에이전트 및 다중 보상 모델 협업을 위한 효과적인 ACS 및 MoR 전략 제안
다양한 벤치마크에서 우수한 성능 검증
LLM의 추론 성능 향상을 위한 새로운 접근법 제시
한계점:
ACS 및 MoR의 계산 비용이 높을 수 있음.
다양한 LLM과 보상 모델에 대한 일반화 성능 평가가 추가적으로 필요함.
제안된 프레임워크의 최적 하이퍼파라미터 설정에 대한 추가적인 연구가 필요함.
대규모 모델의 경우 계산 자원 소모가 클 수 있음.
👍