Sign In

Test-Time Alignment of LLMs via Sampling-Based Optimal Control in pre-logit space

Created by
  • Haebom
Category
Empty

저자

Sekitoshi Kanai, Tsukasa Yoshida, Hiroshi Takahashi, Haru Kuroki, Kazumune Hashimoto

개요

본 논문은 대규모 언어 모델(LLM)의 미세 조정에 따른 높은 계산 비용 문제를 해결하기 위해, 테스트 시점에 적용하는 새로운 정렬 방법인 AISP (adaptive importance sampling on pre-logits)를 제안한다. AISP는 확률적 제어 입력을 활용하는 샘플링 기반 모델 예측 제어를 기반으로 하며, 사전 로짓에 가우시안 섭동을 적용하여 섭동의 평균에 대한 예상 보상을 최대화한다. 최적의 평균은 샘플링된 보상으로 중요도 샘플링을 수행하여 얻어진다. AISP는 사용된 샘플 수 대비 보상 측면에서 best-of-n 샘플링보다 우수하며, 다른 보상 기반 테스트 시점 정렬 방법보다 높은 보상을 달성한다.

시사점, 한계점

시사점:
LLM의 테스트 시점 정렬을 통해 미세 조정 없이 모델 성능을 향상시킬 수 있는 새로운 방법을 제시한다.
사전 로짓에 가우시안 섭동을 적용하는 AISP는 다른 테스트 시점 정렬 방법보다 높은 보상을 달성한다.
AISP는 best-of-n 샘플링보다 효율적인 샘플링 방식으로, 계산 비용을 절감할 수 있다.
한계점:
논문에서 구체적인 계산 비용 및 복잡성에 대한 분석이 제시되지 않았다.
AISP의 성능이 다른 특정 LLM 모델 및 작업에 대해서도 일관되게 유지되는지 추가적인 연구가 필요하다.
AISP의 하이퍼파라미터 설정에 대한 최적화 방법과 민감도 분석이 필요하다.
👍