Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Inference-time Alignment in Continuous Space

Created by
  • Haebom

저자

Yige Yuan, Teng Xiao, Li Yunfan, Bingbing Xu, Shuchang Tao, Yunqi Qiu, Huawei Shen, Xueqi Cheng

개요

본 논문은 추론 시 인간 피드백을 활용하여 대규모 언어 모델을 정렬하는 새로운 알고리즘인 Simple Energy Adaptation (SEA)을 제안합니다. 기존 방법들이 이산적인 응답 공간에서 검색하는 것과 달리, SEA는 연속적인 잠재 공간에서 기울기 기반 샘플링을 통해 기본 정책의 원래 응답을 최적의 응답으로 직접 적응시킵니다. 이는 에너지 함수에 대한 반복적인 최적화 절차로써 추론을 공식화하여 단순하면서도 효과적인 정렬을 가능하게 합니다. 실험 결과, SEA는 AdvBench에서 최고 성능 기준 대비 최대 77.51%, MATH에서 16.36%의 성능 향상을 보였습니다.

시사점, 한계점

시사점:
연속적인 잠재 공간에서의 기울기 기반 샘플링을 통해 기존의 이산적인 응답 공간 검색의 한계를 극복.
단순한 알고리즘임에도 불구하고 기존 방법들보다 우수한 성능을 보임.
AdvBench 및 MATH 데이터셋에서 상당한 성능 향상을 달성.
공개된 코드를 통해 재현성을 확보.
한계점:
알고리즘의 성능이 기본 정책의 질에 의존할 가능성 존재.
다양한 데이터셋과 작업에 대한 추가적인 실험이 필요.
연속적인 잠재 공간을 효과적으로 표현하는 방법에 대한 추가적인 연구가 필요할 수 있음.
👍