Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Beyond Demonstrations: Dynamic Vector Construction from Latent Representations

Created by
  • Haebom

저자

Wang Cai, Hsiu-Yuan Huang, Zhixiang Wang, Yunfang Wu

DyVec: Dynamic Vector for Inference-Time Task Adaptation

개요

DyVec은 대규모 언어 모델(LLM)에서 작업 관련 표현을 추출하여 추론 중에 다시 주입하는 In-Context derived Vector (ICV) 방법을 개선한 연구입니다. 기존 ICV 방법의 한계점을 해결하기 위해, DyVec은 Robust한 의미론적 집약 잠재 표현을 추출하기 위한 Exhaustive Query Rotation (EQR) 전략을 통합하고, 작업 복잡성에 따라 표현을 적응적으로 분할하기 위해 Dynamic Latent Segmentation 및 Injection을 적용하며, 각 세그먼트에 대한 최적의 주입 위치를 학습하기 위해 REINFORCE 기반 최적화를 활용합니다. 실험 결과 DyVec은 few-shot ICL, LoRA 및 이전 ICV 기반보다 뛰어난 성능을 보였습니다.

시사점, 한계점

시사점:
추론 시점에 작업을 적응시키는 경량화되고 데이터 효율적인 솔루션 제공.
Few-shot ICL, LoRA, 및 기존 ICV 방법보다 우수한 성능 달성.
동적으로 분할하고 의미론적으로 집약된 잠재 표현을 주입하는 방식의 효과 입증.
한계점:
논문에 명시된 한계점은 직접적으로 언급되지 않음.
👍