Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Learning to Steer: Input-dependent Steering for Multimodal LLMs

Created by
  • Haebom

저자

Jayneel Parekh, Pegah Khayatan, Mustafa Shukor, Arnaud Dapogny, Alasdair Newson, Matthieu Cord

Learn-to-Steer: Input-Specific Steering for Multimodal LLMs

개요

본 논문은 특정 행동을 유도하기 위해 LLM을 사후적으로 안내하는 실용적인 방법인 Steering 기법을 MLLM에 적용하는 연구를 소개한다. 특히, 입력 쿼리에 독립적으로 적용되는 기존의 Steering 기법의 한계를 지적하고, 입력에 따라 다른 동작을 하도록 유도하는 fine-grained steering 기법을 제안한다. 이를 위해 contrastive input-specific prompting을 사용하며, 테스트 시점에 입력-특정 프롬프트가 알려져 있지 않다는 점을 고려하여 입력-특정 Steering 벡터를 예측하는 작은 보조 모듈을 훈련하는 L2S (Learn-to-Steer)라는 접근 방식을 제안한다. L2S는 환각을 줄이고 MLLM의 안전성을 강화하며, 다른 정적 Baseline보다 우수한 성능을 보인다.

시사점, 한계점

MLLM의 행동을 제어하기 위한 입력-특정 Steering 기법 제안
L2S는 환각 감소 및 안전성 강화에 효과적
기존 Static Baseline보다 우수한 성능
테스트 시점에 입력-특정 프롬프트 미지 문제를 해결하기 위한 보조 모듈 활용
논문에서 사용된 Contrastive input-specific prompting에 대한 자세한 내용 부족
다양한 MLLM 모델에 대한 일반화 가능성 추가 연구 필요
실험 환경의 구체적인 설정 및 데이터셋에 대한 정보 부족
👍