Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Steerable Chatbots: Personalizing LLMs with Preference-Based Activation Steering

Created by
  • Haebom

저자

Jessica Y. Bo, Tianyu Xu, Ishan Chatterjee, Katrina Passarella-Ward, Achin Kulshrestha, D Shin

개요

본 논문은 사용자의 암묵적 선호도를 반영하여 개인화된 응답을 생성하는 대형 언어 모델(LLM) 기반 개인 AI 어시스턴트의 성능 향상을 다룹니다. 사용자의 프롬프트 작성 능력이 부족하다는 점을 고려하여, 활성화 제어(activation steering) 기법을 활용하여 추론 과정에서 해석 가능한 선호도 차원에 맞춰 LLM을 유도하는 방법을 제시합니다. 기존의 메모리 기반 개인화 방식과 달리, 경량화된 활성화 제어는 선형 강도 계수를 통해 사용자가 쉽게 제어할 수 있습니다. 세 가지 상호 작용형 챗봇 인터페이스에 활성화 제어를 통합하여 사용자 연구(n=14)를 수행하고, 사용자의 선호도에 따른 개인화된 대화 설정에 대한 효과성을 검증하며, 제어, 사용성, 투명성과 같은 다양한 가치가 사용자의 인터페이스 선호도에 미치는 영향을 분석합니다.

시사점, 한계점

시사점:
활성화 제어를 이용한 경량화된 개인화 기법이 사용자의 암묵적 선호도를 반영한 LLM 기반 개인 AI 어시스턴트 개발에 효과적임을 보임.
사용자의 제어, 사용성, 투명성에 대한 선호도가 인터페이스 디자인에 중요한 영향을 미침을 제시.
다양한 인터페이스 디자인을 통해 사용자의 선호도에 맞는 개인화된 대화 경험을 제공할 수 있음을 시사.
한계점:
사용자 연구의 참가자 수가 적음 (n=14).
제시된 세 가지 인터페이스 디자인 외 다른 유형의 인터페이스에 대한 연구가 필요.
활성화 제어 기법의 일반화 가능성 및 다양한 LLM에 대한 적용 가능성에 대한 추가 연구가 필요.
👍