Many Preferences, Few Policies: Towards Scalable Language Model Personalization

Created by

Haebom

저자

Cheol Woo Kim, Jai Moondra, Roozbeh Nahavandi, Andrew Perrault, Milind Tambe, Swati Gupta

💡 개요

이 논문은 수많은 사용자 선호도를 효율적으로 반영하면서도 각 사용자마다 별도의 LLM을 유지하는 비효율성을 해결하고자 합니다. 이를 위해 다차원 사용자 선호도를 소수의 대표적인 LLM 포트폴리오로 압축하는 PALM(Portfolio of Aligned LLMs) 알고리즘을 제안합니다. PALM은 이론적 보장을 바탕으로 시스템 비용과 개인화 수준 간의 균형을 맞추고, 사용자 선호도 다양성을 효과적으로 커버하는 LLM 포트폴리오를 생성합니다.

🔑 시사점 및 한계

•

LLM 개인화를 위한 실용적인 접근 방식으로, 제한된 자원으로도 광범위한 사용자 선호도를 충족시킬 수 있는 가능성을 제시합니다.

•

PALM은 이론적 보장을 통해 포트폴리오의 크기와 근사 성능을 동시에 만족시켜, 기존 방식 대비 효율성과 성능을 개선합니다.

•

다양한 사용자 선호도 공간을 효과적으로 커버하기 위한 LLM 포트폴리오의 필요성을 강조하며, 시스템 비용과 개인화 사이의 트레이드오프를 명확히 합니다.

•

제안된 방법론의 실제 적용 시, 다양한 LLM의 초기화 및 훈련 과정에 대한 추가적인 연구와 최적화가 필요할 수 있습니다.

PDF 보기

Made with Slashpage