본 논문은 대규모 사전 훈련된 Vision-Language 모델을 추천 시스템에 적용하는 분야, 즉 Vision-Language-Recommendation (VLR)을 사용자 중심의 온디바이스 인텔리전스에 통합하기 위해 Federated Learning 프레임워크 내에서 FedVLR을 제시한다. FedVLR은 사용자별 맞춤형 시각-언어 표현 융합을 위한 프레임워크로, 서버 측 다중 뷰 융합 모듈과 사용자별 혼합 전문가 메커니즘을 통해 효율적인 연합 VLR 시스템을 구현한다. 제안된 FedVLR의 효과는 7개의 벤치마크 데이터셋에서 검증되었다.