개인화된 이미지 선호도 평가는 소수의 참조 이미지를 기반으로 개인의 선호도를 평가하는 것을 목표로 한다. 기존 방법은 대규모 데이터로 모델을 훈련하여 텍스트-이미지 정렬과 같은 일반적인 선호도 평가에 집중했지만, 개인별 데이터 부족 및 다양성으로 인해 어려움을 겪는다. 본 논문에서는 사용자를 연결하는 공통 선호도 프로필을 도입하여 대규모 사용자 데이터를 활용하고, '예측 후 평가' 패러다임을 따르는 추론 기반 개인화된 이미지 선호도 평가 프레임워크를 제안한다. 이 프레임워크는 참조 이미지에서 사용자의 선호도 프로필을 예측하고, 예측된 프로필을 기반으로 후보 이미지에 대한 해석 가능한 다차원 점수와 평가를 제공한다. 이를 위해, CoT(Chain-of-Thought) 스타일의 개인화된 평가 데이터세트를 구축하고, 두 단계의 훈련 전략(감독 기반 미세 조정, 강화 학습)을 사용하며, 선호도 프로필 예측을 개선하기 위한 유사성 기반 예측 보상을 제안한다. 실험을 통해 제안된 방법의 우수성을 입증한다.