PIGReward는 텍스트-이미지(T2I) 모델의 개인화된 평가를 위한 모델입니다. 사용자의 개인적인 선호도에 맞춰 이미지를 평가하기 위해, CoT(Chain-of-Thought) 추론을 사용하여 동적으로 사용자 맞춤형 평가 차원을 생성합니다. 사용자 특정 데이터를 최소화하기 위해, PIGReward는 제한된 참조 데이터를 기반으로 풍부한 사용자 컨텍스트를 구축하는 자체 부트스트래핑 전략을 사용합니다. 이를 통해 사용자별 훈련 없이 개인화를 가능하게 합니다. 또한, PIGReward는 사용자별 프롬프트 최적화를 위한 개인화된 피드백을 제공합니다. PIGBench라는 사용자별 선호도 벤치마크를 도입하여 다양한 시각적 해석을 포착합니다.