본 논문은 대규모 언어 모델 및 텍스트-투-이미지 확산 모델과 같은 생성 모델을 사용하여 사용자 인터페이스(UI) 및 프레젠테이션 슬라이드와 같은 시각적 디자인을 생성하는 연구를 다룹니다. 특히, 시각 디자인의 주관성과 개인화된 특성으로 인해 개인 간의 선호도가 크게 다르다는 점에 주목합니다. 이를 위해 20명의 전문 디자이너가 12,000개의 쌍별 UI 디자인 비교에 대해 다단계 선호도 등급을 매긴 DesignPref 데이터 세트를 소개합니다. 연구 결과, 훈련된 디자이너 간에도 상당한 수준의 의견 불일치가 존재하며, 이러한 불일치는 다양한 디자인 측면의 중요성에 대한 인식 차이와 개인 선호도에서 비롯됨을 확인했습니다. DesignPref를 사용하여 집계된 판단 모델을 훈련하기 위한 기존의 다수결 방식이 개별 선호도를 정확하게 반영하지 못하는 문제를 지적하고, 개인화 전략, 특히 파인튜닝 또는 RAG 파이프라인에 디자이너별 주석을 통합하는 방안을 모색합니다. 연구 결과, 개인화된 모델이 집계된 기준 모델보다 개별 디자이너의 선호도를 예측하는 데 일관적으로 우수한 성능을 보였으며, 20배 적은 예제를 사용하더라도 이러한 경향이 유지됨을 확인했습니다. 본 연구는 개인화된 시각 디자인 평가 연구를 위한 최초의 데이터 세트를 제공하며, 개별 디자인 취향 모델링에 대한 향후 연구를 지원합니다.