본 논문은 가격, 제품 품질, 지속 가능성 등 여러 상충되는 목표를 포함하는 실제 조합 최적화 문제를 다룬다. 여러 목표를 단일 목표 함수(예: 선형 결합)로 집계하는 계산 효율적인 방법이 있지만, 선형 결합의 가중치를 미리 정의하는 것은 어렵다. 대안으로, 사용자에게 후보 솔루션을 비교하도록 요청하는 대화형 학습 방법이 유망하다. 주요 과제는 후보를 빠르게 생성하고, 고품질 솔루션으로 이끄는 목표 함수를 학습하며, 사용자 상호 작용을 최소화하는 것이다. 본 논문은 구성 선호도 유도(Constructive Preference Elicitation, CPE) 프레임워크를 기반으로 세 가지 속성을 개선하는 방법을 제시한다. 상호 작용 속도를 높이기 위해 (완화된) 솔루션 풀을 사용하고, 학습을 개선하기 위해 Bradley-Terry 선호도 모델의 최대 가능도 추정을 채택하며, 사용자 상호 작용 수를 줄이기 위해 활성 학습에서 영감을 받은 앙상블 기반 획득 함수를 사용하여 비교할 후보 쌍을 선택한다. PC 구성 작업과 현실적인 다중 인스턴스 라우팅 문제에 대한 실험을 통해 기존 CPE 방법보다 빠르게 쿼리를 선택하고, 쿼리가 적게 필요하며, 더 높은 품질의 조합 솔루션을 생성함을 보여준다.