본 논문은 분류기의 예측이 관측 빈도와 일치하는지 평가하는 '캘리브레이션'에 대한 연구를 다룬다. 특히, 기존의 방법들이 특정 측면에 집중하거나 계산 복잡성이 높은 문제를 해결하기 위해, 사용자의 목표나 결정 기준을 반영하는 유틸리티 함수를 사용하는 '유틸리티 캘리브레이션'이라는 새로운 프레임워크를 제안한다. 이 프레임워크는 기존 캘리브레이션 지표들을 통합하고, 보다 강력한 버전의 지표들을 제시하며, 더 풍부한 종류의 다운스트림 유틸리티에 대한 캘리브레이션을 평가할 수 있도록 한다.