인공 일반 지능(AGI) 평가에 대한 기존 접근 방식은 여러 인지 영역에서 시스템의 능력을 산술 평균으로 요약하지만, 이는 특정 영역의 뛰어난 성능이 다른 영역의 심각한 결함을 상쇄할 수 있다는 보상을 암묵적으로 전제합니다. 본 논문에서는 일반 지능이 모든 필수 능력에서 균형 잡힌 역량을 요구한다는 점을 고려하여, 보상 가능성 지수를 연속적으로 적용한 일반화 평균을 통합하는 AGI의 일관성 기반 측정 방식을 제시합니다. 이는 산술, 기하, 조화 평균을 포함하는 AUC(Area Under the Curve) 메트릭을 생성하여 보상 가능성 가정이 엄격해짐에 따라 평가된 역량이 얼마나 견고하게 유지되는지를 정량화합니다. 제안된 프레임워크는 전문화를 장려하는 산술 평균과 달리 불균형에 대한 패널티를 부여하고 성능을 제한하는 병목 현상을 노출합니다. Cattell-Horn-Carroll(CHC) 모델에서 파생된 인지 프로필과 17개의 이질적인 벤치마크에 적용하여, 일관성 기반 집계가 산술 평균으로는 가려지는 불균형을 어떻게 강조하는지 보여줍니다.