AI 시스템이 다양한 분야에서 인간 전문가의 수준을 넘어섬에 따라, 평가 및 훈련을 위한 고품질 인간 감독을 얻는 것이 점점 더 어려워지고 있습니다. 본 연구는 여러 도메인에 대한 깊은 지식과 기술이 필요한 작업에 초점을 맞춥니다. 최고의 인간 전문가조차도 단일 좁은 영역에 대한 지식만 가지고 있으며, 이러한 초인적인 작업에서 고급 AI 시스템의 정확성을 평가할 수 없습니다. 그러나 인간은 자신의 좁은 전문 지식을 바탕으로 잘못된 옵션을 나타내는 보완 레이블과 같은 약한 신호를 제공할 수 있습니다. 본 연구에서는 이러한 약한 신호를 기반으로, 정답을 준비할 필요 없이 최첨단 AI 시스템을 평가할 수 있는 확장 가능한 감독 프레임워크를 제안합니다. 보완 레이블로부터 top-1 정확도의 편향되지 않은 추정치를 도출하고, 일반 레이블의 분산과 일치하는 데 필요한 보완 레이블의 수를 정량화합니다. 또한, 희소한 일반 레이블과 풍부한 보완 레이블을 결합하기 위한 두 개의 추정치를 도입했습니다. 보완 전용 및 혼합 추정치 모두에 대해 유한 표본 편차 보장을 제공합니다. 실험적으로, 정답이 없는 경우에도 보완 레이블이 있으면 대규모 언어 모델의 출력을 평가할 수 있음을 보여줍니다. 또한, 이러한 약한 신호로 AI 시스템을 훈련시킬 수 있음을 보여줍니다. 즉, 분할된 인간 감독으로 더 나은 성능을 낼 수 있는 에이전트 AI 시스템을 자동으로 설계하는 방법을 제시합니다.