초인적인 성능을 가진 미래 모델은 인간의 능력을 넘어설 것이며, 인간은 이러한 모델을 약하게만 감독할 수 있게 될 것이다. 모델 정렬을 위한 고품질 데이터 부족 문제를 해결하기 위해, 본 논문은 약한 감독에서 강한 일반화(W2SG)를 위한 선택적 프레임워크를 제안한다. 강한 모델이 정답을 알 수 있는 질문을 식별하는 이진 분류기 P(IK)를 학습하여 자체 생성된 레이블을 정렬에 사용하고, 그래프 스무딩 기법으로 약한 레이블을 정제한다. 세 개의 벤치마크 실험을 통해 제안 방법이 경쟁력 있는 기준선을 지속적으로 능가함을 보였다.