AI 자가 진화는 슈퍼인텔리전스로 가는 길로 여겨졌지만, 실제로는 자체 학습 경험으로부터 지식을 획득, 개선 및 내재화하는 데 어려움이 있었다. R-Few는 이러한 문제를 해결하기 위해 고안된 프레임워크로, 가벼운 인간 감독과 문맥 내 기반 설정 및 혼합 학습을 통해 안정적이고 제어 가능한 자가 진화를 가능하게 한다. Challenger는 소량의 인간이 레이블링한 예시를 사용하여 질문을 생성하고, Solver는 인간과 합성 예시를 함께 학습하며 난이도 기반 커리큘럼을 적용한다. 수학 및 일반 추론 벤치마크에서 R-Few는 지속적이고 반복적인 성능 향상을 보였다.