본 논문은 AlphaZero의 막대한 컴퓨팅 자원 소모 문제를 해결하기 위해, 새로운 MCTS 알고리즘 변형인 "search-contempt"를 제시합니다. search-contempt는 자가 대국에서 더 어려운 포지션을 선호하도록 포지션 분포를 근본적으로 바꾸어, AlphaZero보다 훨씬 적은 자가 대국 횟수(수십만 회)와 컴퓨팅 비용(수만 달러)으로도 강력한 엔진을 훈련할 수 있게 합니다. 이는 표준 소비자용 GPU에서도 제한된 컴퓨팅 자원으로 자가 학습 기반 엔진을 훈련할 가능성을 열어줍니다. Odds Chess에서의 성능 향상 또한 확인되었습니다.