경쟁 프로그래밍 벤치마크는 프로그래밍 대회 및 대규모 언어 모델 평가와 같은 시나리오에서 널리 사용되지만, 중복되거나 매우 유사한 문제의 증가는 경쟁 공정성뿐만 아니라 모델 평가를 위한 벤치마크로서의 경쟁 프로그래밍의 타당성에 대한 우려를 제기합니다. 이 논문에서는 이러한 문제를 해결하기 위해 새로운 문제인 유사 질문 검색을 제안합니다. 이를 위해, CPRet이라는 경쟁 프로그래밍을 위한 검색 지향 벤치마크 스위트를 도입합니다. CPRet은 텍스트-코드, 코드-코드, 문제-중복, 단순화-전체 등 4가지 검색 작업을 포함하며, 자동 크롤링된 문제-솔루션 데이터와 수동 큐레이션된 주석을 결합하여 구축되었습니다. 또한, CPRetriever-Code와 CPRetriever-Prob라는 두 가지 작업별 검색기를 개발했습니다.