본 논문은 기존의 Arena 플랫폼의 한계점(느린 수렴 속도, 선호도 노이즈 취약성)을 극복하기 위해, 이미지와 비디오의 높은 직관성을 활용한 새로운 평가 플랫폼인 K-Sort Arena를 제시합니다. K-Sort Arena는 K개의 모델을 동시에 비교하는 K-wise 비교 방식과 확률적 모델링 및 베이지안 업데이트 기법을 사용하여 효율성과 신뢰성을 높였습니다. 탐색-활용 기반 매치메이킹 전략을 통해 더욱 유익한 비교를 가능하게 하며, 실험 결과 기존 ELO 알고리즘보다 16.3배 빠른 수렴 속도를 보였습니다. 크라우드소싱을 통해 다수의 최첨단 텍스트-이미지 및 텍스트-비디오 모델에 대한 평가를 수행하여 리더보드를 생성하며, 지속적인 업데이트가 가능하도록 설계되었습니다.