본 논문은 전 세계 법원 시스템의 사건 적체 문제를 해결하기 위해, 응급실의 분류 시스템처럼 사건의 우선순위를 정하는 시스템을 제안합니다. 이를 위해, 사건 우선순위 결정을 평가할 수 있는 새로운 데이터셋인 "Criticality Prediction" 데이터셋을 소개합니다. 이 데이터셋은 선도 판결(LD) 여부를 나타내는 이진 레이블(LD-Label)과 인용 빈도 및 최신성을 기반으로 사건을 순위 매기는 Citation-Label의 두 가지 레이블 시스템을 가지고 있습니다. 기존의 수동 주석 방식과 달리 알고리즘을 통해 레이블을 생성하여 대규모 데이터셋을 구축하였고, 다국어 모델들을 평가하여 소규모 미세 조정 모델이 대규모 언어 모델보다 성능이 우수함을 보였습니다. 이는 도메인 특화 작업에서는 대규모 학습 데이터셋이 여전히 중요함을 시사합니다.