본 논문은 기존 사이버 폭력 감지 벤치마크가 '공격적'과 '비공격적'과 같은 극성에 따라 구성되어 본질적으로 혐오 발언 감지에 치우쳐 있던 문제점을 지적하며, 실제 사이버 폭력은 사건을 통해 광범위한 사회적 관심을 끌어모은다는 점에 착안하여 새로운 어노테이션 방법을 제안합니다. 이를 통해 사건 중심으로 구성된 중국어 사이버 폭력 사건 감지 데이터셋 CHNCI를 구축하였는데, 이는 91개 사건의 220,676개의 댓글로 구성되어 있습니다. 설명 생성 기반의 세 가지 사이버 폭력 감지 방법을 앙상블하여 의사 레이블을 생성하고, 이를 인간 어노테이터가 판단하는 과정을 거쳤으며, 사이버 폭력 사건으로 구성되는지 여부를 검증하기 위한 평가 기준을 제시합니다. 실험 결과, 구축된 데이터셋이 사이버 폭력 감지 및 사건 예측 작업의 벤치마크가 될 수 있음을 보여주며, 중국어 사이버 폭력 사건 감지 작업에 대한 최초의 연구라고 주장합니다.