본 논문은 자동화된 코드 리뷰 평가 지표인 CRScore를 제안합니다. 기존의 코드 리뷰 평가 지표는 사람이 작성한 참고 자료와의 비교에 의존하는 반면, CRScore는 참고 자료 없이(reference-free) 코드의 간결성, 포괄성, 관련성과 같은 리뷰 품질의 여러 측면을 측정합니다. LLM과 정적 분석기를 사용하여 코드에서 발견된 문제점과 주장에 근거하여 리뷰를 평가하도록 설계되었으며, 2,900개의 사람이 주석을 단 기계 생성 및 GitHub 리뷰 코멘트 코퍼스를 공개합니다. 실험 결과, CRScore는 기존 지표보다 인간의 판단과 더 높은 상관관계(스피어만 상관계수 0.54)를 보이며, 더욱 세밀한 품질 점수를 제공함을 보여줍니다.