R3는 기존 보상 모델의 제어 가능성과 해석 가능성 부족, 특정 목표에 대한 최적화로 인한 일반화의 어려움, 그리고 상황에 따른 추론 없이는 해석하기 어려운 스칼라 출력 등의 한계를 극복하기 위해 제안된 새로운 보상 모델링 프레임워크입니다. R3는 루브릭에 의존하지 않고, 다양한 평가 차원에 걸쳐 일반화되며, 해석 가능하고 논리적인 점수를 제공합니다. 이는 다양한 인간의 가치와 사용 사례에 맞는 강력한 언어 모델 정렬을 지원하여 더욱 투명하고 유연한 언어 모델 평가를 가능하게 합니다. 모델, 데이터, 코드는 오픈소스로 공개되었습니다.