본 논문은 기존의 머신러닝 분류 및 객체 탐지 평가 방식이 단순히 정답/오답으로만 판단하는 한계를 지적하고, 계층적 구조를 가진 클래스 분류 체계를 활용하여 오류의 종류와 영향을 보다 세밀하게 평가하는 계층적 점수 매트릭스를 제안한다. 클래스 레이블 간의 관계를 인코딩하는 점수 트리를 이용하여 예측값과 실제값 사이의 거리를 반영하는 점수를 부여함으로써, 단순히 오류 개수만으로 모델 성능을 평가하는 것을 넘어 오류의 유형과 심각도를 고려한 평가를 가능하게 한다. 세 가지 가중치 전략을 나타내는 점수 트리를 사용한 추상적인 사용 사례를 통해 제안된 매트릭스의 성능을 검증하고, 오류 유형에 따른 영향을 분석한다. 개발된 점수 매트릭스는 오픈소스로 공개될 예정이다.