본 연구는 시계열 이상 탐지의 평가가 다양한 응용 목표와 이질적인 지표 가정으로 인해 어려움을 겪는다는 점에 주목하여, 기존 지표들을 그들의 수학적 형태나 출력 구조가 아닌, 그들이 해결하고자 하는 특정 평가 과제에 따라 재해석하는 문제 중심 프레임워크를 제시한다. 20개 이상의 널리 사용되는 지표들을 1) 기본적인 정확도 기반 평가, 2) 적시성 인지 보상 메커니즘, 3) 라벨링 부정확성에 대한 허용도, 4) 인적 감사 비용을 반영하는 페널티, 5) 무작위 또는 과장된 점수에 대한 견고성, 6) 데이터셋 간 벤치마킹을 위한 파라미터 없는 비교 가능성의 6가지 차원으로 분류한다. 실제, 무작위, 오라클 탐지 시나리오에서 지표의 동작을 실험하고, 각 지표의 변별력, 즉 무작위 노이즈와 의미 있는 탐지를 구분하는 능력을 정량화한다. 실험 결과는 대부분의 이벤트 레벨 지표가 강력한 분리성을 보이지만, 일부 널리 사용되는 지표(예: NAB, Point-Adjust)는 무작위 점수 팽창에 대한 저항력이 제한적임을 보여준다. 제안된 프레임워크는 기존 지표를 이해하기 위한 통일된 분석 관점을 제공하며, 맥락을 더 잘 반영하고, 견고하며, 공정한 시계열 이상 탐지 평가 방법론을 선택하거나 개발하기 위한 실질적인 지침을 제공한다.