본 논문은 다변량 시계열 이상 탐지(MTS-AD) 분야에서 가장 큰 벤치마크인 mTSBench를 소개합니다. mTSBench는 19개 데이터셋, 12개의 다양한 응용 분야에 걸쳐 344개의 레이블이 지정된 시계열을 포함하며, 대규모 언어 모델(LLM) 기반 탐지기를 포함한 24개의 이상 탐지 방법을 평가합니다. 표준화된 조건 하에서 비지도 모델 선택 기법을 체계적으로 벤치마킹하여, 어떤 단일 탐지기도 모든 데이터셋에서 탁월하지 않다는 것을 확인하고, 따라서 모델 선택의 중요성을 강조합니다. 하지만 최첨단 선택 방법조차도 최적과는 거리가 멀다는 것을 밝히며, 적응형 이상 탐지 및 강력한 모델 선택의 발전을 촉진하기 위해 통합된 평가 도구를 제공합니다.