본 논문은 제로샷 시계열 예측(TSF)에서 다양한 추론 전략의 효과를 체계적으로 평가하기 위한 첫 번째 벤치마크인 ReC4TS를 제안합니다. ReC4TS는 8개 도메인에 걸친 다양한 데이터셋(단일 모달 및 다중 모달, 단기 및 장기 예측 포함)에서 포괄적인 평가를 수행합니다. 특히, 제로샷 TSF에서 어떤 유형의 추론 전략이 가장 효과적인지, 그리고 추론이 도움이 되는지 여부를 조사합니다. ReC4TS는 자기 일관성이 가장 효과적인 테스트 시간 추론 전략이며, 그룹 상대 정책 최적화가 사후 훈련 중 추론 능력을 높이는 데 더 적합한 접근 방식임을 보여줍니다. 또한, 다중 모달 TSF가 단일 모달 TSF보다 추론 전략으로부터 더 많은 이점을 얻는다는 것을 발견했습니다. 마지막으로, 다양한 고급 LLMs로부터 추론 경로에 대한 주석이 달린 예측 샘플을 포함하는 새로운 데이터셋 TimeThinking과 자기 일관성 추론 전략을 통해 기본 TSF 모델에서 검증된 새로운 간단한 테스트 시간 스케일링 법칙을 제시합니다.