본 논문은 불확실한 작업량 하에서 실시간 시장 예측을 위한 시간 예측 가능한 추론 스케줄링 프레임워크인 TIP-Search를 제안합니다. 고주파 금융 시스템의 엄격한 지연 시간 요구 사항을 고려하여 TIP-Search는 이기종 모델 풀에서 딥러닝 모델을 동적으로 선택하여 예측 정확도를 극대화하면서 각 작업의 마감 시간 제약 조건을 충족하는 것을 목표로 합니다. 본 접근 방식은 오프라인으로 지연 시간과 일반화 성능을 프로파일링한 후, 명시적인 입력 도메인 레이블에 의존하지 않고 온라인 작업 인식 선택을 수행합니다. 세 개의 실제 한도 주문장 데이터 세트(FI-2010, Binance BTC/USDT, LOBSTER AAPL)에서 TIP-Search를 평가하여 정확도가 최대 8.5% 향상되고 마감 시간 충족률이 100%인 정적 기준선을 능가함을 보여줍니다. 결과는 불확실성 하에서 강력한 저지연 금융 추론에서 TIP-Search의 효과를 강조합니다.