최소 침습 수술(MIS)에서 스테레오 매칭은 차세대 내비게이션 및 증강 현실에 필수적입니다. 그러나 해부학적 제약으로 인해 조밀한 시차 감독이 거의 불가능하여, 일반적으로 내시경이 깊은 신체 공동으로 들어가기 전에 획득한 몇 가지 이미지 수준 레이블로 주석이 제한됩니다. TiS-TSL은 이미지 수준 감독의 한계를 극복하기 위해 제안된 시변 스위치 가능 교사-학생 학습 프레임워크로, 단일 아키텍처 내에서 유연한 시간적 모델링을 가능하게 하는 이미지 예측(IP), 정방향 비디오 예측(FVP) 및 역방향 비디오 예측(BVP)의 세 가지 모드로 작동합니다. TiS-TSL은 이미지-비디오(I2V) 단계와 비디오-비디오(V2V) 단계의 두 단계 학습 전략을 채택하여 시간적 시차 예측을 개선하고, 양방향 시공간적 일관성을 계산함으로써 프레임 간의 신뢰할 수 없는 영역을 식별하고, 잡음이 있는 비디오 수준의 의사 레이블을 필터링하며, 시간적 일관성을 강화합니다.