본 논문은 개방 수술 과정 녹화 시 발생하는 의료진의 신체 가림 및 고정된 카메라 각도의 한계를 극복하기 위해 다중 관점 카메라 시스템을 이용한 새로운 방법을 제시합니다. 여섯 개의 서로 다른 각도에서 동시 녹화된 수술 영상으로부터 최적의 시점을 선택하는 완전 지도 학습 기반 시계열 예측 모델을 제안합니다. 이 모델은 사전 훈련된 모델을 이용하여 수술 영상에서 시각적 및 의미적 특징을 추출하고 융합하여 미래의 카메라 선택을 예측합니다. TimeBlocks를 사용한 시간적 예측 네트워크가 순차적 의존성을 포착하고, 선형 임베딩 레이어가 차원을 축소하며, Softmax 분류기가 최적의 카메라 뷰를 선택합니다. 개방 갑상선 절제술 영상 다섯 그룹에 대한 실험 결과, 제안된 방법은 기존 지도 학습 방식과 비교하여 경쟁력 있는 정확도를 달성하며, 특히 장기간 예측에서 기존 최고 성능의 시계열 예측 기술보다 우수한 성능을 보였습니다.