본 논문은 비디오 위장 객체 분할(VCOS) 문제를 해결하기 위해 기존의 SAM2 모델을 개선한 CamSAM2를 제안합니다. CamSAM2는 SAM2의 매개변수를 수정하지 않고, 새로운 'decamouflaged token'을 도입하여 특징 조정의 유연성을 높였습니다. 또한, 현재 프레임과 이전 프레임의 고해상도 특징을 효과적으로 활용하기 위해 암시적 객체 인식 융합(IOF) 및 명시적 객체 인식 융합(EOF) 모듈을 제안하고, 이전 프레임의 고품질 특징을 사용하여 객체 프로토타입을 추출하고 기억하는 객체 프로토타입 생성(OPG)을 도입했습니다. 실험 결과, CamSAM2는 SAM2에 비해 세 가지 VCOS 데이터셋에서 성능이 크게 향상되었으며, 특히 MoCA-Mask 데이터셋에서 클릭 프롬프트를 사용했을 때 12.2 mDice, SUN-SEG-Hard 데이터셋에서 마스크 프롬프트를 사용했을 때 19.6 mDice의 성능 향상을 보였습니다. Hiera-T를 백본으로 사용하였으며, 코드는 깃허브에 공개될 예정입니다.