본 논문은 GroundingDINO와 LAE-DINO와 같은 방대한 데이터셋으로 사전 훈련된 기반 모델을 사용하여 교차 도메인 극소수 샷 객체 탐지(CD-FSOD) 작업에서 성능을 크게 향상시키는 방법을 제시합니다. 이미지 기반 데이터 증강 기법과 그리드 기반 하위 도메인 탐색 전략을 통합하여 극소수 샷 훈련을 통해 기반 모델의 성능을 향상시켰습니다. GroundingDINO를 기반으로 여러 가지 널리 사용되는 이미지 증강 방법과 최적화 목표를 사용하여 최적의 하위 도메인을 효율적으로 탐색하는 방법을 제시합니다. 이를 통해 데이터가 부족한 환경에서 비전-언어 모델의 실용적인 배포를 크게 발전시키고, 노력이 많이 드는 재훈련 없이 교차 도메인 일반화 기능을 최적화하는 데 대한 중요한 통찰력을 제공합니다. 소스 코드는 https://github.com/jaychempan/ETS 에서 이용 가능합니다.