본 논문은 텍스트 기반의 항공 및 지상 인물 검색 (TAG-PR)을 소개하며, 텍스트 설명을 기반으로 항공 및 지상 뷰에서 인물 이미지를 검색하는 것을 목표로 한다. 기존의 지상 뷰 이미지만을 다루는 텍스트 기반 인물 검색 (T-PR)과 달리, TAG-PR은 실용성을 높였으며, 이미지 간의 큰 시점 차이로 인해 독특한 어려움을 제시한다. 이를 위해, (1) 공개 벤치마크를 기반으로 구축되고 다양한 텍스트 생성 패러다임을 통해 시점 이질성 하에서 견고성을 보장하는 TAG-PEDES 데이터 세트와, (2) 시점 특정 및 시점 불가지론적 특징을 학습하기 위한 계층적으로 라우팅된 전문가 혼합 모듈과 더 나은 교차 모달 정렬을 위해 시점 특정 특징을 분리하는 시점 분리 전략을 통해 시점 이질성을 해결하는 새로운 검색 프레임워크인 TAG-CLIP을 제안한다. TAG-CLIP의 효과는 제안된 TAG-PEDES 데이터 세트와 기존 T-PR 벤치마크에서 평가되었다.