본 논문은 GPT-4o와 같은 비전-언어 모델(VLMs)이 공개적으로 공유된 이미지로부터 사용자의 위치를 추론하는 능력이 뛰어나다는 점에 주목하여, 지리적 프라이버시 위험을 제기하는 문제를 해결하고자 제안된 GeoShield에 대해 다룹니다. GeoShield는 기존의 적대적 섭동 방식의 한계(고해상도 이미지 및 낮은 섭동 예산에서의 성능 저하, 무관한 의미적 콘텐츠 도입)를 극복하기 위해 세 가지 주요 모듈(특징 분리 모듈, 노출 요소 식별 모듈, 규모 적응형 향상 모듈)로 구성된 새로운 적대적 프레임워크입니다. 각 모듈은 지리적 및 비지리적 정보 분리, 지리 정보 노출 영역 식별, 다양한 해상도에서 효과적인 전역 및 지역 수준 섭동 최적화를 담당하며, 실제 시나리오에서 강력한 지리적 프라이버시 보호를 제공합니다. 실험 결과, GeoShield는 기존 방법보다 블랙박스 설정에서 일관되게 우수한 성능을 보이며, 시각적 또는 의미적 품질에 미치는 영향을 최소화하면서 강력한 프라이버시 보호를 달성합니다.