Following the Clues: Experiments on Person Re-ID using Cross-Modal Intelligence
Created by
Haebom
저자
Robert Aufschlager, Youssef Shoeb, Azarm Nowzad, Michael Heigl, Fabian Bally, Martin Schramm
개요
본 논문은 오픈 데이터로 공개된 거리 수준의 영상 데이터가 자율주행 시스템 및 AI 연구 발전에 중요한 역할을 하지만, 개인 식별 정보(PII)로 인해 개인 정보 보호 위험이 크다는 점을 다룹니다. 특히 얼굴과 같은 생체 정보를 넘어선 PII의 존재가 문제입니다. 이에 본 논문에서는 대규모 비전-언어 모델, 그래프 어텐션 네트워크, 표현 학습을 결합한 새로운 교차 모달 프레임워크인 cRID를 제시합니다. cRID는 해석 가능한 특징을 식별하고 활용하여 저수준 외관 단서를 넘어 의미적으로 의미 있는 PII를 탐지하는 데 중점을 둡니다. 실험 결과, 특히 Market-1501에서 CUHK03-np(탐지됨)로의 실용적인 교차 데이터셋 Re-ID 시나리오에서 성능이 향상되었음을 보여주며, 프레임워크의 실용성을 강조합니다. 코드는 https://github.com/RAufschlaeger/cRID 에서 이용 가능합니다.