Sign In

MOVE: Effective and Harmless Ownership Verification via Embedded External Features

Created by
  • Haebom
Category
Empty

저자

Yiming Li, Linghui Zhu, Xiaojun Jia, Yang Bai, Yong Jiang, Shu-Tao Xia, Xiaochun Cao, Kui Ren

개요

본 논문은 심층 신경망(DNN)의 모델 도용 위협에 대응하기 위한 효과적이고 무해한 모델 소유권 검증 방법(MOVE)을 제안합니다. 기존의 잘 훈련된 DNN 모델은 높은 가치를 지니지만, 모델 도용 공격에 취약합니다. MOVE는 공격자가 모델을 질의만으로도 기능적으로 유사한 복제본을 얻을 수 있는 위협에 대응합니다. 이 방법은 방어자가 지정한 외부 특징에 대한 지식을 의심스러운 모델이 포함하고 있는지 여부를 검증하여 소유권을 확인합니다. 구체적으로 스타일 전이를 이용하여 몇몇 훈련 샘플을 수정하여 외부 특징을 삽입하고, 메타 분류기를 훈련하여 모델이 피해자 모델로부터 도난당했는지 여부를 판단합니다. 화이트박스 및 블랙박스 설정 모두에서 MOVE 방법을 개발하고 이론적 기반을 분석하여 포괄적인 모델 보호를 제공합니다. 다양한 벤치마크 데이터셋에 대한 광범위한 실험을 통해 방법의 효과성과 잠재적인 적응형 공격에 대한 저항성을 검증했습니다.

시사점, 한계점

시사점:
DNN 모델 도용 공격에 대한 효과적이고 무해한 방어 메커니즘을 제공합니다.
화이트박스 및 블랙박스 설정 모두에서 작동하는 범용적인 방법론을 제시합니다.
이론적 기반 분석을 통해 방법의 신뢰성을 높였습니다.
공개된 코드를 통해 재현성을 확보하였습니다.
한계점:
스타일 전이를 통한 외부 특징 삽입의 효율성 및 일반화 성능에 대한 추가 연구가 필요할 수 있습니다.
메타 분류기의 성능이 전체 시스템의 성능에 크게 영향을 미치므로, 메타 분류기의 성능 향상에 대한 연구가 필요합니다.
극도로 정교한 적응형 공격에 대한 저항성에 대한 추가적인 검증이 필요할 수 있습니다.
👍