Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Evaluating Query Efficiency and Accuracy of Transfer Learning-based Model Extraction Attack in Federated Learning

Created by
  • Haebom

저자

Sayyed Farid Ahamed, Sandip Roy, Soumya Banerjee, Marc Vucovich, Kevin Choi, Abdul Rahman, Alison Hu, Edward Bowen, Sachin Shetty

개요

본 논문은 연합 학습(Federated Learning, FL) 환경에서의 지적 재산권(Intellectual Property, IP) 위협, 특히 모델 추출(Model Extraction, ME) 공격에 대한 취약성을 분석합니다. NVFlare 플랫폼 기반의 다양한 연합 학습 클라이언트를 대상으로 두 가지 심층 학습 아키텍처와 세 가지 이미지 데이터셋에서 ME 공격을 구현하고, 정확도, 충실도, KL 발산 등의 지표를 사용하여 공격 성능을 평가했습니다. 실험 결과, 추출된 모델의 정확도와 충실도는 공격 쿼리 집합의 크기와 밀접한 관련이 있음을 보였고, 사전 훈련된 모델을 기반으로 전이 학습을 활용한 ME 공격이 특히 작은 쿼리 집합에서 더 높은 정확도와 충실도를 달성함을 확인했습니다.

시사점, 한계점

시사점:
연합 학습이 모델 추출 공격에 취약함을 실험적으로 증명.
공격 쿼리 집합의 크기가 추출 모델의 성능에 큰 영향을 미침을 밝힘.
전이 학습 기반의 모델 추출 공격이 효과적임을 제시.
연합 학습 기반 서비스의 보안 강화 필요성을 시사.
한계점:
특정 플랫폼(NVFlare)과 제한된 아키텍처 및 데이터셋에 대한 실험 결과임.
다양한 공격 방식에 대한 포괄적인 분석이 부족.
실제 환경에서의 공격 성공률과 그 영향에 대한 추가 연구 필요.
제안된 방어 기법에 대한 논의 부재.
👍