Sign In

Keys in the Weights: Transformer Authentication Using Model-Bound Latent Representations

Created by
  • Haebom
Category
Empty

저자

Ay\c{s}e S. Okatan, Mustafa Ilhan Akba\c{s}, Laxima Niure Kandel, Berker Pekoz

개요

본 논문은 트랜스포머 오토인코더에서 디코더 결합 속성인 Model-Bound Latent Exchange (MoBLE)를 제안하며, 이를 Zero-Shot Decoder Non-Transferability (ZSDN)로 공식화합니다. 동일한 데이터와 아키텍처를 사용하지만 다른 시드로 훈련된 모델에서, 자기 디코딩은 높은 정확도를 보이지만, 제로샷 크로스 디코딩은 우연 수준으로 성능이 저하됩니다. 이는 비밀 주입이나 적대적 훈련 없이 발생하며, 가중치 공간 거리 및 어텐션 발산 진단을 통해 확인됩니다. ZSDN은 모델 결합으로 해석되며, 아키텍처와 훈련 방법이 공개되어도 잠재적 인증 및 접근 제어 메커니즘으로 작용합니다. 인코더의 은닉 상태 표현은 평문을 결정적으로 노출하지만, 올바르게 키가 부여된 디코더만이 제로샷으로 이를 재생산합니다. 본 논문에서는 ZSDN, 디코더 결합 우위 메트릭을 공식화하고, 안전한 AI 파이프라인 배포에 대한 고려 사항을 제시합니다. 마지막으로, 학습 가능성 위험과 완화 방안에 대해 논의합니다. MoBLE은 항공 및 사이버-물리 시스템과 같은 안전 필수 도메인에서 안전한 AI 배포를 위한 경량화된 가속기 친화적인 접근 방식을 제공합니다.

시사점, 한계점

시사점:
트랜스포머 기반 모델에서 제로샷 디코더 비전송성을 활용한 새로운 보안 메커니즘 제시.
모델 결합을 통한 잠재적 인증 및 접근 제어 기능 제공.
안전 필수 도메인에서 안전한 AI 배포를 위한 실용적인 접근 방식 제시.
한계점:
어댑터 정렬과 같은 학습 가능성 위험 존재.
실제 배포 시 추가적인 완화 방안 필요.
특정 유형의 공격에 대한 취약성 분석 부족 가능성.
👍