iSeal: Encrypted Fingerprinting for Reliable LLM Ownership Verification
Created by
Haebom
Category
Empty
저자
Zixun Xiong, Gaoyi Wu, Qingyang Yu, Mingyu Derek Ma, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao Wang
개요
대규모 언어 모델(LLM)의 훈련 비용이 높음에 따라 LLM 지적 재산(IP) 보호가 중요해졌습니다. LLM 소유권 검증의 표준 패러다임인 LLM 핑거프린팅은 이 문제를 해결하는 데 중요한 역할을 합니다. 기존의 LLM 핑거프린팅 방법은 모델별 특징을 추출하거나 주입하여 소유권을 검증하지만, 모델 도둑이 LLM의 추론 과정을 완전히 제어할 경우 발생할 수 있는 공격을 간과합니다. 이러한 상황에서 공격자는 핑거프린트 언러닝을 위해 프롬프트-응답 쌍을 공유하거나, 정확한 일치 검증을 피하기 위해 출력을 조작할 수 있습니다. 본 연구에서는 모델 도둑이 의심되는 LLM을 종단간 방식으로 제어하는 경우에도 신뢰할 수 있는 검증을 위해 설계된 최초의 핑거프린팅 방법인 iSeal을 제안합니다. iSeal은 오류 수정 메커니즘과 유사성 기반 검증 전략으로 강화된 고유한 특징을 모델과 외부 모듈에 주입합니다. 이러한 구성 요소는 공모 기반 핑거프린트 언러닝 및 응답 조작을 포함한 검증 시간 공격에 저항하며, 이론적 분석과 실험 결과로 뒷받침됩니다. iSeal은 12개의 LLM에 대해 10가지 이상의 공격에 대해 100% 핑거프린트 성공률(FSR)을 달성하는 반면, 기본 방법들은 언러닝 및 응답 조작에 실패합니다.
시사점, 한계점
•
시사점:
◦
모델 도둑이 추론 과정을 완전히 제어하는 상황에서도 LLM 소유권을 신뢰성 있게 검증하는 새로운 핑거프린팅 방법론 제시 (iSeal).