Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SoK: Large Language Model Copyright Auditing via Fingerprinting

Created by
  • Haebom

저자

Shuo Shao, Yiming Li, Yu He, Hongwei Yao, Wenyuan Yang, Dacheng Tao, Zhan Qin

개요

본 논문은 대규모 언어 모델(LLM)의 저작권 침해 문제를 해결하기 위한 LLM 지문 기술에 대한 최초의 종합적인 연구이다. LLM 지문 기술은 LLM에서 독특한 특징을 추출하여 저작권 침해를 식별하는 비침습적인 기술이다. 본 논문에서는 기존 방법들을 화이트박스 및 블랙박스 접근 방식으로 분류하는 통합 프레임워크와 공식적인 분류 체계를 제시하고, 현실적인 배포 시나리오에서 LLM 지문 기술을 평가하기 위한 최초의 체계적인 벤치마크인 LeaFBench를 제안한다. LeaFBench는 주요 기반 모델을 기반으로 하며 149개의 서로 다른 모델 인스턴스와 13가지 대표적인 개발 후 기술(파라미터 변경 방법 및 파라미터 독립적 메커니즘 포함)을 통합한다. LeaFBench를 사용한 광범위한 실험을 통해 기존 방법의 강점과 약점을 밝히고, 이 신흥 분야의 미래 연구 방향과 중요한 미해결 문제를 제시한다. 코드는 https://github.com/shaoshuo-ss/LeaFBench 에서 확인 가능하다.

시사점, 한계점

시사점:
LLM 지문 기술의 종합적인 연구를 최초로 제시하여, 저작권 침해 방지에 대한 새로운 해결책을 제공한다.
LLM 지문 기술 방법들을 체계적으로 분류하는 통합 프레임워크와 분류 체계를 제공한다.
현실적인 배포 시나리오를 고려한 최초의 체계적인 벤치마크 LeaFBench를 제시하여, 기존 방법들의 성능을 평가하고 미래 연구 방향을 제시한다.
다양한 모델 수정 및 평가 표준 부재로 인한 LLM 지문 기술의 신뢰성 문제를 해결하기 위한 노력을 보여준다.
한계점:
LeaFBench가 모든 가능한 모델 수정 및 배포 시나리오를 포괄하지 못할 수 있다.
새로운 LLM 지문 기술이 등장함에 따라 LeaFBench의 지속적인 업데이트 및 유지보수가 필요하다.
LLM 지문 기술의 효과적인 적용을 위해서는 법적, 윤리적 문제에 대한 추가적인 논의가 필요하다.
👍