Evidencing Unauthorized Training Data from AI Generated Content using Information Isotopes
Created by
Haebom
Category
Empty
저자
Qi Tao, Yin Jinhua, Cai Dongqi, Xie Yueqi, Wang Huili, Hu Zhiyang, Yang Peiru, Nan Guoshun, Zhou Zhili, Wang Shangguang, Lyu Lingjuan, Huang Yongfeng, Lane Nicholas
개요
본 논문은 대규모 고품질 데이터를 사용하여 고급 AI를 구축하는 과정에서 발생하는 저작권 및 개인 정보 침해 문제를 해결하기 위해, 정보 동위원소 개념을 도입한 새로운 데이터 추적 방법을 제안한다. 이 방법은 AI 생성물 내에 존재하는 특정 정보 동위원소를 탐지하여 무단 데이터 사용 여부를 확인하는 데 초점을 맞춘다. GPT-4o, Claude-3.5, DeepSeek 등 10개의 AI 모델과 의료 데이터, 저작권이 있는 책, 뉴스 등 4개의 벤치마크 데이터셋을 사용한 실험 결과, 제안된 방법은 99%의 정확도로 훈련 데이터셋과 비훈련 데이터셋을 구분할 수 있음을 보여준다. 이는 AI 전문 지식이 없는 개인도 자신의 데이터 권리를 보호할 수 있는 가능성을 제시한다.
시사점, 한계점
•
시사점:
◦
불투명한 클라우드 기반 AI 시스템에서의 무단 데이터 사용 증거를 효과적으로 찾아낼 수 있는 새로운 방법 제시.
◦
AI 전문 지식이 없는 개인도 자신의 데이터 권리를 보호할 수 있도록 지원하는 잠재력을 가짐.
◦
99%의 높은 정확도로 훈련 데이터의 유무를 판별 가능.
◦
의료 데이터, 저작권 자료, 뉴스 등 다양한 중요 영역에서의 적용 가능성을 보여줌.
•
한계점:
◦
현재 제시된 방법의 일반화 가능성 및 다양한 AI 모델과 데이터셋에 대한 추가적인 검증 필요.