Bài báo này lập luận rằng các khái niệm hiện tại về bảo vệ dữ liệu đã trở nên không còn phù hợp do sự thay đổi đáng kể về ý nghĩa và giá trị của dữ liệu trong kỷ nguyên AI tạo sinh. Vai trò quan trọng của dữ liệu trong suốt vòng đời AI làm nổi bật nhu cầu bảo vệ các dạng dữ liệu đa dạng, bao gồm dữ liệu đào tạo, lời nhắc và đầu ra. Để giải quyết vấn đề này, bài báo này đề xuất một phân loại bao gồm bốn cấp độ—không sử dụng được, quyền riêng tư, khả năng truy xuất nguồn gốc và xóa bỏ—để nắm bắt các nhu cầu bảo vệ dữ liệu đa dạng của các mô hình và hệ thống AI tạo sinh hiện đại. Khung này tạo điều kiện cho việc hiểu một cách có cấu trúc về sự đánh đổi giữa khả năng sử dụng và khả năng kiểm soát dữ liệu trên toàn bộ quy trình AI, bao gồm các tập dữ liệu đào tạo, trọng số mô hình, lời nhắc hệ thống và nội dung do AI tạo ra. Bài báo cũng phân tích các phương pháp kỹ thuật tiêu biểu ở mỗi cấp độ và xác định các điểm mù về quy định làm lộ ra các tài sản quan trọng. Cuối cùng, bài báo này cung cấp một khuôn khổ cấu trúc để điều chỉnh các công nghệ và quản trị AI trong tương lai với các thực hành dữ liệu đáng tin cậy, cung cấp hướng dẫn kịp thời cho các nhà phát triển, nhà nghiên cứu và cơ quan quản lý.