本文介绍了 PETLP(Privacy-by-design Extract, Transform, Load, and Present)框架,这是一个面向人工智能研究人员在各种监管环境下(包括 GDPR、版权法和平台服务条款)使用社交媒体数据的监管合规框架。PETLP 将数据保护影响评估 (DPIA) 视为持续更新的文档,并在提取、转换、加载和呈现阶段嵌入法律保障措施。通过 Reddit 分析,PETLP 揭示了研究机构与商业实体之间在数据提取权方面的差距,以及真正匿名化的不可能性。此外,它还强调了数据集创建权限与模型部署不确定性之间的法律差距。PETLP 帮助研究人员有效地管理监管复杂性,并弥合法律要求与研究实践之间的差距。