每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

Urania:对人工智能使用的差异化隐私洞察

Created by
  • Haebom

作者

Daogao Liu、Edith Cohen、Badih Ghazi、Peter Kairouz、Pritish Kamath、Alexander Knop、Ravi Kumar、Pasin Manurangsi、Adam Sealfon、Da Yu、Chiyuan Zhang

大纲

本文介绍了一个全新的框架——$Urania$,它能够洞察大规模语言模型 (LLM) 聊天机器人的交互,并提供严格的差分隐私 (DP) 保障。$Urania$ 采用隐私保护的聚类机制和创新的关键词提取方法,包括基于频率、基于 TF-IDF 和基于 LLM 的方法。$Urania$ 利用聚类、分区选择和基于直方图的摘要等 DP 工具,提供端到端的隐私保护。我们评估了词汇和语义内容保存、成对相似度以及基于 LLM 的指标,并将其与基于 Clio 的非隐私保护流程 (Tamkin et al., 2024) 进行了比较。我们还开发了一个简单的实证隐私评估模型,以证明 DP 流程的增强鲁棒性。结果表明,该框架能够提取有意义的对话洞察,同时严格保护用户隐私,从而有效地平衡数据效用和隐私。

Takeaways, Limitations

Takeaways:
我们提出了一个新颖的框架,用于在严格的差异隐私 (DP) 保证下深入了解 LLM 聊天机器人交互。
我们通过整合各种关键词提取方法(基于频率、基于 TF-IDF 和基于 LLM)提高了数据可用性。
我们提供端到端的隐私保护,强力保护用户隐私。
有效平衡数据可用性和隐私性。
Limitations:
本文提出的经验隐私评估的具体细节和局限性并未明确呈现。
需要对基于 Clio 的管道进行更详细的比较评估。
缺乏对现实世界大规模数据集的应用结果。
缺乏对$Urania$框架的计算成本和效率的分析。
👍