每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

许可的 LLM:在大型语言模型中强制访问控制

Created by
  • Haebom

作者

Bargav Jayaraman、Virendra J. Marathe、Hamid Mozaffari、William F. Shen、Krishnaram Kenthpadi

大纲

本文提出了“许可型语言模型 (PermLLM)”,这是一种新的语言模型 (LLM) 类,它在查询响应中强制执行组织数据访问控制结构,以应对企业环境中基于孤立和隔离的组织数据训练的大规模语言模型 (LLM) 为具有不同访问权限的用户提供服务时出现的挑战。我们提出了抽象概念来演示 PermLLM 中访问控制的正确执行、相关的响应概念以及一个新指标——访问优势,以评估 PermLLM 机制的有效性。此外,我们引入了三种基于参数高效微调的新型 PermLLM 机制,并提出了两种访问优势的实现:基于成员推理攻击的域可区分性指数 (DDI) 和基于 LLM 效用评估的效用差距指数 (UGI)。我们对 PermLLM 机制的有效性进行了广泛的实验,并使用五个公开可用的数据集(GPQA、RCV1、SimpleQA、WMDP 和 PubMedQA)评估了 DDI 和 UGI 指标的有效性。

Takeaways, Limitations

Takeaways:
一种解决企业环境中 LLM 中数据访问控制挑战的新方法。
开发形式抽象、相关响应概念和访问效益指标,以确保和评估 PermLLM 的正确运行。
提出三种基于参数有效微调的PermLLM机制。
开发 DDI 和 UGI 指标来衡量访问效益。
通过使用各种数据集的大量实验验证了 PermLLM 机制的有效性。
Limitations:
需要对所提出的 PermLLM 机制的实际实施和部署进行进一步研究。
需要进一步评估以确定 DDI 和 UGI 指标对不同数据类型和 LLM 模型的通用性。
如何平衡PermLLM机制的性能和访问控制还有待进一步研究。
缺乏实际商业环境中的测试和应用案例信息。
👍