每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

标记代码而不破坏代码:用于检测 LLM 生成代码的代码水印

Created by
  • Haebom

作者

金正仁、朴信宇、韩耀燮

大纲

将水印嵌入 LLM 生成的代码进行识别,在保持功能准确性方面存在挑战。现有方法假设将水印嵌入高熵标记中能够有效保持输出质量。然而,语法上重要的标记(例如关键词)通常具有最高的熵,这使得现有方法容易受到逻辑损坏的影响。本文提出了 STONE,一种语法感知的水印方法,通过仅在非语法标记中嵌入水印来保持代码完整性。我们还介绍了 STEM,这是一个在准确性、可检测性和不可感知性之间取得平衡的综合框架。对于 Python、C++ 和 Java,STONE 能够保持准确性,保持强大的可检测性,并以最小的开销实现均衡的性能。

Takeaways,Limitations

Takeaways:
提出了一种语法感知水印方法(STONE):通过在非语法标记中嵌入水印来保持代码的准确性。
引入综合评估框架(STEM):平衡准确性、可检测性和不可感知性。
针对各种编程语言(Python、C++、Java)的性能验证。
Limitations:
需要对研究中未涉及的其他编程语言或代码生成模型进行性能评估。
需要分析水印技术中的潜在安全漏洞。
需要进一步研究现实环境中的可用性和可扩展性。
👍