Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

$\Texttt{Droid}$: A Resource Suite for AI-Generated Code Detection

작성자
  • Haebom

作者

Daniil Orel, Indraneil Paul, Iryna Gurevych, Preslav Nakov

概要

この論文では、機械生成コード検出器を訓練し評価するための最も広範なオープンデータセットであるDroidCollectionを紹介します。 DroidCollectionには、100万を超えるコードサンプル、7つのプログラミング言語、43のコーディングモデル出力、および3つ以上の実際のコーディングドメインが含まれています。完全にAIによって生成されたサンプルに加えて、人とAIが共同で作成したコードと検出を回避するように明示的に作成された敵対的なサンプルも含まれています。続いて、論文では、 DroidCollectionを使用して、マルチタスク目標で訓練されたエンコーダ専用の検出器のコレクションであるDroidDetectを開発します。実験の結果,従来の検出器の性能は,狭い訓練データ外の様々なコーディングドメインとプログラミング言語に一般化されないことを示した。さらに、ほとんどの検出器は、表面的なプロンプトとアライメントアプローチを使用して出力分布を人間化することによって容易に損傷する可能性がありますが、少量の敵対データでトレーニングすることでこの問題を簡単に解決できることを示しています。最後に、メトリック学習と不確実性ベースの再サンプリングが、ノイズがある可能性がある分布で検出器トレーニングを向上させる効果的な方法であることを示しています。

Takeaways、Limitations

Takeaways:
機械生成コード検出器のトレーニングと評価のための大規模オープンデータセット(DroidCollection)を提供
様々なコーディングドメインとプログラミング言語のための既存の検出器の一般化性能の低下問題を提起
敵対的な例を利用した検出器性能の向上の可能性の提示
メトリック学習と不確実性に基づく再サンプリング手法の効果を実証
Limitations:
DroidCollectionの多様性にもかかわらず、実際の世界のすべてのコーディングドメインとプログラミング言語を完全に網羅できない可能性があります。
提示された敵対的な例を作成する方法は、あらゆる種類の回避技術を網羅できない可能性があります。
メトリック学習と不確実性に基づく再サンプリング手法の効果は、データの分布に依存する可能性があります。
👍