Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Analyzing Latent Concepts in Code Language Models

Created by
  • Haebom

作者

Arushi Sharma, Vedant Pungliya, Christopher J. Quinn, Ali Jannesari

Code Concept Analysis (CoCoA): 解釈可能なコード言語モデル

概要

この論文では、コードについて訓練された大規模言語モデルの内部動作を解釈する方法を紹介します。特に、信頼性、透明性、意味論的堅牢性が要求されるアプリケーションに焦点を当てます。 Code Concept Analysis(CoCoA)と呼ばれるグローバルな事後解釈可能なフレームワークを提案し、コンテキスト化されたトークン埋め込みを人間が解釈可能な概念グループにクラスタリングすることで、コード言語モデルの表現空間に現れる語彙的、構文的、意味的な構造を明らかにします。静的分析ツールベースの構文ソートとプロンプトエンジニアリングされた大規模言語モデル(LLM)を組み合わせたハイブリッド注釈パイプラインを提案し、抽象化レベル全体にわたって潜在的な概念をスケーラブルにラベル付けします。いくつかのモデルと作業の実験的評価により、CoCoAは意味保存的な摂動の下で安定的に維持され(平均クラスター感度指数、CSI = 0.288)、ファインチューニングで予測可能に進化するという概念が見つかりました。プログラミング言語の分類作業に関するユーザー研究の概念で強化された説明は、トークンの役割を明確にし、統合グラデーションを使用したトークンレベルの帰属と比較して、人間中心の説明の可能性を37%向上させました。

Takeaways、Limitations

Takeaways:
コード言語モデルの内部動作を解釈する新しいフレームワーク(CoCoA)提案。
語彙、構文、および意味構造を把握し、モデルの表現空間を分析します。
ハイブリッド注釈パイプラインによるスケーラブルな概念ラベリング
モデル安定性とファインチューニングによる予測可能な概念進化の実証
概念ベースの説明によるトークンの役割の明確化と人間中心の説明の可能性の向上(37%増加)。
Limitations:
論文に記載されているLimitationsはありません。
👍