本論文は、モデルの挙動を説明するためにモデルを逆設計する機械的解析可能性の研究に焦点を当てています。既存の研究が特定の行動の静的メカニズムに焦点を当てたのとは異なり、この論文はモデル内の学習のダイナミクスを探ります。この目的のために、学習メカニズムを分析する解釈可能な微調整方法である「Circuit-tuning」を提案する。ノードレベルの固有次元概念を導入してモデルの計算グラフで学習プロセスを説明し、2段階のアルゴリズムである circuit-tuning を介して特定のタスクの最小部分グラフを繰り返し構築し、主要パラメータをヒューリスティックに更新します。実験結果は、ノードレベルで固有次元の存在を確認し、透明で解釈可能な微調整のための本方法の効果を示す。微調整の前、中、および後の回路を可視化および分析し、ニューラルネットワークの自己組織化メカニズムに関する新しい洞察を提供する。