Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Kourkoutas-Beta: A Sunspike-Driven Adam Optimizer with Desert Flair

Created by
  • Haebom

作者

Stavros C. Kassinos

概要

本論文は、変動する境界および初期条件からの訓練サンプルが不規則な損失と急激な勾配を引き起こす可能性があるデータベースの偏微分方程式(PDE)代用モデルと、剛性複合損失がこれらの効果を増幅する物理情報ニューラルネットワーク(PINN)におけるトランスフォーマーニューラルネットワークの活用に関する問題を扱います。これを解決するために、固定された2番目のモーメント割引率beta2を階層ごとの動的値に置き換えるAdamスタイルオプティマイザであるKourkoutas-Betaを提案します。この動的値は、過去のスロープノルムの指数移動平均(EMA)で割った現在プールされたスロープノルムである境界「sunspike」の比率によって決定され、[0、1)区間に圧縮されます。スパイクは beta2 を beta2_min に下げ、安定した段階では beta2_max の近くに保ちます。 Heat2D(Transformer PDE 代用モデル)、Heat3D(3D PINN 熱伝導)、MLX 合成操作、small-enwik8(文字レベル Transformer)など、4 つの設定で Kourkoutas-Beta をテストして、固定 beta2 Adam と比べて安定性と最終損失を改善することを示しています。特に、small-enwik8では、Adam-0.95に対して約38%、Adam-0.999に対して約58%のビット当たりの文字数を下げました。 Kourkoutas-BetaはAdamと同様のランタイムオーバーヘッドを持ち、急激な傾きの下で堅牢性を向上させながらAdamスタイルの収束を保証します。

Takeaways、Limitations

Takeaways:
変動する境界と初期条件による不規則な損失と急激な勾配問題を解決する新しいAdamスタイルオプティマイザKourkoutas-Beta提案
PDE代用モデルとPINNにおける安定性と性能の向上
Small-enwik8データセットでAdamと比較してパフォーマンスが向上しました(ビットあたりの文字数を減らす)。
Adamに似た実行時間のオーバーヘッドを維持します。
Limitations:
提案されたオプティマイザの性能は、特定の問題とデータセットによって異なります。
限られた範囲の実験結果のみが提示される。より多くの問題とデータセットの追加の実験が必要です。
Kourkoutas-Betaのハイパーパラメータ最適化の詳細な説明の欠如
👍