Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Kourkoutas-Beta: A Sunspike-Driven Adam Optimizer with Desert Flair

Created by
  • Haebom

作者

Stavros C. Kassinos

概要

本論文は、変動する境界と初期条件からのトレーニングサンプルが不規則な損失と急激な勾配を引き起こすデータベースの偏微分方程式(PDE)代替モデルと剛性複合損失がこれらの効果を増幅する物理情報ニューラルネットワーク(PINN)でのトランスニューラルネットワークの使用に焦点を当てています。これを解決するために、固定二次モーメント割引率β₂を階層ごとの動的値に置き換えるAdamスタイルオプティマイザであるKourkoutas-Betaを提案します。この動的値は、現在プールされているスロープノルムと過去のノルムの指数移動平均(EMA)の比率である境界「sunspike」比率によって決まります。スパイクはβ₂をβ₂_minに向かって下げ、安定した段階ではβ₂_maxの近くに保ちます。 Leaky-AMSGrad(減衰)、信頼領域クリッピング(max_ratio)、適応微小項、およびいくつかのバイアス補正モード(「none」、「beta2max」、「exact」)を含むオプションがあります。 Heat2D(トランスフォーマーPDE代替モデル)、Heat3D(3D熱伝導PINN)、ブレとまれなトリガーバーストを備えた軽量MLX合成作業、および30MBのenwik8データセットを使用した文字レベルトランスフォーマーなど、4つの設定でKourkoutas-Betaをテストして固定β₂特に、small-enwik8では、Adam-0.95に対して約38%、Adam-0.999に対して約58%のbits-per-character減少が見られました。 Kourkoutas-Betaは、Adamスタイルの収束保証を維持しながら、急激な傾きの下での堅牢性を向上させるドロップイン方式です。

Takeaways、Limitations

Takeaways:
急激な勾配問題を経験する変圧器ベースの物理問題解決に効果的な新しい最適化手法の提示
Adamオプティマイザの安定性と性能を向上
さまざまな問題(PDE surrogate、PINN、合成タスク、言語モデル)でパフォーマンスの向上を確認します。
ドロップイン方式で既存のAdam代替可能で、ランタイムオーバーヘッドは微小。
Limitations:
提示された最適化手法の一般化性能に関する追加研究の必要性
さまざまなハイパーパラメータのチューニングの追加分析が必要です。
より複雑で大規模な物理問題に対する適用性検証が必要
特定の問題に最適化されたハイパーパラメータ設定が他の問題に適用されたときのパフォーマンスの変化を分析する必要があります。
👍