Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Surya: Foundation Model for Heliophysics

Created by
  • Haebom

作者

Sujit Roy, ​​Johannes Schmude, Rohit Lal, Vishal Gaur, Marcus Freitag, Julian Kuehnert, Theodore van Kessel, Dinesha V. Hegde, Andr es Mu noz-Jaramillo, Johannes Jakubik, Etienne Vos, Kshitiz Mandal, Ata Akbari Asanjan, Jona Singh、Kang Yang、Chetraj Pandey、Jinsu Hong、Berkay Aydin、Thorsten Kurth、Ryan McGranaghan、Spiridon Kasapis、Vishal Upendran、Shah Bahauddin、Daniel da Silva、Nikolai V. Pogorelov、Anne Spalding、Campbell Watson、Manil Maskey Rahul Ramachandran

概要

Suryaは太陽物理学のための3億6600万パラメータの基礎モデルです。マルチメータSDO観測(8つのAIAチャネルと5つのHMI製品を含む)から汎用太陽表現を学習するように設計されています。空間-時間コンバータ構造、スペクトルゲーティング、長短距離アテンションを使用し、高解像度の太陽画像予測作業で事前訓練され、自己回帰展開微調整によって最適化されました。ゼロショット評価は太陽動力学とフレア現象の予測能力を示し、LoRAを使用した下流の微調整は、太陽風予測、活動領域分割、太陽フレア予測、およびEUVスペクトルで強力な性能を示しています。 Suryaは、フル解像度のSDOデータから時間の進行をプリテキストタスクとして使用する最初の太陽物理学の基礎モデルです。

Takeaways、Limitations

Takeaways:
太陽物理学分野初の基礎モデルとして、フル解像度SDOデータを使用して時間の進行をプリテキストタスクとして活用。
様々な太陽現象予測(太陽動力学、フレア、太陽風など)や分析(活動領域分割、EUVスペクトルなど)に強力な性能を見せます。
ゼロショットとLoRAベースのパラメータ効率的な微調整により、さまざまな太陽現象の一般化能力を実証
モデルが太陽進化の基本物理学を学習できることを示唆。
Limitations:
論文で明示的に言及されているLimitationsはありません。さらなる研究は、モデルの一般化性能と物理的解釈力のより詳細な分析を必要とするかもしれません。
データの偏りによる性能低下の可能性
モデルの複雑さによる計算コストと解釈の難しさ
👍