Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials

Created by
  • Haebom

作者

Gongbo Zhang, Yanting Li, Renqian Luo, Pipi Hu, Yang Yang, Zeru Zhao, Lingbo Li, Guoqing Liu, Zun Wang, Ran Bi, Kaiyuan Gao, Liya Guo, Yu Xie, Chang Liu, Jia Zhang, Tian Xie, Robert Pinsler, Claudio Zeni Marwin Segler, Maik Riechert, Wei Yang, Hao Jiang, Wen-Bin Zhang, Zhijun Zeng, Yi Zhu, Li Dong, Xiuyuan Hu, Li Yuan, Lei Chen, Haiguang Liu, Tao Qin

概要

UniGenXは、タンパク質、分子、材料など、さまざまな領域で機能や特性を直接目指し、1次元配列と3次元座標を共同生成する統合生成基礎モデルです。既存生成モデルのLimitationsである機能に対する直接的な目標設定部材、離散配列と連続座標の独立最適化、および形態的アンサンブルの不足したモデリングを解決するために、記号と数字トークンの混合ストリームで異質な入力を表現し、デコーダ専用自己回帰トランスフォーマを通じてグローバルコンテキストを提供し、条件付き拡散ヘッドを通じて。構造予測作業で新たな最高性能を達成しただけでなく、材料、化学、生物学の分野で機能認識生成に対する最先端または競争力のある性能を示しています。特に材料分野では3つの制約を満たす436個の結晶候補を生成し(そのうち11個は新しい組成)、化学分野では5つの特性目標とGEOMでの立体異性体アンサンブル生成に対する新しい基準を設定し、生物学分野ではタンパク質誘導適合モデリングの成功率を23倍以上向上させました。結論として、離散連続共同訓練の利点を実証する実験結果と、ドメイン間の転移学習を通じて予測から制御可能で機能認識生成への重要な進歩を遂げた。

Takeaways、Limitations

Takeaways:
タンパク質、分子、材料など、さまざまな領域で機能と特性を直接目標とする統合生成モデルを提示します。
既存モデルのLimitationsである機能に対する直接的な目標設定部材、離散配列と連続座標の独立した最適化、形態的アンサンブルの不足したモデリング問題の解決
構造予測および機能認識生成タスクにおける最先端または競争力のあるパフォーマンスを達成します。
材料、化学、生物学の分野で目立つ性能向上(例えば、タンパク質誘導適合モデリング成功率23倍以上向上)。
離散 - 連続共同訓練の効果を実験的に証明した。
ドメイン間の遷移学習の可能性を示します。
Limitations:
論文では具体的なLimitationsは言及されていない。今後の研究では、モデルのパフォーマンスの向上とカバレッジの拡張が必要になると予想されます。
👍