Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers

Created by
  • Haebom

作者

Ming Hu, Chenglong Ma, Wei Li, Wanghan Xu, Jiamin Wu, Jucheng Hu, Tianbin Li, Guohang Zhuang, Jiaqi Liu, Yingzhou Lu, Ying Chen, Chaoyang Zhang, Cheng Tan, Jie Ying, Guocheng Wu, Shujian Gao, Pengcheng Chen, Jia Wang, Yuanyuan Zhang, Xiangyu Zhao, Feilong Tang, Encheng Su, Junzhi Ning, Xinyao Liu, Ye Du, Changkai Ji, Pengfei Jiang, Cheng Tang, Ziyan Huang, Jiyao Liu, Jiaqi Wei, Yuejin Yang, Xiang Zhang, Guang Ziyang Chen, Yizhou Wang, Chen Tang, Jianyu Wu, Yuchen Ren, Siyuan Yan, Zhonghua Wang, Zhongxing Xu, Shiyan Su, Shangquan Sun, Runkai Zhao, Zhisheng Zhang, Dingkang Yang, Jinjie Wei, Jiaqi Wang, Hongze Zhu, Yu Liu, Fudi Wang, Yiqing Shen, Yuanfeng Ji, Yanzhou Su, Tong Xie, Hongming Shan, Chun-Mei Feng, Zhi Hou, Diping Song, Lihao Liu, Yanyan Huang, Lequan Yu, Bin Fu, Shujun Wang, Xiaomeng Li, Xia Yuewen Cao, Minjie Shen, Jie Xu, Haodong Duan, Fang Yan, Hongxia Hao, Jielan Li, Jiajun Du, Yanbo Wang, Imran Razzak, Zhongying Deng, Chi Zhang, Lijun Wu, Conghui He, Zhaohui Lu, Jinhai Huo, Yenq Xin, Xiaohong Liu, Fenghua Ling, Yuqiang Li, Aoran Wang, Siqi Sun, Qihao Zheng, Nanqing Dong, Tianfan Fu, Dongzhan Zhou, Yan Lu, Wenlong Zhang, Jin Ye, Jianfei Cai, Yirong Chen, Wanliuo Junjun He, Chunfeng Song, Lei Bai, Bowen Zhou

Sci-LLMs:データ中心の観点からの科学的大規模言語モデルの研究

概要

本論文は、科学研究における知識表現、統合、および適用方法を変える科学的大規模言語モデル(Sci-LLM)の進歩を、モデルと基本データ基質の間の共振化に再構成するデータ中心の包括的な研究を提示する。科学データの統合分類法と科学知識の階層モデルを提示し、一般的な自然言語処理データセットと区別される科学コーパスのマルチモード、クロススケール、およびドメイン固有の課題を強調します。様々な科学分野の専門モデルと一般目的ベースのモデルを含む最近のSci-LLMsを体系的に検討し、270以上の事前/事後訓練データセットを広く分析する。これは、Sci-LLMが不均一で多重で不確実性の高いコーパスという独自の要件を提示し、ドメインの不変性を維持し、クロスモード推論を可能にする表現が必要であることを示しています。評価時には、190以上のベンチマークデータセットを確認し、静的試験からプロセスと発見指向の評価への移行と高度な評価プロトコルを追跡します。これらのデータ中心の分析は、科学データ開発の継続的な問題を強調し、半自動注釈パイプラインと専門家検証を含む新しいソリューションを議論します。最後に,Sci-LLMsベースの自律エージェントが積極的に実験,検証し,進化する知識ベースに寄与する閉ループシステムへのパラダイム転換を提示した。この研究は、科学的発見を加速する信頼性が高く継続的に進化するAIシステムを構築するためのロードマップを提供します。

Takeaways、Limitations

Sci-LLMの発展をデータ中心の観点から再構成し,モデルとデータ間の相互作用を強調した。
科学データの統合分類法と科学知識の階層モデルの提示
マルチモード、クロススケール、ドメイン固有の課題など、Sci-LLMsの独自の要件を強調します。
様々なSci-LLMと関連データセットの広範な分析
静的評価からプロセスと発見指向の評価への移行を追跡
半自動注釈パイプラインや専門家検証などの新しいソリューションの提案
Sci-LLMsベースの自律エージェントを利用した閉ループシステムへのパラダイム変換の提示
論文の具体的な技術的詳細や実装方法の詳細な説明の欠如。
提案された解決策の実際の適用と性能の検証の欠如。
特定の分野やモデルに対する深い分析の限界。
閉ループシステムの実現可能性と潜在的な問題に関する議論の欠如
研究結果の一般化の可能性と他の科学分野への拡張に関するさらなる研究の必要性
👍