Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

An Agentic System for Rare Disease Diagnosis with Traceable Reasoning

Created by
  • Haebom

作者

Weike Zhao, Chaoyi Wu, Yanjie Fan, Xiaoman Zhang, Pengcheng Qiu, Yuze Sun, Xiao Zhou, Yanfeng Wang, Xin Sun, Ya Zhang, Yongguo Yu, Kun Sun, Weidi Xie

概要

DeepRareは、大規模言語モデル(LLM)ベースのまれな疾患診断エージェントシステムです。様々な臨床入力データを処理して、希少疾患の診断仮説を順位別に提示し、各仮説の推論プロセスを透明に示す。長期記憶モジュールを備えた中央ホストと40以上の専門ツールと最新の医学知識ソースを統合する特殊エージェントサーバーで構成されており、モジュール式で拡張可能な設計で複雑な診断推論を行いながらトレーサビリティと適応性を維持します。 8つのデータセットを使用した評価の結果、2,919の疾患のうち1,013の疾患に対して100%の精度が達成され、他の15の方法(従来の生物情報診断ツール、LLM、その他のエージェントシステムなど)より優れた性能を示した。特にRecall @ 1スコアは平均57.18%で、2番目に良い方法(Reasoning LLM)より23.79%p高かった。マルチモーダル入力シナリオでは、Recall@1スコアが70.60%でExomiser(53.20%)より高く、臨床専門家による推​​論過程の手動検証の結果、95.40%の一致率を示した。ユーザーフレンドリーなWebアプリケーション( http://raredx.cn/doctor)として実装されました。

Takeaways、Limitations

Takeaways:
LLMベースのまれな疾患診断システムの優れた性能を実証
従来の方法と比較して改善された精度とRecall @ 1スコアを達成。
さまざまな臨床データ(マルチモーダル)の処理可能性。
透明で追跡可能な診断推論プロセスを提供します。
ユーザーフレンドリーなWebアプリケーションとして実装。
Limitations:
評価データセットの規模と多様性の追加レビューが必要です。
実際の臨床環境における一般化の可能性に関するさらなる研究の必要性
誤差解析と改善策に関するさらなる研究が必要
Webアプリケーションのアクセシビリティと使いやすさの継続的な改善が必要です。
👍