Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models

Created by
  • Haebom

作者

Aakash Tripathi, Asim Waqas, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool

概要

HONeYBEEは、腫瘍学アプリケーションのためのマルチモーダル生医学データ統合オープンソースフレームワークです。構造化および非構造化臨床データ、完全なスライド画像、イメージングスキャン、および分子プロファイルを処理して、ドメイン固有の基本モデルおよび融合戦略を使用して統合された患者レベルの埋め込みを作成します。これらの埋め込みは、生存予測、癌タイプの分類、患者類似性の検索、およびコホートクラスタリングを可能にします。 TCGAの33種類の癌タイプにわたって11,400人以上の患者を対象に評価した結果、臨床埋め込みは98.5%の分類精度と患者検索で96.4%の精度@ 10で最も強力な単一モーダル性能を示しました。また、ほとんどのがんタイプで最高の生存予測一致指数を達成しました。マルチモーダル融合は特定の癌に対して相補的な利点を提供し、臨床的特徴だけでは達成できない全体的な生存予測を改善しました。 4つの大規模言語モデルの比較評価の結果、Qwen3などの汎用モデルは、病理学レポートなどの異機種データに対する作業固有の微調整パフォーマンスを向上させましたが、臨床テキスト表現は専門の医療モデルよりも優れていることがわかりました。

Takeaways、Limitations

Takeaways:さまざまな医療データモダリティを統合して腫瘍学の研究と予測のパフォーマンスを向上させるための効果的なフレームワークを提示します。特に臨床データに基づく埋め込みの優れた性能確認マルチモーダル融合による生存予測の改善の可能性の提示汎用LLMの医療データ処理性能の確認
Limitations: TCGAデータセットへの依存。他のデータセットへの一般化可能性検証が必要です。特定の癌タイプに対するマルチモーダル融合の効果は限定的であり得る。モデルの解釈可能性と説明力に関するさらなる研究が必要
👍