Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement

Created by
  • Haebom

作者

Xiwei Deng, Xianchun He, Jianfeng Bao, Yudan Zhou, Shuhui Cai, Congbo Cai, Zhong Chen

概要

本論文は、医療従事者の負担を軽減し、患者の治療を改善するために3D CT画像から自動的に診断レポートを生成するCTレポート生成(CTRG)の問題について説明します。既存の研究が様々な解剖学的観点から診断情報を効果的に統合することができず、正確で信頼できる診断に不可欠な臨床専門知識が不足しているという限界を克服するために、医療スタッフの診断過程を模倣する新しい多視点認識知識向上トランスフォーマー(MvKeTR)モデルを提案します。 MvKeTRは、複数の解剖学的視点(axial、coronal、sagittal)での診断情報を効果的に統合する視点認識アテンションを持つ多視点認識集計器(MVPA)と、同様のレポートを検索して診断プロセスにドメイン知識を統合するクロスモーダル知識向上器(CMKE)で構成されています。また、従来のMLPの代わりにパラメータ効率が高く、スペクトル偏向が低減されたKolmogorov-Arnold Networks(KANs)を使用して、高周波成分を効果的に捕捉し、過適合を緩和します。パブリックデータセットCTRG-Chest-548 Kの広範な実験を通して、提案された方法は、既存の最先端のモデルがほとんどの指標を超えていることを示しています。ソースコードはGitHubで公開されています。

Takeaways、Limitations

Takeaways:
多視点情報の統合と臨床知識の活用によるCTレポート生成性能の向上
KANsの活用によるパラメータの効率性と過適合の問題解決
従来の最先端モデル性能を上回る結果を達成。
公開されたソースコードによる再現性と拡張性の確保。
Limitations:
特定のデータセット(CTRG-Chest-548 K)のパフォーマンス評価のみが提示され、一般化パフォーマンス検証が必要です。
臨床現場適用のための追加の検証と安全性の確保が必要です。
他のモダリティ(例えば、MRI、PET)データに対する適用可能性の研究が必要です。
👍