Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

ReXGroundingCT: A 3D Chest CT Dataset for Segmentation of Findings from Free-Text Reports

Created by
  • Haebom

作者

Mohammed Baharoon, Luyang Luo, Michael Moritz, Abhinav Kumar, Sung Eun Kim, Xiaoman Zhang, Miao Zhu, Mahmoud Hussain Alabbad, Maha Sbayel Alhazmi, Neel P. Mistry, Lucas Bijnens, Kent Ryan Kleinschmidt, Brady Dinesh Jaliparthi, Noah Michael Prudlo, Mark David Marino, Jeremy Palacio, Rithvik Akula, Di Zhou, Hong-Yu Zhou, Ibrahim Ethem Hamamci, Scott J. Adams, Hassan Rayhan AlOmaish, Pranav Rajpurkar

概要

ReXGroundingCTは、胸部CTスキャンにおけるフリーテキスト所見をピクセルレベルの3D分割に関連付ける最初のパブリックデータセットです。 CT-RATEの標準化された放射線レポートに基づいて、3,142の非造影胸部CTスキャンが含まれています。 GPT-4を使用してレポートから所見、記述子、およびメタデータを抽出および標準化し、GPT-4o-miniを使用して肺および胸膜異常に対する階層的オントロジーとして各所見を分類しました。トレーニングセットは認定放射線と専門医の品質保証を受け、検証とテストセットは認定放射線と専門医によって完全にコメントされています。 ReXGroundingCTには、16,301個の注釈付きエンティティが含まれており、8,028個のテキスト-3D分割ペアを介してさまざまな放射線パターンをカバーしています。

Takeaways、Limitations

フリーテキスト所見を3D分割と結び付ける最初の公開データセットを提供します。
さまざまな放射線パターンを含む大規模データセット(3,142個のCTスキャン、16,301個の注釈エンティティ)。
GPT-4とGPT-4o-miniを活用したデータ生成と分類パイプラインの構築
認定放射線と専門医の品質保証と注釈による高い信頼性の確保。
公開検証セットとプライベートテストセットによるモデル性能評価
胸部CT画像における自由テキスト所見分割と放射線レポート生成のための基盤
Chain-of-thoughtデータセットによる解剖学的推論のサポート
モデルパフォーマンスのためのオープンリーダーボードを提供。
データセットは非造影CTスキャンに制限されています。
トルコ語報告書の機械翻訳過程でエラーが発生する可能性
GPTモデルの依存性による偏りと一般化問題の発生の可能性
データセット構築プロセスの詳細(例えば、特定のGPT-4oの使用方法、分割プロセスなど)は明確に示されていません。
👍