每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

T-SYNTH:基于知识的合成乳房图像数据集

Created by
  • Haebom

作者

克里斯托弗·维德曼、阿纳斯塔西娅·萨马耶娃、埃琳娜·西齐科娃、丹尼尔·菲连科、米格尔·拉戈、亚娜·G·德尔菲诺、阿尔多·巴达诺

大纲

本文提出了一种考虑物理和生物约束生成的合成数据,旨在解决获取正确标注的大规模数据集的有限性问题,而这正是医学成像算法开发和评估的一大障碍。具体而言,我们应用物理模拟来生成具有像素级分割标注(这极其难以获取)的合成图像。我们将此方法应用于乳腺图像分析,并发布了 T-SYNTH,这是一个包含二维数字乳腺 X 线摄影 (DM) 和三维数字乳腺断层合成 (DBT) 图像的大型开源数据集。初步实验结果表明,T-SYNTH 图像能够有效增强有限的现实世界患者数据集,从而用于检测 DM 和 DBT。数据和代码已在https://github.com/DIDSR/tsynth-release公开发布。

Takeaways, Limitations

Takeaways:
我们提出了一种新方法,通过基于物理模拟的合成数据生成来解决开发和评估医学成像算法所需的大规模数据集的安全挑战。
通过发布具有像素级分割注释的大型开源数据集 T-SYNTH 为研究社区做出贡献。
T-SYNTH 数据集有可能有助于提高 DM 和 DBT 检测任务的性能。
Limitations:
需要进一步研究来验证合成数据的真实性并检查其与实际患者数据的差异。
需要进一步评估T-SYNTH数据集的多样性和泛化性能。
基于物理模拟生成合成数据过程中的计算成本和复杂性问题。
👍