每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

FASL-Seg:手术场景的解剖和工具分割

Created by
  • Haebom

作者

穆拉姆·阿卜杜勒-加尼、马哈茂德·阿里、穆罕默德·阿里、法特梅尔扎赫拉·艾哈迈德、穆罕默德·阿尔萨兰、阿卜杜勒阿齐兹·阿里、希丁·巴拉克里希南

大纲

本文基于机器人微创手术的日益普及,这使得基于深度学习的手术训练成为一个重要的研究领域。透彻理解手术场景的构成至关重要,而语义分割模型可以帮助实现这一点。现有研究往往侧重于手术工具而忽略了解剖对象,而最先进的模型难以同时捕捉高维上下文特征和低维边缘特征。在本文中,我们提出了一种特征自适应空间定位模型 (FASL-Seg),旨在通过两个独立的处理流捕捉不同特征分辨率的多个细节层次:低维特征投影 (LLFP) 流和高维特征投影 (HLFP) 流。我们在 EndoVis18 和 EndoVis17 手术分割基准数据集上的三个用例上对 FASL-Seg 进行了评估。 FASL-Seg 模型在 EndoVis18 数据集上对组件和解剖结构进行分割时,平均 IoU (mIoU) 达到 72.71%,比最佳方法高出 5%。此外,在 EndoVis18 和 EndoVis17 数据集上,该模型对工具类型进行分割时,mIoU 分别达到 85.61% 和 72.78%,整体性能优于最佳方法。在这两个数据集上,该模型在每个类别上都取得了与最佳方法类似的结果,表明在解剖结构和器械类别中表现出一致的性能,并证明了针对不同特征分辨率使用独立处理流的有效性。

Takeaways, Limitations

Takeaways:
通过考虑低维和高维特征的多流架构提高手术工具和解剖结构分割的准确性。
在 EndoVis18 和 EndoVis17 数据集上取得优于最先进水平的结果。
在各种解剖结构和手术器械上具有一致的性能。
Limitations:
需要进一步研究来确定所提模型的泛化性能。跨不同手术类型和环境的测试结果有限。
可能对特定数据集过度拟合。泛化性能需要在其他数据集上进行评估。
缺乏对 LLFP 和 HLFP 流的最佳参数调整的详细解释。
👍