每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

揭示疾病之间的相互联系:从统计方法到大型语言模型

Created by
  • Haebom

作者

Alina Ermilova、Dmitrii Kornilov、Sofia Samoilova、Ekaterina Laptenkova、Anastasia Kolesnikova、Ekaterina Podplutova、Senotrusova Sofya、Maksim G. Sharaev

大纲

尽管通过人工分析大规模临床数据识别疾病关联存在挑战,且机器学习 (ML) 潜力巨大,但诸如选择最佳方法、确定数据源以及缺乏“基本事实”等挑战依然存在。本研究系统地评估了基于两种数据源(来自 MIMIC-IV EHR 的 ICD-10 代码序列和完整的 ICD-10 代码)的七种疾病关联识别方法。评估包括统计共现分析、掩码语言模型 (MLM)、BERT 的领域特定变体、通用 BERT、文档检索和四种 LLM。基于图谱对所得关联矩阵的比较表明,基于 LLM 的方法比其他方法(基于文本和基于领域)的 ICD 代码连接多样性更低,这表明使用 LLM 发现新型关联存在局限性。研究结果提供了一个有价值的疾病本体,可为未来临床研究和医疗保健领域的 AI 应用奠定基础。

Takeaways, Limitations

Takeaways:
与其他方法相比,基于 LLM 的方法具有较低的疾病特异性链接多样性,限制了它们发现新关联的能力。
该研究成果可以作为医学疾病本体,为未来的临床研究和人工智能应用做出贡献。
Limitations:
法学硕士发现新疾病关联的能力可能有限。
ICD 代码之间没有医疗互连的“基本事实”数据库。
👍