每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

利用语言模型赋能医疗从业者:在两个实际临床应用中构建语音记录

Created by
  • Haebom

作者

让-菲利普·科尔贝、阿斯玛·本·阿巴查、乔治·米查洛普洛斯、菲利普·斯瓦辛纳、米格尔·德尔-阿瓜、杰罗姆·特伦布莱、阿基拉·吉森·丹尼尔、卡里·巴德、赵宇成、普贾·克里希南、内森·博登斯塔布、托马斯·林、滕文轩、弗朗索瓦·博利厄、保罗·沃齐拉

大纲

虽然 GPT-4o 和 o1 等大规模语言模型 (LLM) 在各种医疗保健基准的临床自然语言处理 (NLP) 任务中展现出卓越的性能,但两项重要的 NLP 任务——从护士口述中提取结构化表格报告以及从医患问诊中提取医疗指令——由于数据稀缺和敏感性,仍未得到充分研究。本文使用私有和开源临床数据集研究这两项任务,评估开源和封闭式 LLM 的性能,并分析每种模型的优势和局限性。此外,我们提出了一种基于代理的流程,用于生成逼真且不敏感的护士口述,从而实现临床观察的结构化提取。为了支持相关研究,我们发布了 SYNUR 和 SIMORD,它们分别是用于提取护理观察结果和提取医疗指令的首个开源数据集。

Takeaways, Limitations

Takeaways:
探索法学硕士学位在护士口头报告和医疗医嘱提取方面的潜力。
提出基于代理的管道来解决两个任务。
通过发布开源数据集(SYNUR、SIMORD)支持研究。
减轻医务人员的文档负担,使他们能够专注于患者护理。
Limitations:
由于数据不足和敏感性导致的研究局限性。
依赖于特定 LLM 的性能和限制。
需要进一步研究来确定所提出的基于代理的管道对现实世界临床环境的适用性。
关于开源数据集的质量和代表性的考虑。
👍