Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Fine-tuning foundational models to code diagnoses from veterinary health records

Created by
  • Haebom

作者

Mayla R. Boguslav, Adam Kiehl, David Kott, G. Joseph Strecker, Tracy Webb, Nadia Saklou, Terri Ward, Michael Kirby

概要

本論文は、獣医学臨床研究のための大規模なデータリソースである獣医医療記録の相互運用性の問題を解決するために、標準化された医学用語を使用した臨床コーディングの重要性を強調しています。従来のDeepTagおよびVetTag研究でLSTMおよびTransformerモデルを用いて獣医診断コーディングの自動化を試みたのに比べて、本研究はコロラド州立大学獣医教育病院(CSU VTH)が認識する7,739個のSNOMED-CT診断コードの両方を含み、事前訓練された言語モデル(LME)の活用246,473の手動コード化獣医患者訪問記録を使用して、13の無料の事前訓練されたLMを微調整しました。その結果、従来の研究よりも優れた性能を達成し、膨大なラベリングデータを使用して比較的大きな臨床LMを微調整した場合、最も正確な結果が得られた。しかし、限られたリソースと非臨床LMを使用しても同様の結果が得られることを示しました。この研究は、自動コーディングのためのアクセス可能な方法を調査することによって獣医学EHRの質の向上に貢献し、種と臓器を包含する統合的かつ包括的な健康データベースを構築し、動物と人間の健康研究の両方を支援します。

Takeaways、Limitations

Takeaways:
事前に訓練された言語モデルを利用して、獣医診断コーディングの自動化の精度を向上させることができることを示しています。
膨大なデータセットと大規模臨床LMを使用すると、最高のパフォーマンスが得られますが、限られたリソースと非臨床LMでも同様のパフォーマンスを達成できることを示唆しています。
獣医EHRの質の向上と種間、臓器間の統合的な健康データベースの構築に貢献
動物と人間の健康研究に利用可能なデータ基盤の確保に貢献
Limitations:
本研究はCSU VTHのデータに限定されており、一般化の可能性に関するさらなる研究が必要である。
使用されるLMの種類とサイズに応じた性能差のより深い分析が必要です。
他の獣医機関および種に対する適用可能性および一般化可能性に関するさらなる研究が必要である。
実際の臨床環境での適用と保守に関する追加の研究が必要です。
👍