Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model

Created by
  • Haebom

作者

Mehrdad Ghassabi, Pedram Rostami, Hamidreza Baradaran Kashani, Amirhossein Poursina, Zahra Kazemi, Milad Tavakoli

概要

ペルシャ語のような低資源言語の専門分野におけるコンパクトな言語モデルの限界を克服するために、本研究では、20,000人の医師と患者の質疑応答のペアと、医療雑誌でクロールされた9000万トークン規模のコーパスからなる新しいデータセットを紹介します。このデータセットを使用して、パラメータを効率的に微調整することで、ベースラインモデルであるaya-expanse-8bの医療知識を向上させました。

Takeaways、Limitations

小型言語モデルのペルシャ医療分野の適用可能性を実証
オープンアクセスオンラインデータを活用したリソース制約環境における医療AIソリューションの提示
微調整されたモデルは、医療質問の回答精度を向上させ、IBSEEを通過。
ペルシャ語に翻訳されたMMLU精度は平均2.67%向上しました。
今後の研究は、マルチモーダル入力によるパフォーマンスの向上を探求する可能性があります。
👍