Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

OpenTCM : un système LLM basé sur GraphRAG pour la recherche et le diagnostic des connaissances en médecine traditionnelle chinoise

Created by
  • Haebom

Auteur

Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen

Contour

Cet article présente les résultats de recherche du développement d'OpenTCM, un système basé sur un modèle de langage à grande échelle (MLH) visant à moderniser et à améliorer l'accessibilité de la médecine traditionnelle chinoise (MTC). OpenTCM permet une recherche d'informations de haute qualité et des réponses aux questions diagnostiques en combinant un graphe de connaissances expert en MTC et une génération de recherche augmentée basée sur un graphe (GraphRAG). Nous avons extrait plus de 3,73 millions de caractères chinois classiques de 68 ouvrages de médecine gynécologique classiques et construit un graphe de connaissances multirelationnel composé de plus de 48 000 entités et 152 000 relations. Grâce à des LLM centrés sur le chinois tels que DeepSeek et Kimi, nous avons assuré une compréhension sémantique de haute précision et permis une recherche d'informations sur les ingrédients et des réponses aux questions diagnostiques de haute qualité via GraphRAG, sans ajustement du modèle. Les résultats expérimentaux montrent qu'OpenTCM obtient un score expert moyen (MES) de 4,378 pour la recherche d'informations sur les ingrédients et de 4,045 pour la réponse aux questions de diagnostic, surpassant ainsi les solutions de pointe existantes.

Takeaways, Limitations

Takeaways:
Combinaison du LLM et du graphe de connaissances pour présenter de nouvelles possibilités de développement d'un système de recherche d'informations et d'aide au diagnostic en MTC.
Fournir une solution efficace pour analyser la littérature chinoise classique et modéliser les relations sémantiques complexes entre les concepts de la MTC.
Obtenez une précision et une efficacité élevées avec GraphRAG sans réglage fin du modèle.
A démontré des performances supérieures par rapport aux systèmes de pointe existants dans des cas d'utilisation TCM réels.
Limitations:
ÉTant donné que l’ensemble de données utilisé était limité aux livres liés à la gynécologie, des recherches supplémentaires sont nécessaires sur la généralisabilité à d’autres domaines de la MTC.
Considérant le biais linguistique possible des modèles centrés sur la Chine utilisés pour construire des LLM et des graphes de connaissances.
Une validation plus poussée de l’objectivité et de la fiabilité des scores d’évaluation des experts est nécessaire.
Des recherches supplémentaires sont nécessaires sur l’évolutivité et la maintenabilité du système.
👍