Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

OpenTCM: un sistema LLM basado en GraphRAG para la recuperación y el diagnóstico de conocimientos de medicina tradicional china

Created by
  • Haebom

Autor

Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen

Describir

Este artículo presenta los resultados de la investigación del desarrollo de OpenTCM, un sistema basado en modelos de lenguaje a gran escala (LLM) para modernizar y mejorar la accesibilidad de la medicina tradicional china (MTC). OpenTCM proporciona recuperación de información de alta calidad y respuesta a preguntas diagnósticas mediante la combinación de gráficos de conocimiento experto en MTC y la generación de búsqueda aumentada basada en grafos (GraphRAG). Extrajimos más de 3,73 millones de caracteres chinos clásicos de 68 libros de medicina ginecológica clásica y construimos un grafo de conocimiento multirrelacional compuesto por más de 48.000 entidades y 152.000 relaciones. Utilizando LLM centrados en el chino, como DeepSeek y Kimi, garantizamos una comprensión semántica de alta precisión y permitimos la recuperación de información sobre ingredientes y la respuesta a preguntas diagnósticas de alta calidad mediante GraphRAG sin necesidad de ajustar el modelo. Los resultados experimentales muestran que OpenTCM alcanza una puntuación experta promedio (MES) de 4,378 para la recuperación de información de ingredientes y 4,045 para la respuesta a preguntas de diagnóstico, superando a las soluciones de última generación existentes.

Takeaways, Limitations

Takeaways:
Combinando LLM y gráficos de conocimiento para presentar nuevas posibilidades para el desarrollo de un sistema de recuperación de información y soporte de diagnóstico de la medicina tradicional china.
Proporcionar una solución eficaz para analizar la literatura clásica china y modelar relaciones semánticas complejas entre los conceptos de la medicina tradicional china.
Consiga alta precisión y eficiencia con GraphRAG sin necesidad de ajustar el modelo.
Se demostró un rendimiento superior al de los sistemas de última generación existentes en casos de uso de TCM del mundo real.
Limitations:
Dado que el conjunto de datos utilizado se limitó a libros relacionados con la ginecología, se necesita más investigación sobre la generalización a otros campos de la medicina tradicional china.
Considerando el posible sesgo lingüístico de los modelos centrados en el chino utilizados para construir LLM y gráficos de conocimiento.
Es necesaria una mayor validación de la objetividad y confiabilidad de las puntuaciones de la evaluación de los expertos.
Se necesita más investigación sobre la escalabilidad y mantenibilidad del sistema.
👍