OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis
Created by
Haebom
Category
Empty
저자
Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen
개요
본 논문은 전통 중의학(TCM)의 현대화 및 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발한 연구에 대한 것이다. OpenTCM은 전문가의 도움을 받아 68권의 부인과 관련 고전 의서에서 373만 개 이상의 한자를 추출하고, 이를 바탕으로 48,000개 이상의 개체와 152,000개 이상의 관계를 포함하는 다중 관계 지식 그래프를 구축한다. DeepSeek 및 Kimi와 같은 중국어 중심의 LLM과 맞춤형 프롬프트를 사용하여 높은 정확도의 의미 이해를 확보하고, GraphRAG(Graph-based Retrieval-Augmented Generation)와 결합하여 약재 정보 검색 및 진단 질문 응답 기능을 제공한다. 실험 결과, OpenTCM은 약재 정보 검색 및 진단 질문 응답에서 높은 정확도(각각 평균 전문가 점수 4.5 및 3.8)를 달성하여 기존 최첨단 솔루션을 능가하는 성능을 보였다.
시사점, 한계점
•
시사점:
◦
LLM과 지식 그래프를 결합하여 TCM 정보 접근성을 향상시킨 성공적인 사례 제시.
◦
고전 한문 해석 및 복잡한 TCM 개념 간의 의미 관계 모델링 문제에 대한 효과적인 해결책 제시.
◦
높은 정확도의 지식 그래프 구축 및 실제 TCM 활용 사례에서 우수한 성능을 검증.
◦
중국어 중심의 LLM과 맞춤형 프롬프트 디자인의 중요성을 강조.
•
한계점:
◦
현재는 부인과 관련 TCM 문헌에 국한된 연구임. 다른 TCM 분야로의 확장성 검토 필요.
◦
전문가의 개입이 필요한 부분이 존재하여, 완전한 자동화에는 한계가 있음.
◦
사용된 LLM 및 지식 그래프의 특성상 중국어 문헌에 대한 의존도가 높음. 다른 언어로의 확장성에 대한 고려 필요.