Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis

Created by
  • Haebom

저자

Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen

개요

본 논문은 전통 중의학(TCM)의 현대화 및 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발한 연구에 대한 것이다. OpenTCM은 중의학 전문 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG)을 결합하여 고품질의 정보 검색 및 진단 질의응답을 제공한다. 68권의 부인과 관련 고전 의서에서 373만 개 이상의 한자를 추출하고, 48,000개 이상의 개체와 152,000개 이상의 관계로 구성된 다중 관계 지식 그래프를 구축하였다. DeepSeek 및 Kimi와 같은 중국어 중심의 LLM을 사용하여 높은 정확도의 의미 이해를 보장하였으며, 모델 미세 조정 없이 성분 정보 검색 및 진단 질문 응답을 가능하게 한다. 실험 결과, OpenTCM은 성분 정보 검색에서 4.378, 진단 질문 응답에서 4.045의 평균 전문가 점수(MES)를 달성하여 기존 최고 성능을 능가하는 것으로 나타났다.

시사점, 한계점

시사점:
LLM과 지식 그래프를 결합하여 TCM 정보 접근성과 활용성을 높였다.
고전 한문 해석의 어려움을 극복하고 TCM의 복잡한 의미 관계를 모델링하는 새로운 방법을 제시하였다.
모델 미세 조정 없이 높은 성능을 달성하여 실용성을 높였다.
실제 TCM 사용 사례에서 기존 기술보다 우수한 성능을 입증하였다.
한계점:
현재는 부인과 분야의 고전 의서에 국한되어 있으며, 다른 TCM 분야로의 확장성에 대한 추가 연구가 필요하다.
사용된 LLM의 언어적 편향(중국어 중심)이 다른 언어로의 확장에 제약이 될 수 있다.
지식 그래프의 완전성과 정확성에 대한 지속적인 관리 및 업데이트가 필요하다.
MES 평가의 객관성 및 일반화 가능성에 대한 추가 검토가 필요할 수 있다.
👍