Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis

Created by
  • Haebom

저자

Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen

개요

본 논문은 전통 중의학(TCM)의 현대화와 접근성 향상을 위해 대규모 언어 모델(LLM) 기반 시스템인 OpenTCM을 개발한 연구 결과를 제시합니다. OpenTCM은 중의학 전문 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG)을 결합하여 고품질의 정보 검색 및 진단 질문 응답 기능을 제공합니다. 68권의 부인과 관련 고전 의학 서적에서 373만 개 이상의 고전 중국어 문자를 추출하고, 48,000개 이상의 엔티티와 152,000개 이상의 관계로 구성된 다중 관계 지식 그래프를 구축했습니다. DeepSeek 및 Kimi와 같은 중국어 중심의 LLM을 사용하여 높은 정확도의 의미 이해를 보장하였으며, 모델 미세 조정 없이 GraphRAG를 통해 고품질의 성분 정보 검색 및 진단 질문 응답이 가능하도록 했습니다. 실험 결과, OpenTCM은 성분 정보 검색에서 4.378, 진단 질문 응답에서 4.045의 평균 전문가 점수(MES)를 달성하여 기존 최첨단 솔루션을 능가하는 성능을 보였습니다.

시사점, 한계점

시사점:
LLM과 지식 그래프를 결합하여 TCM 정보 검색 및 진단 지원 시스템 개발의 새로운 가능성 제시.
고전 중국어 문헌 분석 및 TCM 개념 간의 복잡한 의미 관계 모델링에 대한 효과적인 해결책 제시.
모델 미세 조정 없이 GraphRAG를 활용하여 높은 정확도와 효율성을 달성.
실제 TCM 사용 사례에서 기존 최첨단 시스템보다 우수한 성능 입증.
한계점:
사용된 데이터셋이 부인과 관련 서적에 국한되어, 다른 TCM 분야로의 일반화 가능성에 대한 추가 연구 필요.
LLM 및 지식 그래프의 구축에 사용된 중국어 중심 모델의 언어적 편향 가능성 고려.
전문가 평가 점수에 대한 객관성 및 신뢰도에 대한 추가 검증 필요.
시스템의 확장성 및 유지보수에 대한 추가적인 연구가 필요.
👍