본 논문은 대규모 언어 모델(LLM)의 우수한 일반화 및 전이 능력을 활용하여 데이터 부족 및 이질적인 의료 영역, 특히 근감소증 진단과 같은 과제에 적용하는 방법을 제시합니다. 기존 기계 학습(TML) 모델의 안정적인 성능과 특징 수준의 설명 가능성을 LLM의 의미론적 표현 능력과 결합하여 해석 가능성과 예측 성능 간의 절충을 해결하고자 합니다. 구체적으로, XGBoost 모델의 SHAP 값을 LLM에 입력하여 강화 학습 기반의 추론 과정을 거쳐 보정된 근거와 개선된 의사결정 규칙을 생성하고, 이를 지식 저장소에 통합하여 RAG(Retrieval-Augmented Generation) 방식으로 사례 기반 추론을 수행하는 CANDLE 프레임워크를 제안합니다.
시사점, 한계점
•
시사점:
◦
LLM의 해석력 한계를 SHAP 기반의 설명 가능한 기계 학습 모델과 결합하여 극복함으로써, 의료 분야에서의 LLM 활용 가능성을 높였습니다.
◦
근감소증 진단을 사례 연구로 활용하여, 데이터 부족 및 이질적인 의료 데이터 환경에서의 LLM 적용 가능성을 보여주었습니다.
◦
강화 학습을 통해 LLM의 추론 과정을 개선하고, 신뢰할 수 있는 의사결정 규칙을 생성하는 방법을 제시했습니다.
◦
기존 TML 모델의 지식을 LLM 기반 시스템에 통합하는 새로운 접근 방식을 제안하여 지식 자산화를 가능하게 합니다.
◦
RAG를 활용하여 사례 기반 추론을 수행함으로써, 실제 의료 현장에 적용 가능한 시스템을 구축할 수 있는 가능성을 보여주었습니다.
•
한계점:
◦
본 논문에서는 근감소증 진단에 초점을 맞추었으므로, 다른 의료 분야로의 일반화 가능성에 대한 추가 연구가 필요합니다.