본 논문은 대규모 언어 모델(LLM)을 이용한 류마티스 관절염(RA) 진단의 가능성과 한계를 실제 환자 데이터를 기반으로 연구한 결과를 제시합니다. LLM은 약 95%의 정확도로 RA를 예측했지만, 의료 전문가의 평가 결과 그 이유 설명의 약 68%가 잘못된 것으로 나타났습니다. 이는 LLM의 높은 예측 정확도에도 불구하고, 그 추론 과정에 오류가 존재함을 보여주는 것으로, 의료 현장에서 LLM의 설명에 의존하는 것에 대한 중요한 의문을 제기합니다. LLM이 정확한 답을 도출하는 과정에서 잘못된 추론을 사용하는 패턴을 발견하였습니다.
시사점, 한계점
•
시사점:
◦
LLM이 RA와 같은 질병의 조기 진단에 높은 정확도를 보임을 확인했습니다.
◦
의료 전문가의 부족과 장기간의 진료 과정으로 인한 어려움을 LLM을 통해 해결할 가능성을 제시합니다.