Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Revealing Interconnections between Diseases: from Statistical Methods to Large Language Models

Created by
  • Haebom

저자

Alina Ermilova, Dmitrii Kornilov, Sofia Samoilova, Ekaterina Laptenkova, Anastasia Kolesnikova, Ekaterina Podplutova, Senotrusova Sofya, Maksim G. Sharaev

개요

대규모 임상 데이터의 수동 분석을 통한 질병 상호 연결 식별의 어려움과 머신러닝(ML)의 잠재력에도 불구하고, 최적의 방법 선택, 데이터 소스 결정, 'ground truth' 부족 등의 과제를 제시합니다. 이 연구는 질병 관계를 파악하기 위해 두 가지 데이터 소스(MIMIC-IV EHR의 ICD-10 코드 시퀀스 및 ICD-10 코드 전체)를 기반으로 7가지 접근 방식을 체계적으로 평가합니다. 평가에는 통계적 동시 발생 분석, 마스크 언어 모델링(MLM), 도메인 특화 BERT 변형, 일반 목적 BERT, 문서 검색, 그리고 4개의 LLM이 포함됩니다. 얻어진 상호 연결 행렬의 그래프 기반 비교 결과, LLM 기반 접근 방식이 다른 방법(텍스트 기반, 도메인 기반)보다 낮은 ICD 코드 연결 다양성을 보이며, LLM의 새로운 상호 연결 발견의 제한점을 시사합니다. 연구 결과는 향후 임상 연구 및 의료 분야의 인공 지능 응용을 위한 기초 자료로 활용될 수 있는 가치 있는 질병 온톨로지를 제공합니다.

시사점, 한계점

시사점:
LLM 기반 접근 방식은 다른 방법에 비해 질병 간 연결 다양성이 낮아 새로운 연결 발견에 한계가 있음.
연구 결과는 의료 질병 온톨로지로서 향후 임상 연구 및 AI 응용에 기여할 수 있음.
한계점:
LLM이 새로운 질병 연결을 발견하는 데 제한적일 수 있음.
ICD 코드 간의 의료적 상호 연결에 대한 'ground truth' 데이터베이스가 부재함.
👍