Early Detection of Pancreatic Cancer Using Multimodal Learning on Electronic Health Records
Created by
Haebom
저자
Mosbah Aouad, Anirudh Choudhary, Awais Farooq, Steven Nevers, Lusine Demirkhanyan, Bhrandon Harris, Suguna Pappu, Christopher Gondi, Ravishankar Iyer
개요
본 논문은 췌장관암(PDAC)의 조기 진단을 위한 새로운 다중 모달 접근법을 제시합니다. 특히, 전자 건강 기록(EHR)에서 얻은 종단적 진단 코드 이력과 정기적으로 수집된 실험실 측정값을 통합하여 임상 진단 최대 1년 전에 PDAC를 감지하는 방법을 제안합니다. 비정규 실험실 시계열을 모델링하기 위해 신경 제어 미분 방정식을, 진단 코드 궤적 표현을 학습하기 위해 사전 훈련된 언어 모델과 순환 신경망을, 그리고 두 모달리티 간의 상호 작용을 포착하기 위해 교차 어텐션 메커니즘을 결합합니다. 약 4,700명의 환자에 대한 실제 데이터 세트에서 접근 방식을 개발 및 평가하여 최첨단 방법보다 AUC에서 6.5%~15.5%의 상당한 개선을 달성했습니다. 또한, 기존 바이오마커와 새로운 바이오마커를 포함하여 PDAC 위험이 높은 진단 코드와 실험실 패널을 식별합니다. 소스 코드는 https://github.com/MosbahAouad/EarlyPDAC-MML 에서 확인 가능합니다.