Context Clues: Evaluating Long Context Models for Clinical Prediction Tasks on EHRs
Created by
Haebom
Category
Empty
저자
Michael Wornow, Suhana Bedi, Miguel Angel Fuentes Hernandez, Ethan Steinberg, Jason Alan Fries, Christopher Re, Sanmi Koyejo, Nigam H. Shah
개요
본 논문은 전자 건강 기록(EHR)을 기반으로 훈련된 기초 모델(FM)의 제한된 컨텍스트 창 크기 문제를 해결하기 위해, 서브쿼드라틱 롱 컨텍스트 아키텍처(Mamba)를 활용하여 EHR 데이터 모델링에서 컨텍스트 길이 효과를 체계적으로 평가한 연구 결과를 제시합니다. 14개의 EHRSHOT 예측 벤치마크 과제 중 9개에서 기존 최고 성능을 능가하는 결과를 보였으며, EHR 데이터의 고유한 특성(복사 전달 진단, 불규칙적인 시간 간격, 질병 복잡성 증가)에 대한 모델의 강건성을 평가하여 긴 컨텍스트 모델이 더 강건함을 확인했습니다. 이는 긴 컨텍스트 아키텍처를 EHR 데이터 모델링에 활용할 가능성을 보여주며, 자연어 처리 이외의 영역에서 순차 데이터 모델링의 새로운 과제를 제시하는 사례 연구입니다. 모델과 코드는 공개되었습니다 (https://github.com/som-shahlab/long_context_clues).