Explainable AI for Classifying UTI Risk Groups Using a Real-World Linked EHR and Pathology Lab Dataset
Created by
Haebom
Category
Empty
저자
Yujie Dai, Brian Sullivan, Axel Montout, Amy Dillon, Chris Waller, Peter Acs, Rachel Denholm, Philip Williams, Alastair D Hay, Raul Santos-Rodriguez, Andrew Dowsey
개요
본 논문은 영국 Bristol, North Somerset, South Gloucestershire 지역의 약 백만 명의 비식별화된 개인에 대한 연계된 EHR 데이터셋을 활용하여 요로감염(UTI)을 특성화하는 연구이다. 원시 EHR 데이터를 예측 모델 개발에 적합한 구조적 형식으로 변환하는 데이터 전처리 및 큐레이션 파이프라인을 구현하였다. UTI 결과의 제한된 가용성과 편향성을 고려하여 임상 전문 지식을 바탕으로 UTI 위험 추정 프레임워크를 도입하여 개별 환자의 시간 경과에 따른 UTI 위험을 추정하였다. 이 프레임워크를 사용하여 쌍대 XGBoost 모델을 훈련시켰고, 설명 가능한 AI 기법을 적용하여 주요 예측 변수를 식별하고 해석력을 높였다. 연구 결과, 위험 그룹 간 임상 및 인구 통계적 예측 변수의 차이를 밝혔다. AI 기반 통찰력이 UTI 임상 의사 결정을 지원할 수 있는 잠재력을 보여주지만, 강건성과 임상 적용을 위해서는 환자 하위 집단에 대한 추가 조사와 광범위한 검증이 필요하다.