Sign In

ACES: Automatic Cohort Extraction System for Event-Stream Datasets

Created by
  • Haebom
Category
Empty

저자

Justin Xu, Jack Gallifant, Alistair E. W. Johnson, Matthew B. A. McDermott

개요

본 논문은 의료 분야 머신러닝(ML)에서의 재현성 문제를 해결하기 위해 자동 코호트 추출 시스템(ACES)을 제시한다. ACES는 의료 이벤트 스트림 데이터를 사용하여 ML 과제 및 코호트 개발을 단순화하고, 단일 데이터셋에 대한 정확한 재현과 데이터셋 간의 개념적 재현을 모두 가능하게 한다. 도메인 특화 구성 언어를 통해 데이터셋 특정 개념 및 데이터셋 비의존적 포함/제외 기준을 정의하고, 이 기준을 충족하는 환자 기록을 실제 데이터에서 자동으로 추출하는 파이프라인을 제공한다. Medical Event Data Standard (MEDS) 또는 Event Stream GPT (ESGPT) 형식의 데이터셋, 또는 이벤트 스트림 형태로 필요한 과제 특정 술어를 추출할 수 있는 모든 데이터셋에 적용 가능하며, 의료 ML 연구의 재현성을 크게 향상시킬 수 있는 잠재력을 지닌다. GitHub에서 공개되어 있다(https://github.com/justin13601/aces).

시사점, 한계점

시사점:
의료 분야 머신러닝 연구의 재현성 문제 해결에 기여.
의료 데이터셋을 이용한 ML 과제 정의 및 코호트 개발의 진입 장벽을 낮춤.
연구자들의 의료 데이터셋 활용 방식 변화를 유도.
MEDS 또는 ESGPT 형식 외 다른 형태의 데이터셋에도 적용 가능성 제시.
한계점:
특정 과제에 필요한 술어를 이벤트 스트림 형태로 추출하는 과정의 어려움.
다양한 데이터 형식 및 구조에 대한 ACES의 적응성에 대한 추가적인 검증 필요.
ACES 구성 언어의 직관성 및 표현력에 대한 사용자 피드백 및 개선 필요.
👍