Sign In

Count-Based Approaches Remain Strong: A Benchmark Against Transformer and LLM Pipelines on Structured EHR

Created by
  • Haebom
Category
Empty

저자

Jifan Gao, Michael Rosenthal, Brian Wolpin, Simona Cristea

개요

본 연구는 구조화된 전자 건강 기록(EHR) 예측을 위해 세 가지 방법론을 평가했습니다. 여기에는 온톨로지 롤업을 기반으로 하는 count-based 모델(LightGBM, TabPFN), 사전 훈련된 순차적 변환기(CLMBR), 그리고 테이블 형식 기록을 자연어 요약으로 변환한 후 텍스트 분류기를 사용하는 mixture-of-agents 파이프라인이 포함되었습니다. EHRSHOT 데이터셋을 사용하여 8가지 결과를 평가했으며, count-based 모델과 mixture-of-agents 방식이 엇비슷한 성능을 보였습니다.

시사점, 한계점

count-based 모델은 단순성과 해석 가능성을 고려할 때, 구조화된 EHR 벤치마킹에서 강력한 후보로 남았습니다.
mixture-of-agents 방식은 텍스트 분류를 통해 EHR 예측을 시도하는 새로운 접근 방식을 제시했습니다.
본 연구는 세 가지 방법론의 성능을 비교 분석하여 각 접근 방식의 장단점을 파악했습니다.
연구는 EHRSHOT 데이터셋에 국한되어, 다른 데이터셋에서의 일반화 가능성을 추가적으로 검증해야 합니다.
mixture-of-agents 파이프라인의 구체적인 설계 및 성능에 대한 추가적인 분석이 필요합니다.
👍