본 논문은 복잡하고 이질적인 현실 세계 데이터셋에서 발생하는 입력 표현 설계의 병목 현상을 해결하기 위해 LLM(대규모 언어 모델)을 활용하는 새로운 에이전트 기반 파이프라인을 제안합니다. LLM이 소수의 샘플을 분석하여 데이터 추출 및 구성을 위한 '글로벌 루브릭'을 생성하고, 이를 통해 입력 데이터를 표준화된 형식으로 변환하여 다운스트림 모델의 성능을 향상시킵니다. 제안된 루브릭 기반 접근 방식은 15가지 임상 과제에서 기존 방법론 및 임상 기반 모델보다 우수한 성능을 보였습니다.