본 논문은 의료 분야에서 사용되는 기초 모델(예: GPT, CLIP)의 추론 속도 저하 및 과도한 추론 문제를 해결하기 위해 새로운 하이브리드 전략인 EPEE(Entropy- and Patience-based Early Exiting)를 제안합니다. EPEE는 엔트로피 기반 및 patience 기반 조기 종료 방법의 장점을 결합하여 각 방법의 단점을 극복합니다. BERT, ALBERT, GPT-2, ViT 등 네 가지 기초 모델과 12개의 의료 데이터셋(진료 기록 및 의료 이미지 포함)을 사용하여 분류, 관계 추출, 사건 추출 등 세 가지 의료 과제에 대한 실험을 통해 EPEE가 추론 시간을 단축하면서 정확도를 유지하거나 향상시킨다는 것을 확인했습니다. 이는 다양한 데이터셋과 과제에 대한 EPEE의 적응성을 보여주며, 의료 분야에서 기초 모델의 실시간 적용을 위한 실질적인 해결책을 제공합니다.