본 논문은 비구조화된 임상 기록에서 정보를 추출하기 위해 gte-large 문장 변환기를 기반으로 한 새로운 문맥적 임베딩 모델인 med-gte-hybrid를 제시합니다. med-gte-hybrid는 대조 학습과 잡음 제거 오토인코더를 결합한 모델 조정 전략을 사용합니다. MIMIC-IV 데이터셋에서 추출한 대규모 환자 코호트를 이용하여 만성 신장 질환(CKD) 환자 예후, 사구체 여과율(eGFR) 예측, 환자 사망률 예측 등 여러 임상 예측 과제에서 med-gte-hybrid의 성능을 평가했습니다. 또한 med-gte-hybrid 모델이 환자 계층화, 군집화 및 텍스트 검색을 개선하여 대규모 텍스트 임베딩 벤치마크(MTEB)에서 최첨단 모델보다 우수한 성능을 보임을 보여줍니다. CKD에 중점을 둔 평가도 있지만, 문장 변환기의 하이브리드 조정은 다른 의료 분야에도 적용될 수 있으며 다양한 의료 응용 분야에서 임상 의사 결정 및 개인화된 치료 경로 개선에 기여할 가능성이 있습니다.