본 논문은 대규모 AI 모델의 효율적인 최적화 기법을 제시합니다. 생물의학 비전문가 어휘와 UMLS Metathesaurus 간의 코사인 기반 의미 유사성을 활용하여, 최첨단 Transformer 기반 모델을 이용한 온톨로지 정합 방법을 제시합니다. Microsoft Olive, ONNX Runtime, Intel Neural Compressor, IPEX를 활용하여 모델 최적화를 진행하고, DEFT 2020 평가 캠페인의 두 가지 과제에 대한 실험을 통해 평균 20배의 추론 속도 향상과 약 70%의 메모리 사용량 감소를 달성하며 새로운 최고 성능을 기록했습니다. 성능 지표는 유지하면서 효율성을 크게 향상시켰다는 점이 주요 특징입니다.