본 논문은 수의학 임상 연구를 위한 대규모 데이터 자원인 수의학 의료 기록의 상호 운용성 문제를 해결하기 위해 표준화된 의학 용어를 사용한 임상 코딩의 중요성을 강조합니다. 기존의 DeepTag 및 VetTag 연구에서 LSTM 및 Transformer 모델을 이용하여 수의학 진단 코딩 자동화를 시도한 것에 비해, 본 연구는 콜로라도 주립대학교 수의학 교육병원(CSU VTH)에서 인식하는 7,739개의 SNOMED-CT 진단 코드를 모두 포함하고, 사전 훈련된 언어 모델(LM)을 활용하여 CSU VTH의 전자 건강 기록(EHR)에 있는 246,473건의 수동 코딩된 수의학 환자 방문 기록을 사용하여 13개의 무료 사전 훈련된 LM을 미세 조정했습니다. 그 결과, 기존 연구보다 우수한 성능을 달성했으며, 방대한 라벨링 데이터를 사용하여 상대적으로 큰 임상 LM을 미세 조정했을 때 가장 정확한 결과를 얻었습니다. 하지만 제한된 자원과 비임상 LM을 사용하더라도 비슷한 결과를 얻을 수 있음을 보여주었습니다. 이 연구 결과는 자동 코딩을 위한 접근 가능한 방법을 조사함으로써 수의학 EHR의 질 향상에 기여하며, 종과 기관을 아우르는 통합적이고 포괄적인 건강 데이터베이스를 구축하여 동물과 인간의 건강 연구 모두를 지원합니다.