통신 산업의 전문 용어와 미묘한 개념은 기존의 자연어 처리(NLP) 모델에 지속적인 어려움을 제기합니다. 본 논문은 통신 특정 의미론을 효과적으로 표현하기 위해 gte-Qwen2-1.5B-instruct 백본을 기반으로 구축된 도메인 적응 임베딩 모델 T-VEC(Telecom Vectorization Model)을 제시합니다. T-VEC는 대규모 통신 관련 데이터셋 T-Embed를 사용하여 삼중항 손실을 통해 미세 조정되었습니다. T-VEC는 IETF RFC 및 공급업체 매뉴얼의 1500개 질의-지문 쌍으로 구성된 사용자 지정 벤치마크에서 MPNet, BGE, Jina 및 E5를 능가하며, 통신 특정 검색에서 우수한 도메인 근거와 의미적 정밀도를 입증합니다. T-VEC 및 토크나이저를 공개하여 통신 도메인 내에서 의미적으로 충실한 NLP 애플리케이션을 지원합니다.