본 논문은 금융 분야의 특수성을 반영하지 못하는 일반적인 문장 임베딩 모델의 한계를 극복하기 위해, 한국어를 포함한 저자원 언어 환경에서의 금융 특화 임베딩 모델인 NMIXX를 제안합니다. NMIXX는 도메인 특화된 용어, 시간적 의미 변화, 그리고 상이한 이중 언어 어휘 문제를 해결하기 위해, 18.8K개의 고신뢰 삼중항(패러프레이즈, 의미 변화 유형에서 파생된 어려운 부정 예시, 정확한 한국어-영어 번역)으로 미세 조정되었습니다. 또한, 뉴스, 공시, 연구 보고서, 규정을 포함하는 1,921쌍의 한국어 금융 STS 벤치마크인 KorFinSTS를 공개하여 일반적인 벤치마크가 놓치는 미묘한 차이를 파악할 수 있도록 했습니다.