본 논문은 은행권의 브랜드 평판 관리를 위해 코드 혼합 및 다국어 고객 의견 분석에 초점을 맞춘 하이브리드 NLP 방법론을 제시합니다. 기존 NLP 모델이 저자원 언어(싱할라어-영어)가 혼합된 코드 혼합 텍스트를 잘못 분류하거나 무시하고, 도메인 특징 지식을 제대로 포착하지 못하는 문제를 해결하기 위해, SpaCy NER, FinBERT 기반 KeyBERT, YAKE, EmbedRank를 결합한 하이브리드 키워드 추출 방법(영어, 정확도 91.2%)과 도메인 특화 싱할라어 금융 어휘를 통합한 미세 조정된 XLM-RoBERTa 모델(싱할라어, 정확도 87.4%)을 제시합니다. 또한 BERT-base-uncased 및 XLM-RoBERTa 모델을 이용한 콘텐츠 필터링(각각 85.2%, 88.1%) 및 측면 분류(각각 87.4%, 85.9%)를 수행하여 GPT-4, SVM, 키워드 기반 방법보다 우수한 성능을 보임을 확인했습니다. 이를 통해 미세 조정된 트랜스포머 모델이 다국어 금융 텍스트 분석에서 기존 방법보다 우수함을 보여주며, 코드 혼합 및 저자원 은행 환경에서 브랜드 평판 모니터링을 위한 정확하고 확장 가능한 솔루션을 제공합니다.