본 논문은 문장 수준 번역을 위한 대규모 데이터셋 부족으로 인해 저자원 NLP 과제인 벵골 수화(BdSL) 번역의 어려움을 해결하고자 한다. 이를 위해, 저자들은 1,000개의 수동 주석이 달린 문장-글로스 쌍으로 구성된 새로운 병렬 데이터셋인 Bangla-SGP를 소개한다. 이 데이터셋은 구문 및 형태 규칙을 사용하여 규칙 기반 검색-증강 생성(RAG) 파이프라인을 통해 약 3,000개의 합성 쌍으로 보강되었다. 글로스는 벵골어 수화를 지원하는 단어이며 연속적인 수화를 위한 중간 표현 역할을 한다. 또한, mBart50, Google mT5, GPT4.1-nano와 같은 변환기 기반 모델을 미세 조정하고 BLEU 점수를 사용하여 문장-글로스 번역 성능을 평가했다. 마지막으로, 평가 지표를 기반으로 데이터셋 및 RWTH-PHOENIX-2014T 벤치마크 간의 모델의 글로스 번역 일관성을 비교했다.