본 논문은 바나라시(Varanasi) 관광 분야를 대상으로 하는 힌디어 기반 추출형 질의응답(QA) 시스템의 설계에 대한 첫 번째 종합 연구를 제시합니다. 10개의 관광 관련 하위 도메인(Ganga Aarti, Cruise, Food Court, Public Toilet, Kund, Museum, General, Ashram, Temple, Travel)을 대상으로 하며, 문화적 특성을 반영한 힌디어 QA 자원의 부재를 해결하고자 합니다. 7,715개의 힌디어 QA 쌍으로 구성된 데이터셋을 구축하고, Llama zero-shot prompting을 통해 27,455개의 쌍을 추가했습니다. BERT 및 RoBERTa를 기반으로 하는 프레임워크를 제안하며, Supervised Fine-Tuning (SFT) 및 Low-Rank Adaptation (LoRA)을 사용하여 매개변수 효율성과 성능을 최적화합니다. 여러 BERT 변형을 평가하여 저자원 도메인별 QA에 대한 적합성을 평가하고, F1, BLEU, ROUGE-L 평가 지표를 통해 답변 정확도와 언어 유창성 간의 균형을 분석합니다. LoRA 기반 미세 조정은 SFT에 비해 98%의 학습 가능한 매개변수를 줄이면서 경쟁력 있는 성능(85.3% F1)을 달성합니다. RoBERTa는 문화적으로 내재된 용어(예: Aarti, Kund)에 대한 맥락적 미묘함을 포착하는 데 있어 BERT 변형보다 우수한 성능을 보입니다.