Trong bài báo này, chúng tôi trình bày một bộ dữ liệu mới, Bộ Kiểm tra Tương tự Tiếng Hindi (HATS), để đánh giá hiệu suất tương tự trong tiếng Hindi. HATS bao gồm 405 câu hỏi trắc nghiệm được lấy từ các kỳ thi của chính phủ Ấn Độ và được sử dụng để đánh giá hiệu suất tương tự của nhiều mô hình ngôn ngữ khác nhau. Trong bài báo này, chúng tôi đánh giá các chương trình Thạc sĩ Luật (LLM) đa ngôn ngữ hiện đại bằng cách sử dụng các chiến lược gợi ý khác nhau và phương pháp Chuỗi Tư duy (Chain of Thought) dựa trên lý thuyết nhận thức, đồng thời đề xuất một phương pháp để cải thiện hiệu suất mô hình trên các bài toán tương tự tiếng Hindi. Kết quả thực nghiệm cho thấy hiệu suất mô hình tốt nhất khi sử dụng gợi ý tiếng Anh, bất kể chiến lược gợi ý nào. Nghiên cứu này đề cập đến việc thiếu hụt nghiêm trọng các nguồn lực để đánh giá hiệu suất lập luận của chương trình Thạc sĩ Luật (LLM) bằng tiếng Hindi.