본 논문은 트랜스포머 기반 모델의 성능과 신뢰성을 평가하기 위해, 영어 외 6개의 인도 언어에서 8가지 언어학적 속성에 대한 인코딩 능력과 견고성을 연구합니다. 이를 위해, 9개의 다국어 트랜스포머 모델을 사용하고, 약 47,000개의 문장을 포함하는 새로운 다국어 벤치마크 데이터세트 IndicSentEval을 도입합니다. 표면, 구문 및 의미 속성에 대한 프로빙 분석 결과, 영어에서는 일관된 성능을 보인 반면, 인도 언어에서는 혼합된 결과를 보였습니다. 인도 특화 모델이 인도 언어에서 더 나은 성능을 보였고, 범용 모델이 특정 변형에 대해 더 나은 견고성을 보였습니다.