본 논문은 대규모 언어 모델(LLM)에서 다중 속성에 따른 차별(교차적 편향)을 효과적으로 탐지하기 위한 새로운 테스트 기법인 HInter를 제안한다. HInter는 변이 분석, 의존성 구문 분석, 변형 오라클을 결합하여 다중 속성을 가진 문장을 체계적으로 변형하고, 의존성 불변식을 통해 유효한 입력을 검증하며, 원본 및 변형된 문장에 대한 LLM 응답을 비교하여 편향을 탐지한다. GPT-3.5, Llama 2, BERT 등 6가지 아키텍처의 18개 LLM 모델을 대상으로 HInter를 평가한 결과, 14.61%의 입력에서 교차적 편향이 드러났으며, 의존성 불변식을 통해 오탐률을 획기적으로 줄였다. 또한, 교차적 편향 오류 중 16.62%는 개별 속성만으로는 편향이 드러나지 않는 숨겨진 형태임을 확인하였다. 이 연구는 LLM의 교차적 편향 테스트의 중요성을 강조한다.