본 논문은 개념 병목 모델(CBM)의 해석 가능성을 유지하면서도 훈련에 사용되는 주석의 노이즈 문제를 체계적으로 연구한 최초의 연구입니다. 연구 결과, 중간 정도의 노이즈만으로도 예측 성능, 해석 가능성, 개입 효과가 동시에 저하됨을 보였습니다. 특히 일부 개념은 평균적인 노이즈 수준보다 훨씬 더 큰 정확도 저하를 보이며, 이러한 개념의 노이즈가 성능 저하의 주요 원인임을 밝혔습니다. 이러한 취약성을 완화하기 위해, 노이즈에 민감한 개념의 학습을 안정화하는 sharpness-aware minimization을 훈련 단계에, 불확실성이 높은 개념을 우선적으로 수정하는 불확실성 기반의 개념 수정 방법을 추론 단계에 제안합니다. 이론적 분석과 다양한 실험을 통해 sharpness-aware 훈련의 강건성과 불확실성 기반 개념 선택의 신뢰성을 입증하여, 노이즈가 존재하는 환경에서도 해석 가능성과 강건성을 모두 유지할 수 있는 원리를 제시합니다.