본 논문은 대규모 언어 모델(LLM)의 예측 과정을 설명하는 후처리 방식인 특징 귀속(FA) 방법론 중 하나인 Noiser를 제안합니다. Noiser는 각 입력 임베딩에 제한된 잡음을 부여하고, 부분적으로 잡음이 추가된 입력에 대한 모델의 강건성을 측정하여 입력 특징의 중요도를 산출합니다. 또한, 지시된 판정 모델을 사용하여 높은 점수를 받은 토큰이 예측된 출력을 복구하는 정도를 평가하는 응답 가능성 지표를 제안합니다. 6개의 LLM과 3가지 과제에 대한 종합적인 평가를 통해 Noiser가 기존의 기울기 기반, 주의 기반, 섭동 기반 FA 방법보다 충실성과 응답 가능성 측면에서 모두 일관되게 우수함을 보여줍니다.