대규모 언어 모델은 실질적으로 중요한 무해한 수정에도 답변을 변경할 수 있음. RAG 출력은 구절이 재정렬될 때 바뀌고, 미세 조정은 사전 훈련에서 학습된 불변성을 약화시키며, 토론 또는 사고 사슬 프롬프트는 경로 종속적인 경로를 따르며, 컴파일러 융합 또는 재정렬은 결정 경계 근처의 로짓을 방해함. 이러한 실패는 의도된 불변성을 위반하고, 지속적인 통합을 깨뜨리며, 팀이 속도를 위해 안전성을 타협하도록 함. WILSON은 내부 표현에 대한 간단한 루프 및 재정렬 검사를 시스템 신호로 변환하는 최소한의 사후 진단 도구 모음임. WILSON은 JVPs 및 Hutchinson 프로브로 계산된 위치 및 레이어에 대한 역 없는 곡률 맵과 재정렬 위험을 플래그하는 활성화 수준의 교환기를 결합함. 신호는 계산 비용이 저렴하고, 표준 Transformer에 대해 모델 불가지론적이며, 오케스트레이터를 위해 임계값 및 CSV 아티팩트로 내보내짐. 이를 통해 RAG를 순서 효과로부터 보호하고, 미세 조정 회귀를 포착하고, 토론 경로 및 긴 다중 턴 컨텍스트를 안정화하고, 배포에서 융합 또는 재정렬을 제어하는 등의 구체적인 작업을 수행할 수 있음. 즉, WILSON은 실패를 예상하고 안전한 최적화를 승인하여 모델 아키텍처나 훈련을 변경하지 않고도 신뢰성과 처리량을 함께 개선하는 데 도움이 됨.