사전 훈련된 Transformer는 미세 조정 과정에서 소스 패턴에 과도한 확신을 보이며 새로운 대상 도메인 패턴을 형성하는 데 어려움을 겪습니다. 본 논문은 표준 교차 엔트로피 및 소프트맥스 분석을 통해 기울기 억제를 유발하는 출력 포화 메커니즘을 공식화합니다. 이를 통해, 변곡점 레이어에서의 기울기 억제가 기존 특징의 상위 수준 재조합에 적응을 국한시키고 하위 수준 재구성을 방해한다는 것을 보여줍니다. 또한, 주의 엔트로피(포화 프록시), 활성화 기울기 노름, 매개변수 기울기 노름, 공유 PCA 기반의 Delta-CKA와 같은 레이어별 진단 메트릭을 도입하여 낮은 주의 엔트로피와 급격한 기울기 감소가 특징인 변곡점 레이어를 식별합니다. 이러한 연구 결과를 바탕으로, 변곡점 레이어에 LoRA 어댑터를 선택적으로 삽입하여 최소한의 파라미터 오버헤드로 억제된 역방향 신호를 복원하는 진단-우선, 경량 주입 미세 조정 전략을 제안합니다. SST-2에서 Rotten Tomatoes로의 BERT-base 전이 실험을 통해 과소 훈련 및 과다 훈련된 소스 환경에서, 과다 훈련된 초기화는 변곡점 레이어 LoRA 주입의 이점을 얻고, 과소 훈련된 초기화는 성능 저하를 겪는다는 것을 확인했습니다. 기본 특징이 강할 때는 변곡점 레이어 차단 해제가 상위 수준의 구성 적응을 촉진하며, 기본 특징이 약할 때는 하위 수준 재구성을 위해 전체 경로 차단 해제가 필요하다는 것을 레이어별 활성화 기울기 및 Delta-CKA 동역학의 공동 분석을 통해 확인했습니다.