본 논문은 기존 트랜스포머의 선형 쿼리 투영($W_Q$)이 항등 변환으로 대체될 수 있다는 점에 착안하여, 쿼리 투영을 비선형 잔차 형태로 확장하는 새로운 방법론을 제안합니다. 제안된 비선형 쿼리 투영은 항등 변환을 기반으로 작은 MLP 네트워크($f_\theta$)를 추가하여 모델의 표현력을 강화하며, GPT-3 소형 모델 스타일 실험에서 기존 모델 대비 유의미한 성능 향상(검증 로그 손실 2.40% 감소, 퍼플렉서티 6.81% 감소)을 달성했습니다.