현재 최첨단 LLM의 어텐션 메커니즘의 핵심 구성 요소는 쿼리, 키, 값 가중치 삼중항입니다. 본 연구는 쿼리 가중치가 불필요하다는 것을 이론적으로 입증하여, 단순화된 가정을 통해 임베딩/lm-head를 제외한 파라미터 수를 8% 이상 줄일 수 있음을 확인했습니다. GPT-3 small 아키텍처 (레이어 정규화, 스킵 연결, 가중치 감소 포함)의 전체 복잡성에서 처음부터 학습하여 이론을 검증했으며, 감소된 모델이 표준 기준선과 유사한 검증 손실을 달성함을 입증했습니다.