본 논문은 무한대 폭 제한에서 특징 학습을 "극대화"하도록 설계된 신경망 매개변수화인 $\mu$P를 사용하여 매개변수화된 선형 다층 퍼셉트론(MLP)에서 폭에 따른 학습률 전달의 첫 번째 증명을 제공합니다. $\mu$P에서 최적 학습률이 폭이 무한대로 갈 때 \emph{0이 아닌 상수}로 수렴한다는 것을 보여주어 학습률 전달에 대한 이론적 설명을 제공합니다. 반면, 표준 매개변수화(SP) 및 신경 접선 매개변수화(NTP)와 같은 대안적 매개변수화에서는 이러한 속성이 유지되지 않는다는 것을 보여줍니다. 직관적인 증거를 제공하고 광범위한 실험 결과로 이론적 발견을 뒷받침합니다.