본 논문은 딥러닝, 특히 Muon 최적화 프레임워크에서 중요한 서브루틴으로 떠오른 극 분해(polar decomposition) 계산을 위한 GPU 친화적인 알고리즘인 Polar Express를 제안합니다. 기존의 Newton-Schulz 방법이나 유리 함수 기반 방법과 달리, Polar Express는 매 반복마다 최소-최대 최적화 문제를 풀어 다항식 업데이트 규칙을 적용하여 빠른 초기 및 점근적 수렴을 보장합니다. 행렬-행렬 곱셈만을 사용하여 GPU 호환성을 유지하며, bfloat16에서도 안정적으로 동작하도록 설계되었습니다. GPT-2와 같은 대규모 모델에서 Muon 최적화 프레임워크 내에서 Polar Express를 적용하여 검증 손실을 개선하는 결과를 보였습니다.