본 논문은 자연어 처리 분야에서 1차원 시퀀스에 효과적인 기법으로 알려진 Rotary Positional Encoding (RoPE)를 고차원 데이터(이미지, 비디오 등)로 확장하려는 최근 연구 동향을 다룬다. RoPE의 성공 요인으로 여겨지는 상대적 위치 인코딩으로서의 위치 등변성을 수학적으로 분석하고, 이를 바탕으로 M차원 데이터에 대한 일반적인 해법인 Mixed RoPE를 제시한다. 또한, 등변성을 꼭 필요로 하는지에 대한 의문을 제기하며, 비가환적 생성기를 사용하는 Spherical RoPE를 제안하고 실험적으로 기존 방법들과 동등하거나 더 나은 성능을 보임을 확인한다. 이는 상대적 위치 인코딩의 중요성에 대한 기존의 통념에 의문을 제기하며, 컴퓨터 비전 분야에서 더 빠르고 일반화된 위치 인코딩 연구를 가능하게 할 것으로 기대한다.