본 논문은 선형 어텐션을 사용하는 트랜스포머가 소프트맥스 기반 트랜스포머보다 계산상 이점을 제공하지만 성능 저하 문제를 겪는다는 점을 지적합니다. 특히, 대칭 텐서 임베딩을 활용하는 선형 트랜스포머인 sympow 트랜스포머는 소프트맥스 트랜스포머와 유사한 성능을 달성하지만, 순환 상태의 유한 용량으로 인해 훈련 또는 평가 컨텍스트 길이가 증가하면 성능이 저하됩니다. 이를 해결하기 위해, 본 논문에서는 데이터 의존적 곱셈 게이팅을 사용하여 용량을 동적으로 확보하고, 데이터 의존적 회전 임베딩을 사용하여 정보를 적응적으로 저장하는 conformal-sympow 트랜스포머를 제안합니다. LongCrawl64 데이터셋에 대한 예비 실험 결과, conformal-sympow는 sympow 트랜스포머의 한계를 극복하고 확장된 훈련 및 평가 컨텍스트에서 견고한 성능을 달성합니다.