자율 주행 차량의 보행자 안전 및 교통사고 감소를 위해 보행자 횡단 의도 예측은 필수적입니다. 본 논문에서는 보행자 행동, 환경, 보행자 위치, 차량 움직임의 4가지 주요 차원 내에서 다양한 수치적 컨텍스트 속성을 활용하는 Multi-context Fusion Transformer (MFT)를 제안하여 도시 환경에서 정확한 보행자 의도 예측을 가능하게 합니다. MFT는 progressive fusion 전략을 사용하며, intra-context attention과 cross-context attention을 통해 특징 융합을 수행합니다. 실험 결과, MFT는 JAADbeh, JAADall, PIE 데이터 세트에서 각각 73%, 93%, 90%의 정확도를 달성하며, 기존 방법보다 우수함을 입증했습니다.