본 논문은 보행자 속성 인식(PAR)의 성능 향상을 위해 시각적 및 언어적 속성 정렬을 이용한 속성 프롬프팅 기법, ViTA-PAR을 제안합니다. 기존 연구의 한계인 고정된 수평 영역에 대한 의존성을 극복하고자, 전역에서 국소적 의미를 포착하는 시각적 속성 프롬프트를 도입하여 다양한 속성 표현을 가능하게 합니다. 또한, 학습 가능한 프롬프트 템플릿을 통해 사람과 속성 맥락을 학습하여 언어적 임베딩을 풍부하게 하고, 시각적 및 언어적 속성 특징을 효과적으로 융합합니다. ViTA-PAR은 네 개의 PAR 벤치마크에서 경쟁력 있는 성능을 달성하며, 효율적인 추론이 가능합니다. 소스 코드와 모델은 공개되었습니다.