SocialNav은 사회적 규범을 준수하는 임베디드 내비게이션을 위한 기반 모델입니다. 계층적 "뇌-행동" 아키텍처를 사용하여 높은 수준의 사회적 규범을 이해하고, 사회적으로 적합한 낮은 수준의 궤적을 생성합니다. SocNav Dataset(700만 개의 샘플)을 활용하며, 인지 활성화 데이터세트(chain-of-thought 설명 및 사회적 이동성 예측)와 전문가 궤적 피라미드(인터넷 비디오, 시뮬레이션 환경, 실제 로봇의 다양한 내비게이션 데모)를 포함합니다. 모방 학습을 통해 일반적인 내비게이션 기술과 사회적 규범 이해를 주입하고, SAFE-GRPO(사회적 준수 행동에 명시적으로 보상하는 흐름 기반 강화 학습 프레임워크)를 통해 기술을 개선하는 다단계 학습 파이프라인을 제안합니다. SocialNav은 최첨단 방법론에 비해 성공률 +38%, 사회적 준수율 +46%를 달성했습니다.