본 논문은 모바일 로봇의 자율 배송 및 호텔 서비스 등의 응용 분야에서 학습 기반 방법의 적용이 증가하고 있지만, 기존의 모방 학습(IL)과 강화 학습(RL)은 대규모 데이터셋, 정교한 보상 함수, 시뮬레이션-실제 간 차이 등의 문제로 실제 환경에서의 효율적이고 안전한 배치가 어렵다는 점을 지적합니다. 이를 해결하기 위해, 본 논문에서는 온라인 인간-컴퓨터 협력 학습 방법인 PVP4Real을 제안합니다. PVP4Real은 보상 함수나 사전 훈련 없이 온라인 인간 개입 및 시범 학습을 통해 실시간 정책 학습을 가능하게 하여 데이터 효율성과 훈련 안전성을 크게 향상시킵니다. 네발 보행 로봇과 바퀴형 배송 로봇 두 가지 로봇을 대상으로 RGBD 이미지를 관측치로 사용하는 작업을 포함한 두 가지 모바일 로봇 작업에 대한 실험을 통해 15분 이내에 훈련을 완료하고, 실제 로봇 작업에서 데이터 효율성 문제 해결을 위한 인간-컴퓨터 협력 학습의 유망성을 보여줍니다.