본 논문은 인간-AI 협업 연구에서 객관적 성능 측정에 치우치는 기존 연구의 한계를 지적하며, 인간의 주관적 선호도를 고려해야 함을 강조합니다. 특히, 행동 형성(Behavior Shaping, BS) 강화 학습 알고리즘을 이용하여 인간이 AI의 행동을 직접적으로 제어할 수 있는 공유 작업 공간 환경에서 실험을 진행했습니다. 실험 결과, 인간이 AI의 행동을 제어할 수 있을 때 AI 파트너를 더 효과적이고 즐겁게 인지하며, BS 알고리즘이 자기 플레이 정책에 비해 효과적인 AI 정책을 생성하는 것을 확인했습니다. 결론적으로, 인간-AI 상호 보완성은 객관적 결과뿐 아니라 주관적 선호도까지 고려해야 함을 시사합니다.