본 논문은 꿀벌 군집의 둥지 선택 모델을 바탕으로, 모방을 통한 집단 의사결정과 개별 시행착오 학습 간의 등가성을 밝힙니다. 꿀벌 개체들이 단순한 지역적 모방 규칙을 따르는 것으로부터 발생하는 분산 인지(hive mind)가, 다수의 병렬 환경과 상호작용하는 단일 온라인 강화학습(RL) 에이전트와 동등함을 보입니다. 이러한 거시적 에이전트의 학습 규칙은 저자들이 Maynard-Cross Learning이라고 명명한 밴딧 알고리즘입니다. 이 분석을 통해 인지 능력이 제한적인 유기체 집단이 더 복잡한 강화학습 기반 개체와 동등한 수준의 성능을 낼 수 있음을 시사하며, 집단 지능이 자연에서 어떻게 단순하고 무작위적인 개별 행동들이 선택되는지를 설명할 수 있음을 뒷받침합니다.