본 논문은 강화 학습(RL)의 세 가지 핵심 원칙(agency의 정의, 학습의 목표, reward 가설의 범위)에 대한 개념적 수정을 제안한다. 개방형 진화 이론에서 영감을 얻어, 이 세 가지 "독단"을 재고찰하고 관련 우려 사항을 해결한다. 진화 역학이 개인의 일생 동안 살아있는 뇌에서 작동할 수 있음을 보이고, 세 번째 독단(reward 가설의 한계)에 대해서는 진화적 적합성의 유추를 사용하여 스칼라 보상과 다중 목표 논쟁을 조명한다. RL에서 탐색에 대한 실질적인 의미를 논의한 후, agency의 부재라는 가장 근본적인 문제를 다룬다. 진화 패러다임만으로는 agency 문제를 해결할 수 없지만, 생명 기원 이론의 통합을 통해 agency와 자원 제약 강화 학습에 대한 이해를 제공할 수 있다고 주장한다.