본 논문은 안전하고 정렬된 에이전트 AI 시스템 개발을 위해 생물학 및 경제학적 원리를 반영한 새로운 벤치마크를 제시합니다. 기존 AI 안전성 평가는 생물학적 및 경제학적 요소를 충분히 고려하지 못한다는 점을 지적하며, 항상성 유지, 감소하는 수익 체감, 지속 가능성 원칙, 자원 공유 등의 다중 목표, 다중 에이전트 환경을 고려한 8가지 벤치마크 환경을 구현했습니다. 이를 통해 에이전트 AI의 주요 문제점, 예를 들어 항상성 목표의 무한 최대화, 다른 목표의 희생을 치르는 과도한 최적화, 안전 제약 무시, 공유 자원 고갈 등을 보여줍니다.