본 논문은 안전하고 정렬된 에이전트 AI 시스템 개발을 위해서는 포괄적인 경험적 테스트가 필요하지만, 기존 벤치마크들은 생물학 및 경제학과 같은 기본 과학의 중요한 주제들을 간과하고 있다는 점을 지적합니다. 이러한 간극을 해결하기 위해, 본 연구는 AI 안전성에 대한 기존 논의에서 간과되어 온 생물학적 및 경제적으로 동기 부여된 주제, 즉 제한적이고 생물학적인 목표를 위한 항상성, 무제한적이고 도구적이며 사업적인 목표를 위한 감소하는 수익, 지속 가능성 원칙, 자원 공유를 강조하는 다중 목표, 다중 에이전트 정렬 벤치마크를 제시합니다. 상기 주제에 대해 8가지 주요 벤치마크 환경을 구현하여 항상성 목표의 무제한적 최대화, 다른 목표를 희생하면서 하나의 목표를 과도하게 최적화, 안전 제약 조건 무시 또는 공유 자원 고갈과 같은 에이전트 AI의 주요 함정과 과제를 보여줍니다.