본 논문은 인공 일반 지능(AGI)을 위한 새로운 평가 기준인 인공 일반 지능 테스트 베드(AGITB)를 제시한다. 기존의 AGI 평가 방법들이 실용적이지 않고, 점진적인 평가가 어렵다는 한계를 지적하며, AGITB는 12가지 엄격한 테스트로 구성되어 있다. AGITB는 모델이 기호적 표현이나 사전 훈련 없이 시간에 따른 이진 신호를 예측하는 능력을 통해 지능을 평가한다. 언어나 지각에 기반한 고차원 테스트와 달리, 결정론, 민감도, 일반화와 같은 생물학적 지능을 반영하는 핵심 계산적 불변량에 중점을 둔다. 사전 편향이 없고, 의미론적 의미와 무관하며, 완전 탐색이나 암기로 해결할 수 없도록 설계되었다. 인간은 AGITB를 통과하도록 설계되었지만, 현재의 어떤 AI 시스템도 기준을 충족하지 못하고 있어 AGI를 향한 진보를 평가하는 척도로서 AGITB의 중요성을 강조한다.