The Geometry of Benchmarks: A New Path Toward AGI

Created by

Haebom

저자

Przemyslaw Chojecki

개요

본 논문은 인공지능(AI) 발전을 평가하는 주요 도구인 벤치마크에 대한 새로운 접근 방식을 제시합니다. 기존의 개별 테스트 세트 평가 방식에서 벗어나, 심리 측정 배터리를 구조화된 모듈 공간의 점으로 취급하는 기하학적 프레임워크를 제안합니다. 이 프레임워크는 자율 AI(AAI) 척도, 벤치마크의 동등성 클래스를 식별하는 모듈 공간 구성, 그리고 강화 학습, 자기 학습, 토론 등을 포함하는 일반적인 생성자-검증자-업데이터(GVU) 연산자를 도입합니다. 본 논문은 GVU 동역학에 의해 구동되는 벤치마크 모듈에서 흐름으로 AI 발전을 이해하는 것이 중요하다는 점을 강조합니다.