오늘 ARC-AGI-2가 공개되었습니다.
오늘 공개된 ARC-AGI-2는 기존 ARC-AGI-1의 형식을 유지하면서도, 문제의 참신성과 개념 재조합 수준을 크게 향상시킨 새로운 AI 벤치마크입니다.
이 벤치마크는 AI가 단순히 암기한 지식이 아닌, 유연하고 일반화된 지능을 갖추었는지를 평가하기 위해 설계되었습니다. 특히 기호 해석, 다단계 추론, 문맥 기반 규칙 이해 등 AI에게 여전히 어려운 영역에 초점을 맞췄습니다.
모든 문제는 400명의 인간 참가자와의 실시간 테스트를 통해 검증되었으며, 평균 정답률은 일반 참가자 기준 60%, 전문가 패널 기준 100%로 기록되었습니다.