Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact

Created by
  • Haebom

저자

Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, Amgad Muneer, Anas Zafar, Ashmal Vayani, Maged Shoman, Abdelrahman B. M. Eldaly, Kai Zhang, Ferhat Sadak, Shaina Raza, Xinqi Fan, Ravid Shwartz-Ziv, Hong Yan, Vinjia Jain, Aman Chadha, Manoj Karkee, Jia Wu, Philip Torr, Seyedali Mirjalili

개요

본 논문은 인공 일반 지능(AGI) 개발에 대한 다학제적 연구를 제시합니다. GPT-4.5, DeepSeek 등 최신 모델들이 다중 모드 유창성과 부분적 추론 능력을 보여주지만, 토큰 수준 예측에 의존하고 실제 행동 능력이 부족하다는 한계를 지적합니다. 모듈형 추론, 지속적 기억, 다중 에이전트 협력의 역할을 강조하며, 특히 검색, 계획, 동적 도구 사용을 결합한 에이전트 기반 RAG 프레임워크의 부상에 주목합니다. 정보 압축, 테스트 시간 적응, 훈련 없는 방법 등의 일반화 전략을 통해 유연하고 영역에 구애받지 않는 지능을 구축하는 방안을 논의합니다. 시각 언어 모델(VLM)을 단순한 지각 모듈이 아닌, 구현된 이해와 협업적 작업 완료를 위한 진화하는 인터페이스로 재검토하고, 규모보다는 기억과 추론의 통합, 즉 압축을 통해 적응적 행동을 가능하게 하는 모듈형, 상호 작용적이고 자기 개선적인 구성 요소들의 조정이 진정한 지능의 핵심이라고 주장합니다. 신경 기호 시스템, 강화 학습, 인지적 비계 등의 발전을 바탕으로 최근 아키텍처가 통계적 학습과 목표 지향적 인지 간의 간극을 어떻게 메우기 시작하는지 탐구하고, AGI 개발 과정에서의 과학적, 기술적, 윤리적 과제를 제시합니다.

시사점, 한계점

시사점:
에이전트 기반 RAG 프레임워크를 통한 더욱 적응적인 행동 가능성 제시
정보 압축, 테스트 시간 적응, 훈련 없는 방법 등의 일반화 전략 제시
기억과 추론의 통합을 AGI 달성의 핵심으로 제시
신경 기호 시스템, 강화 학습, 인지적 비계 등의 발전을 통한 통계적 학습과 목표 지향적 인지 간의 간극 해소 가능성 제시
VLM을 구현된 이해와 협업적 작업 완료를 위한 인터페이스로 재해석
한계점:
AGI 달성을 위한 구체적인 로드맵 제시 부족
제시된 일반화 전략들의 실제 효과에 대한 실험적 검증 부족
윤리적 과제에 대한 구체적인 해결 방안 제시 부족
다양한 AGI 접근 방식 간의 비교 분석 부족
👍