본 논문은 에이전트형 AI의 급격한 발전에 대해 다루며, 대규모 언어 모델(LLM)이 단순히 응답하는 것을 넘어 행동하고, 추론하며, 적응하는 새로운 단계를 조명한다. 파이프라인 기반 시스템에서 모델 내재적 패러다임으로의 변화를 추적하며, 특히 강화 학습(RL)이 이러한 변화를 가능하게 하는 알고리즘 엔진임을 강조한다. 계획, 도구 사용, 기억과 같은 에이전트의 주요 기능이 외부 모듈에서 종단간 학습 행동으로 어떻게 발전했는지 체계적으로 검토하고, 심층 연구 에이전트와 GUI 에이전트와 같은 주요 에이전트 응용 프로그램을 살펴본다. 마지막으로, 멀티 에이전트 협업 및 반성과 같은 에이전트형 기능의 지속적인 내재화와 미래 에이전트형 AI에서 시스템 및 모델 계층의 진화하는 역할에 대해 논의한다.