Agentic AI 프레임워크는 거대 언어 모델(LLM)에 웹 검색, Python 인터프리터, 컨텍스트 데이터베이스 등 외부 도구를 통합하여 자율적인 문제 해결 능력을 부여합니다. 본 논문은 CPU 중심적인 관점에서 에이전트 AI 워크로드의 시스템 병목 현상을 파악하고 이해하는 것을 목표로 합니다. 에이전트 AI를 오케스트레이터, 추론 경로 역학 및 반복성을 기준으로 체계적으로 특징 분석하고, Haystack RAG, Toolformer, ChemCrow, Langchain 및 SWE-Agent 등 5가지 대표적인 에이전트 AI 워크로드를 사용하여 대기 시간, 처리량 및 에너지 메트릭을 프로파일링합니다. CPU가 GPU에 비해 이러한 메트릭에 미치는 영향을 규명하고, CPU 및 GPU 인식 마이크로 배치(CGAM) 및 혼합 에이전트 워크로드 스케줄링(MAWS)과 같은 최적화를 제안하여 성능, 효율성 및 확장성을 향상시키는 잠재력을 보여줍니다.