본 논문은 기존 Data+AI 시스템의 한계점을 지적하며, 대규모 언어 모델(LLM)을 활용하여 데이터 관련 작업을 효과적으로 조정하는 '데이터 에이전트'라는 새로운 아키텍처를 제안한다. 데이터 에이전트는 데이터, 쿼리, 환경, 도구에 대한 이해, 파이프라인/워크플로 조정, 파이프라인 최적화 및 실행, 파이프라인 자기 반성 등의 기능을 통합하여 Data+AI 애플리케이션을 효율적으로 조율한다. 논문에서는 데이터 과학 에이전트, 다양한 데이터 분석 에이전트(비정형 데이터 분석, 의미 구조화된 데이터 분석, 데이터 레이크 분석, 다중 모드 데이터 분석 에이전트 포함), 데이터베이스 관리자(DBA) 에이전트 등의 예시를 제시하며, 데이터 에이전트 시스템 설계와 관련된 여러 가지 미해결 과제를 제시한다.