본 논문은 대규모 언어 모델(LLM)을 활용하여 자동화된 데이터 과학 작업을 위한 새로운 프레임워크인 SPIO(Sequential Plan Integration and Optimization)를 제안합니다. SPIO는 데이터 전처리, 특징 공학, 모델링, 하이퍼파라미터 튜닝의 네 가지 주요 모듈에 걸쳐 다중 에이전트 계획을 조율하기 위해 LLM 기반 의사결정을 활용합니다. 각 모듈에서 전담 계획 에이전트는 후속 단계로 이어지는 후보 전략을 독립적으로 생성하여 포괄적인 탐색을 촉진합니다. 계획 최적화 에이전트는 여러 최적화된 계획을 제안하여 이러한 전략을 개선합니다. SPIO는 LLM에 의해 결정된 단일 최적 솔루션 경로를 선택하는 SPIO-S와 상위 k개의 후보 계획을 선택하고 이들을 앙상블하여 예측 성능을 극대화하는 SPIO-E의 두 가지 변형을 소개합니다. Kaggle 및 OpenML 데이터 세트에 대한 광범위한 실험을 통해 SPIO가 최첨단 방법을 크게 능가하여 강력하고 확장 가능한 자동화된 데이터 과학 작업 솔루션을 제공함을 보여줍니다.