Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation

Created by
  • Haebom

저자

Yunxuan Jiang (School of Management, Xi'an Jiaotong University), Silan Hu (School of Computing, National University of Singapore), Xiaoning Wang (School of Data Science,Media Intelligence, Communication University of China), Yuanyuan Zhang (Beijing Baixingkefu Network Technology Co., Ltd.), Xiangyu Chang (School of Management, Xi'an Jiaotong University)

개요

대규모 언어 모델(LLM)이 자동화된 시스템 설계에 통합되고 있지만, 과학적 원리 없이 LLM의 내부 추론에만 의존하여 신뢰성과 견고성이 제한적이다. 본 논문은 Veridical Data Science(VDS) 프레임워크의 Predictability-Computability-Stability (PCS) 원리에 기반한 다중 에이전트 시스템인 VDSAgents를 제시한다. VDSAgents는 데이터 정제, 특징 공학, 모델링, 평가를 위한 모듈식 워크플로우를 구현하며, 각 단계는 섭동 분석, 단위 테스트 및 모델 검증을 통합하여 기능성과 과학적 감사 가능성을 보장한다. DeepSeek-V3와 GPT-4o를 백엔드로 사용하여 다양한 특성의 9개의 데이터 세트에서 AutoKaggle 및 DataInterpreter와 같은 최첨단 end-to-end 데이터 과학 시스템과 비교 평가한 결과, VDSAgents가 일관되게 우수한 성능을 보였다.

시사점, 한계점

시사점:
PCS 원리를 LLM 기반 데이터 과학 자동화에 통합하는 가능성을 입증.
AutoKaggle 및 DataInterpreter보다 우수한 성능 달성.
섭동 분석, 단위 테스트, 모델 검증을 통한 기능성과 과학적 감사 가능성 확보.
한계점:
논문에 구체적인 한계점 언급 없음. (논문 요약 정보만으로는 판단 불가)
👍