본 논문은 LLM 기반 에이전트를 활용하여 연구 목표 설정, 실험 계획 및 실행을 통합하는 자율 과학적 발견 시스템에 대한 연구를 제시한다. 기존 시스템의 한계점을 극복하기 위해, 연구진은 사용자 에이전트, 인지 에이전트, 실험 관리자로 구성된 다중 에이전트 플랫폼인 SelfAI를 제안한다. SelfAI는 최적 중단 기준을 통해 하이퍼파라미터 검색을 반복적으로 개선하고, 이종 하드웨어에서 병렬, 내결함성 훈련 워크플로우를 조율하며, 지속적인 피드백을 위한 구조화된 지식 기반을 유지한다. 또한, 발견 효율성과 검색 다양성을 정량화하기 위한 두 가지 새로운 평가 지표(Score 및 $\text{AUP}_D$)를 도입했다. 회귀, NLP, 컴퓨터 비전, 과학 컴퓨팅, 의료 영상 및 신약 개발 벤치마크에서 SelfAI는 기존 베이지안 최적화 및 LLM 기반 기준선보다 강력한 성능을 일관되게 달성하고 중복 시도를 줄이며, 연구자와의 원활한 상호 작용을 가능하게 한다.