본 논문은 복잡한 심층 검색 시나리오에서 대규모 언어 모델(LLM)의 성능을 향상시키기 위해, 복잡한 훈련 방식 대신 전략적 데이터 엔지니어링을 사용하는 가볍고 효과적인 프레임워크인 SimpleDeepSearcher를 소개한다. SimpleDeepSearcher는 실제 웹 검색 환경에서 현실적인 사용자 상호 작용을 시뮬레이션하여 고품질 훈련 데이터를 합성하고, 입력 및 출력 측면의 다양성과 품질을 최적화하는 다중 기준 큐레이션 전략을 사용한다. 871개의 큐레이션된 샘플에 대한 지도 학습(SFT)만으로도 강화 학습(RL) 기반의 기본 모델보다 상당한 성능 향상을 보여주며, 데이터 부족 문제를 해결하여 효율적인 심층 검색 시스템 구축에 대한 실질적인 통찰력을 제공한다.