DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent

Created by

Haebom

저자

Tongzhou Wu, Yuhao Wang, Xinyu Ma, Xiuqiang He, Shuaiqiang Wang, Dawei Yin, Xiangyu Zhao

💡 개요

본 논문은 심층 웹 탐색 및 질문 답변 능력을 갖춘 딥 리서치 에이전트의 성능 향상을 위해 실제와 유사한 난이도를 가진 대규모 데이터셋인 DeepResearch-9K와 오픈소스 학습 프레임워크 DeepResearch-R1을 제안합니다. DeepResearch-9K는 9,000개의 질문과 검증 가능한 답변, 최신 딥 리서치 에이전트의 탐색 경로 및 추론 과정을 포함하며, DeepResearch-R1은 다단계 웹 상호작용, 다양한 강화 학습 방법, 그리고 여러 보상 모델을 지원합니다.

🔑 시사점 및 한계

•

딥 리서치 에이전트 연구에 실질적인 도전 과제를 제공하는 대규모 고품질 데이터셋의 부재를 해결했습니다.

•

딥 리서치 에이전트 학습을 위한 유연하고 접근 가능한 오픈소스 프레임워크를 제공하여 연구 개발을 가속화했습니다.

•

본 연구에서 제안된 데이터셋과 프레임워크를 통해 딥 리서치 에이전트의 성능을 현재 최고 수준으로 향상시킬 수 있음을 입증했습니다.

•

데이터셋 구축 파이프라인의 자동화 과정에서 발생할 수 있는 잠재적인 편향이나 오류에 대한 추가적인 검증이 필요할 수 있습니다.

PDF 보기

Made with Slashpage