본 논문은 에이전트 기반 검색 시스템의 발전을 주도하는 에이전트 검색의 새로운 평가 프레임워크인 RAVine을 제안합니다. 기존 평가 프레임워크의 한계점인 비현실적인 복잡한 쿼리 사용, 잡음이 많은 ground truth 추출, 반복적인 과정 무시 등을 해결하기 위해, RAVine은 현실적인 다중 지점 쿼리와 장문 답변을 다루고, 정확한 ground truth 생성 전략을 도입하며, 검색 도구와의 상호작용 및 효율성까지 고려한 평가를 수행합니다. 다양한 모델을 RAVine으로 평가하고, 에이전트 검색 시스템 개발에 기여할 수 있는 통찰력을 제공합니다. 코드와 데이터셋은 공개되어 있습니다.