본 논문은 스페인어 정보 검색(IR) 연구 발전을 위해 대규모 스페인어 IR 데이터셋인 MessIRve를 소개합니다. 이 데이터셋은 Google 자동 완성 API에서 수집한 약 70만 개의 쿼리와 Wikipedia에서 얻은 관련 문서로 구성됩니다. MessIRve는 다양한 스페인 사용 지역을 반영하며, 영어에서 번역되거나 방언 차이를 고려하지 않는 기존 데이터셋과 차별점을 가집니다. 또한, 방대한 규모로 인해 다양한 주제를 포괄합니다. 본 논문은 데이터셋에 대한 상세 설명, 기존 데이터셋과의 비교, 주요 IR 모델에 대한 기본 평가를 제공합니다.