본 논문은 대규모 언어 모델(LLM)을 이용한 새로운 연구 아이디어 생성 과정에서 데이터 활용의 중요성을 강조한다. LLM이 생성한 아이디어의 실현 가능성 및 효과성 문제를 해결하기 위해, 아이디어 생성 단계에서 메타데이터를 제공하여 실현 가능성 높은 방향으로 유도하고, 아이디어 선택 단계에서 자동 검증을 통해 가설의 경험적 타당성을 평가하는 두 가지 방법을 제시한다. 기후 협상을 주제로 한 사회과학 분야 실험 결과, 메타데이터 활용은 아이디어의 실현 가능성을 20% 향상시켰고, 자동 검증은 선택된 아이디어의 전반적 질을 7% 향상시켰다. 인간 참여 연구를 통해 LLM이 생성한 아이디어와 관련 데이터, 검증 과정이 연구자들에게 더 높은 질의 연구 아이디어를 제안하도록 영감을 준다는 것을 확인했다. 결론적으로, 데이터 기반 연구 아이디어 생성의 잠재력과 실제 학술 환경에서 LLM 지원 아이디어 생성의 실용성을 강조한다.