본 논문은 대규모 언어 모델(LLM)과의 상호작용 방식 변화에 따라, 인간의 호기심을 유발하는 질문에 대한 이해의 필요성을 강조하며, 이를 위해 13,500개의 자연 발생 질문으로 구성된 데이터셋 "Quriosity"를 제시합니다. 이 데이터셋은 검색 엔진 쿼리, 인간 간 대화, LLM과의 대화 등 세 가지 소스에서 수집되었습니다. 특히, 인과 관계 질문의 중요성을 강조하며, 이러한 질문을 식별하기 위한 프롬프트 개선 프레임워크를 개발하고, 언어적 특성, 인지적 복잡성, 소스 분포를 분석합니다.