본 연구는 대규모 언어 모델(LLM)이 생성한 콘텐츠의 정확성을 평가하는 데 웹 검색 결과를 통합하는 것이 사용자의 인식 정확도와 신뢰도에 미치는 영향을 조사했습니다. 560명의 참가자를 대상으로 고정된 검색 결과(정적) 또는 참가자 주도 검색(동적)을 제공하는 조건과 검색 결과를 제공하지 않는 대조군 조건을 비교했습니다. 그 결과, 정적 및 동적 조건 모두에서 대조군에 비해 환각 콘텐츠의 정확도가 낮게 평가되었으며, 특히 동적 조건에서는 진짜 콘텐츠의 정확도가 더 높게 평가되고 전반적인 신뢰도가 더 높았습니다. 또한, 인지 욕구(NFC)가 높은 참가자는 낮은 참가자보다 심각한 환각의 정확도를 더 낮게 평가했습니다.