음성 쿼리가 멀티모달 대규모 언어 모델의 환각에 미치는 영향을 연구합니다. RePOPE 벤치마크를 음성 데이터를 포함하도록 확장한 RePOPE-Spk를 제시하여, 다양한 음향 환경에서 음성 입력을 통해 모델의 환각을 평가합니다. 실험 결과, 음성 쿼리 환경에서 환각이 증가하며, 입력 순서와 쿼리 길이도 견고성에 영향을 미침을 확인했습니다. 또한, 다중 샷 프롬프팅 및 사고의 연쇄 추론과 같은 전략이 부분적인 완화 효과를 보이지만, 충분하지 않음을 밝혔습니다.