본 논문은 GPT-4 Turbo를 기반으로 한 AI NPC를 탑재한 VR 심문 시뮬레이터를 평가한 연구 결과를 제시합니다. 18명의 참가자를 대상으로 시스템 사용성 척도(SUS), 게임 경험 설문지(GEQ), 가상 에이전트 신뢰성 설문지를 사용하여 시스템의 현실성, 사용성, 시스템 성능을 평가했습니다. 음성 텍스트 변환(STT), 텍스트 음성 변환(TTS), GPT-4 Turbo, 전체 사이클 지연 시간을 측정하였으며, 평균 사이클 지연 시간은 7초로 나타났습니다. 신뢰성 점수는 10점 만점에 6.67점으로, 행동, 사회적 관계, 지능 측면에서는 높은 평가를 받았지만 감정과 성격 측면에서는 중간 수준의 평가를 받았습니다. SUS 점수는 79.44점으로 좋은 사용성을 나타냈습니다. 결과적으로, 대규모 언어 모델이 VR 내 NPC의 현실성과 상호 작용을 향상시킬 수 있는 잠재력을 보여주지만, 시스템 지연 시간 단축과 감정적 깊이 향상을 위한 과제가 존재함을 시사합니다.