Alberto Coffrini, Mohammad Amin Zadenoori, Paolo Barsocchi, Francesco Furfari, Antonino Crivello, Alessio Ferrari
개요
본 논문은 대규모 언어 모델(LLM)인 ChatGPT를 활용하여 실내 맵 이미지로부터 자연스럽고 상황에 맞는 내비게이션 안내를 생성하는 방법을 탐구한다. 실제 환경에서 다양한 테스트 케이스를 설계 및 평가하여 LLM이 공간 배치 해석, 사용자 제약 조건 처리 및 효율적인 경로 계획에서 얼마나 효과적인지 분석한다. 실험 결과, LLM이 개인 맞춤형 실내 내비게이션을 지원할 가능성을 보여주었으며, 평균 52%의 정확도(최대 62%)를 달성했다. 성능은 레이아웃이나 경로의 복잡성보다는 관심 지점의 수와 시각 정보의 풍부함에 더 영향을 받는 것으로 나타났다. 이는 시각 정보가 많을수록 성능이 떨어짐을 의미한다.