Sign In

Urban Safety Perception Through the Lens of Large Multimodal Models: A Persona-based Approach

Created by
  • Haebom
Category
Empty

저자

Ciro Beneduce, Bruno Lepri, Massimiliano Luca

개요

본 연구는 도시 환경의 안전 인식을 평가하기 위해 대규모 다중 모달 모델(LMM), 특히 Llava 1.6 7B를 활용하는 새로운 접근 방식을 제시합니다. 기존 설문 조사 방식의 한계점(높은 비용, 시간 소요, 확장성 문제)을 극복하기 위해, 거리 사진을 이용하여 도시 공간의 안전 인식을 평가합니다. 퍼소나 기반 프롬프트를 통해 다양한 사회 인구 통계적 관점을 반영하여 분석하였으며, 추가적인 미세 조정 없이 평균 F1 점수 59.21%로 도시 환경을 안전/불안전으로 분류하였습니다. 주요 불안 요소로 고립, 물리적 붕괴, 도시 인프라 문제를 확인하였고, 연령, 성별, 국적에 따라 안전 인식에 유의미한 차이가 있음을 밝혔습니다. 특히 고령자와 여성 퍼소나는 젊은층이나 남성 퍼소나보다 불안감을 더 크게 느끼는 것으로 나타났습니다. 모델의 기본 설정은 중년 남성 퍼소나와 가장 유사했습니다. 본 연구는 LMM이 도시 안전 인식 평가에 있어 확장 가능하고 비용 효율적인 대안이 될 수 있음을 시사합니다.

시사점, 한계점

시사점:
대규모 다중 모달 모델(LMM)을 활용하여 도시 안전 인식을 효율적이고 확장 가능하게 평가할 수 있는 새로운 방법 제시.
사회 인구 통계적 요인에 따른 안전 인식의 차이를 효과적으로 분석.
도시 안전 인식의 주요 요인으로 고립, 물리적 붕괴, 도시 인프라 문제를 제시.
AI 기반 도시 계획에 LMM 활용 가능성 제시.
한계점:
LMM의 사회 인구 통계적 요인에 대한 민감성 고려 및 신중한 적용 필요.
모델의 정확도(F1-score 59.21%) 향상을 위한 추가 연구 필요.
사용된 데이터셋 및 모델의 일반화 가능성에 대한 추가 검증 필요.
👍