본 논문은 기존의 시간과 비용이 많이 드는 이웃 환경 평가 방식을 개선하기 위해, Vision-Language Model(VLM)을 활용한 새로운 워크플로우인 StreetLens를 제시합니다. StreetLens는 기존의 설문 조사 프로토콜에서 파생된 질문을 기반으로, 거리뷰 이미지(SVI)를 검색하고 객관적인 특징(예: 차량 수)부터 주관적인 인식(예: 이미지의 무질서함)까지 다양한 의미적 주석을 생성합니다. 연구자는 도메인 지식을 활용한 프롬프팅을 통해 VLM의 역할을 정의하고, 기존 설문 조사 데이터를 통합하여 분석의 강건성을 높일 수 있습니다. Google Colab 노트북을 통해 StreetLens를 공개하여 연구자들이 접근하고 확장할 수 있도록 지원합니다. StreetLens는 연구자와 긴밀히 협력하여 이웃 연구를 가속화하고 확장하는 유연하고 자율적인 AI 시스템으로의 전환을 의미합니다.