Flash-Fusion은 스마트 시티 및 IoT 환경에서 발생하는 방대한 양의 IoT 데이터를 효율적으로 분석하기 위한 시스템입니다. 이 시스템은 사용자의 질의를 파싱하여 분석 작업을 파악하고, 관련 데이터 슬라이스를 선택한 후 적절한 표현을 선택하여 LLM을 호출합니다. Flash-Fusion은 엣지 기반 통계적 요약을 통해 데이터 볼륨을 줄이고, 클라우드 기반 질의 계획을 통해 데이터 해석을 개선합니다. 대학 버스 fleet에 배포하여 raw 데이터를 LLM에 직접 feeding하는 baseline과 비교한 결과, Flash-Fusion은 95%의 지연 시간 감소, 98%의 토큰 사용량 및 비용 감소를 달성하면서도 고품질 응답을 유지했습니다.