Multi-Agent Multimodal Large Language Model Framework for Automated Interpretation of Fuel Efficiency Analytics in Public Transportation
Created by
Haebom
Category
Empty
저자
Zhipeng Ma, Ali Rida Bahja, Andreas Burgdorf, Andre Pomp, Tobias Meisen, Bo N{\o}rregaard J{\o}rgensen, Zheng Grace Ma
개요
본 연구는 대중교통의 연료 효율성을 향상시키기 위해, 복잡한 멀티모달 데이터를 해석 가능하고 의사 결정에 유용한 통찰력으로 통합하는 다중 에이전트 프레임워크를 제시합니다. 이 프레임워크는 데이터 내레이션 에이전트, LLM-as-a-judge 에이전트 및 선택적 human-in-the-loop 평가자를 조정하여 분석 아티팩트를 이해하기 쉽고 이해 관계자 중심의 보고서로 반복적으로 변환합니다. 덴마크 북부 윌란의 대중 버스 수송에 대한 실제 사례 연구를 통해 시스템을 검증하였으며, GPT-4.1 mini와 Chain-of-Thought 프롬프팅이 최적의 구성을 나타냄을 확인했습니다.
시사점, 한계점
•
시사점:
◦
다중 에이전트 오케스트레이션을 통해 LLM 기반 보고의 사실적 정확성, 일관성 및 확장성을 크게 향상시켰습니다.
◦
AI 기반 내러티브 생성 및 에너지 정보학의 의사 결정 지원을 위한 재현 가능하고 도메인 적응형 방법론을 확립했습니다.
◦
GPT-4.1 mini와 Chain-of-Thought 프롬프팅을 통해 97.3%의 높은 내러티브 정확도를 달성했습니다.
•
한계점:
◦
단일 사례 연구를 통해 검증되었으므로 다른 대중교통 시스템이나 데이터 유형에 대한 일반화 가능성은 추가 연구가 필요합니다.
◦
최적의 LLM 및 프롬프팅 기법은 특정 데이터 및 목표에 따라 달라질 수 있으므로, 다른 환경에 적용하기 위해서는 조정이 필요할 수 있습니다.
◦
Human-in-the-loop 평가자의 참여는 시스템의 자동화 수준을 제한할 수 있으며, 이 부분에 대한 추가적인 개선이 필요합니다.