Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Multi-Agent Multimodal Large Language Model Framework for Automated Interpretation of Fuel Efficiency Analytics in Public Transportation

Created by
  • Haebom
Category
Empty

저자

Zhipeng Ma, Ali Rida Bahja, Andreas Burgdorf, Andre Pomp, Tobias Meisen, Bo N{\o}rregaard J{\o}rgensen, Zheng Grace Ma

개요

본 연구는 대중교통의 연료 효율성을 향상시키기 위해, 복잡한 멀티모달 데이터를 해석 가능하고 의사 결정에 유용한 통찰력으로 통합하는 다중 에이전트 프레임워크를 제시합니다. 이 프레임워크는 데이터 내레이션 에이전트, LLM-as-a-judge 에이전트 및 선택적 human-in-the-loop 평가자를 조정하여 분석 아티팩트를 이해하기 쉽고 이해 관계자 중심의 보고서로 반복적으로 변환합니다. 덴마크 북부 윌란의 대중 버스 수송에 대한 실제 사례 연구를 통해 시스템을 검증하였으며, GPT-4.1 mini와 Chain-of-Thought 프롬프팅이 최적의 구성을 나타냄을 확인했습니다.

시사점, 한계점

시사점:
다중 에이전트 오케스트레이션을 통해 LLM 기반 보고의 사실적 정확성, 일관성 및 확장성을 크게 향상시켰습니다.
AI 기반 내러티브 생성 및 에너지 정보학의 의사 결정 지원을 위한 재현 가능하고 도메인 적응형 방법론을 확립했습니다.
GPT-4.1 mini와 Chain-of-Thought 프롬프팅을 통해 97.3%의 높은 내러티브 정확도를 달성했습니다.
한계점:
단일 사례 연구를 통해 검증되었으므로 다른 대중교통 시스템이나 데이터 유형에 대한 일반화 가능성은 추가 연구가 필요합니다.
최적의 LLM 및 프롬프팅 기법은 특정 데이터 및 목표에 따라 달라질 수 있으므로, 다른 환경에 적용하기 위해서는 조정이 필요할 수 있습니다.
Human-in-the-loop 평가자의 참여는 시스템의 자동화 수준을 제한할 수 있으며, 이 부분에 대한 추가적인 개선이 필요합니다.
👍