Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Enhancing LLMs for Time Series Forecasting via Structure-Guided Cross-Modal Alignment

Created by
  • Haebom

저자

Siming Sun, Kai Zhang, Xuejun Jiang, Wenchao Meng, Qinmin Yang

개요

본 논문은 사전 훈련된 거대 언어 모델(LLM)을 활용한 시계열 예측에서 기존의 토큰 수준 또는 계층 수준 특징 매핑을 통한 언어-시간 모달리티 정렬 전략의 한계를 지적한다. LLM의 핵심 역량은 국소적인 토큰 특징 처리가 아닌 전체 시퀀스 구조 모델링에 있음을 강조하며, 효과적인 교차 모달리티 정렬을 위해 시퀀스 수준의 구조적 일관성이 필요하다고 주장한다. 이에 따라, 시계열과 언어 데이터의 상태 전이 그래프 구조를 활용하여 모달리티 정렬을 수행하는 구조 유도 교차 모달리티 정렬(SGCMA) 프레임워크를 제안한다. SGCMA는 구조 정렬과 의미 정렬 두 가지 주요 구성 요소로 이루어져 있으며, 숨겨진 마르코프 모델(HMM)과 최대 엔트로피 마르코프 모델(MEMM)을 활용하여 시계열 데이터에 언어와 유사한 순차적 동역학을 부여하고, 교차 어텐션을 통해 시간 패치와 언어 토큰 간의 의미적 정렬을 수행한다. 다양한 벤치마크 실험을 통해 SGCMA가 최첨단 성능을 달성함을 보여준다.

시사점, 한계점

시사점:
시계열 예측에서 LLM 활용의 새로운 패러다임 제시: 시퀀스 수준 구조 정렬을 통한 교차 모달리티 정렬의 효과성 증명.
SGCMA 프레임워크의 우수한 성능: 다양한 벤치마크에서 최첨단 성능 달성.
HMM과 MEMM을 활용한 시계열 데이터의 언어적 특성 부여: 기존의 토큰/계층 수준 접근 방식의 한계 극복.
한계점:
HMM과 MEMM의 가정에 대한 의존성: 실제 시계열 데이터의 복잡성을 완벽하게 반영하지 못할 가능성.
계산 비용: SGCMA의 복잡성이 기존 방법보다 높을 수 있음.
특정 유형의 시계열 데이터에 대한 일반화 성능: 다양한 시계열 데이터에 대한 추가적인 실험이 필요.
👍