Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Time-IMM: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series

Created by
  • Haebom

저자

Ching Chang, Jeehyun Hwang, Yidan Shi, Haixin Wang, Wen-Chih Peng, Tien-Fu Chen, Wei Wang

개요

본 논문은 의료, 기후 모델링, 금융과 같은 실제 응용 분야에서 자주 발생하는 불규칙하고 다중 모드이며 지저분한 시계열 데이터(샘플링 속도가 다르고, 비동기적 모드이며, 누락된 데이터가 널리 퍼져 있음) 문제를 해결하기 위해, 원인에 의한 불규칙성을 포착하도록 특별히 설계된 Time-IMM 데이터셋을 제시한다. Time-IMM은 트리거 기반, 제약 기반, 인공물 기반 메커니즘으로 분류된 9가지 유형의 시계열 불규칙성을 나타낸다. 이 데이터셋과 함께, 불규칙한 다중 모드 시계열 예측을 위한 벤치마크 라이브러리인 IMM-TSF를 소개한다. IMM-TSF는 시간 스탬프-텍스트 융합 모듈과 다중 모드 융합 모듈을 포함한 특수 융합 모듈을 포함하며, 최신성을 고려한 평균화 및 어텐션 기반 통합 전략을 모두 지원한다. 실험 결과는 불규칙한 시계열 데이터에서 다중 모드를 명시적으로 모델링하면 예측 성능이 크게 향상됨을 보여준다. Time-IMM과 IMM-TSF는 실제 조건에서 시계열 분석을 발전시키기 위한 기반을 제공한다. 데이터셋은 https://www.kaggle.com/datasets/blacksnail789521/time-imm/data 에서, 벤치마크 라이브러리는 https://anonymous.4open.science/r/IMMTSF_NeurIPS2025 에서 접근 가능하다.

시사점, 한계점

시사점:
실제 세계 시계열 데이터의 불규칙성, 다중 모드, 누락값 문제를 효과적으로 다루는 새로운 데이터셋(Time-IMM)과 벤치마크 라이브러리(IMM-TSF) 제공.
다중 모드 시계열 데이터에서 불규칙성을 명시적으로 모델링하는 것이 예측 성능 향상에 크게 기여함을 실증적으로 입증.
다양한 불규칙성 유형을 포함하는 데이터셋으로, 기존의 정규 시계열 데이터 기반 연구의 한계를 극복하고 실제 문제 해결에 기여.
시간 스탬프-텍스트 융합 및 다중 모드 융합 모듈을 통해 비동기 데이터 통합 및 실제적인 평가 가능.
한계점:
Time-IMM 데이터셋의 범용성: 제시된 9가지 유형의 불규칙성 외 다른 유형의 불규칙성을 포함하는 실제 시계열 데이터에 대한 일반화 성능 검증 필요.
IMM-TSF 벤치마크 라이브러리의 확장성: 더욱 다양한 알고리즘과 평가 지표 추가를 통한 확장성 개선 필요.
데이터셋의 크기와 다양성: 더욱 방대한 크기와 다양한 도메인의 데이터를 포함하여 일반화 성능을 높일 필요.
👍