Sign In

Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement

Created by
  • Haebom
Category
Empty

저자

Yaxuan Kong, Yiyuan Yang, Yoontae Hwang, Wenjie Du, Stefan Zohren, Zhangyang Wang, Ming Jin, Qingsong Wen

개요

본 논문은 다양한 시계열 데이터(금융, 의료, 에너지 등)를 다루는 통합 프레임워크인 Time Series Multi-Task Question Answering (Time-MQA)를 제시합니다. Time-MQA는 수치 분석 작업과 추론을 포함하는 개방형 질문 답변을 모두 지원하는 자연어 질의를 가능하게 합니다. 핵심은 다양한 시계열 데이터(환경, 교통 등)에서 추출한 약 20만 개의 질문-답변 쌍으로 구성된 대규모 데이터셋 TSQA입니다. TSQA는 다양한 시계열 길이를 포함하며 견고한 모델 개발을 촉진합니다. 또한, Mistral 7B, Llama-3 8B, Qwen-2.5 7B 와 같은 대규모 언어 모델을 TSQA 데이터셋으로 지속적으로 사전 훈련하여 시계열 추론 능력을 향상시키고, 단순 수치 작업을 넘어 시간 데이터와의 더욱 고급스럽고 직관적인 상호 작용을 가능하게 함을 보여줍니다. TSQA 데이터셋, 모델, 실행 코드, 평가를 위한 사용자 연구 설문지 및 결과는 모두 공개되었습니다.

시사점, 한계점

시사점:
다양한 시계열 분석 작업을 통합하는 새로운 프레임워크 Time-MQA 제시
대규모 시계열 질의응답 데이터셋 TSQA 공개
대규모 언어 모델의 시계열 추론 능력 향상 및 자연어 기반 시계열 분석 가능성 제시
모든 자료(데이터셋, 모델, 코드 등) 공개를 통한 연구 재현성 및 확장성 확보
한계점:
TSQA 데이터셋의 다양성 및 대표성에 대한 추가적인 검증 필요
특정 도메인에 편향된 데이터셋 구성 가능성
사용된 대규모 언어 모델의 성능에 대한 추가 분석 필요
실제 응용 분야에서의 Time-MQA 성능 평가 및 검증 필요
👍