TSRating: Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment
Created by
Haebom
저자
Shunyu Wu, Dan Li, Haozheng Ye, Zhuomin Chen, Jiahui Zhou, Jian Lou, Zibin Zheng, See-Kiong Ng
개요
본 논문은 다양한 도메인에서 크롤링된 시계열 데이터의 품질을 평가하기 위한 새로운 통합 프레임워크인 TSRating을 제안합니다. TSRating은 대규모 언어 모델(LLM)이 다양한 시계열 데이터의 품질 차이를 이해하고 식별할 수 있다는 가정을 기반으로 합니다. LLM을 이용하여 시계열 데이터 쌍의 품질 비교를 유도하고, 이를 기반으로 TSRater라는 전용 평가 모델을 학습시켜 향후 시계열 데이터 샘플에 대한 효율적인 품질 예측을 수행합니다. 메타러닝 기법과 signSGD를 활용하여 다양한 도메인에 대한 적응력과 학습 효율을 향상시켰으며, 다양한 벤치마크 데이터셋과 시계열 모델에 대한 실험을 통해 기존 방법보다 우수한 성능을 보임을 확인했습니다.
시사점, 한계점
•
시사점:
◦
다양한 도메인의 시계열 데이터 품질 평가를 위한 통합 프레임워크 제시
◦
LLM을 활용하여 시계열 데이터 품질 비교를 효율적으로 수행
◦
메타러닝과 signSGD를 통해 도메인 적응력 및 학습 효율 향상
◦
기존 방법 대비 우수한 정확도, 효율성, 도메인 적응력을 실험적으로 증명
•
한계점:
◦
LLM의 성능에 의존적일 수 있음 (LLM의 한계가 TSRating의 성능에 영향을 미칠 수 있음)