haebom
Sign In
Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling
Created by
Haebom
Category
Empty
์ ์
Yong Liu, Xingjian Su, Shiyu Wang, Haoran Zhang, Haixuan Liu, Yuxuan Wang, Zhou Ye, Yang Xiang, Jianmin Wang, Mingsheng Long
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ 83์ต ๊ฐ์ ์ ์ฒด ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๊ฐ๋ ฅํ Mixture-of-Experts (MoE) ๊ธฐ๋ฐ ์๊ณ์ด ๊ธฐ์ด ๋ชจ๋ธ์ธ Timer-S1์ ์ ์ํฉ๋๋ค. ๊ธฐ์กด ์๊ณ์ด ๊ธฐ์ด ๋ชจ๋ธ์ ํ์ฅ์ฑ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๋ชจ๋ธ ์ํคํ ์ฒ, ๋ฐ์ดํฐ์ , ํ๋ จ ํ์ดํ๋ผ์ธ ์ธ ๊ฐ์ง ์ฐจ์์์ ์ง๋ ฌ ์ค์ผ์ผ๋ง(Serial Scaling)์ ์ ์ฉํ์ต๋๋ค. Timer-S1์ ์๊ณ์ด ์์ธก์ ๋ณธ์ง์ ์ธ ์ง๋ ฌ์ฑ์ ๋ฐ์ํ๋ ์ง๋ ฌ ํ ํฐ ์์ธก(Serial-Token Prediction, STP)์ด๋ผ๋ ์ผ๋ฐ์ ์ธ ํ๋ จ ๋ชฉํ๋ฅผ ์ํด ํฌ์ํ TimeMoE ๋ธ๋ก๊ณผ ์ผ๋ฐ์ ์ธ TimeSTP ๋ธ๋ก์ ํตํฉํ์ฌ ์ฅ๊ธฐ ์์ธก ์ฑ๋ฅ์ ํฅ์์ํค๊ณ ์ค๋ฅ ๋์ ์ ๋ฐฉ์งํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์๊ณ์ด ์์ธก์ ์ํ ํจ์จ์ ์ธ MoE ๊ธฐ๋ฐ ๊ธฐ์ด ๋ชจ๋ธ ์ํคํ ์ฒ์ ์ง๋ ฌ ํ ํฐ ์์ธก(STP) ํ๋ จ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ฌ ๊ธฐ์กด ๋ชจ๋ธ์ ํ์ฅ์ฑ ๋ฐ ์ฅ๊ธฐ ์์ธก ์ฑ๋ฅ ํ๊ณ๋ฅผ ๊ทน๋ณตํ์ต๋๋ค.
โข
1์กฐ ๊ฐ์ ์๊ณ์ด ๋ฐ์ดํฐ ํฌ์ธํธ๋ก ๊ตฌ์ฑ๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ (TimeBench)๊ณผ ์ธ์ฌํ ๋ฐ์ดํฐ ์ฆ๊ฐ์ ํตํด ๋ชจ๋ธ์ ํธํฅ์ ์ค์ด๊ณ ์์ธก ํ์ง์ ๋์์ต๋๋ค.
โข
Transformer ๊ธฐ๋ฐ ๋ชจ๋ธ์ ์ฅ๊ธฐ ์์ธก ์ฑ๋ฅ์ ํฅ์์ํค๋ฉด์๋ ๋กค๋ง(rolling) ์ถ๋ก ๋ฐฉ์์ ๋น์ฉ๊ณผ ์ค๋ฅ ๋์ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ํํ์ต๋๋ค.
โข
๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ํฌ๊ธฐ๊ฐ ๋งค์ฐ ํฌ๊ธฐ ๋๋ฌธ์ ๊ณ์ฐ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ ์ฌํญ์ด ๋์ ์ ์์ผ๋ฉฐ, ์ค์ ๋ฐฐํฌ ์ ์ด๋ฌํ ์ ์ฝ ์ฌํญ์ ๊ณ ๋ คํด์ผ ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage