Sign In

On the Value of Tokeniser Pretraining in Physics Foundation Models

Created by
  • Haebom
Category
Empty

์ €์ž

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ๋ฌผ๋ฆฌํ•™ ๋ถ„์•ผ์˜ ๊ธฐ์ดˆ ๋ชจ๋ธ(Foundation Model)์—์„œ ํ† ํฌ๋‚˜์ด์ € ์‚ฌ์ „ ํ•™์Šต์˜ ์ค‘์š”์„ฑ์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ๊ณ ํ•ด์ƒ๋„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ์—์„œ ๋ณต์žกํ•œ ๋ฌผ๋ฆฌ ํ˜„์ƒ์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ํ† ํฌ๋‚˜์ด์ €์™€ ๋™์—ญํ•™ ๋ชจ๋ธ์„ ๋™์‹œ์— ํ•™์Šตํ•˜๋Š” ๊ธฐ์กด ๋ฐฉ์‹์˜ ๋น„ํšจ์œจ์„ฑ์„ ์ง€์ ํ•˜๋ฉฐ, ๋ณ„๋„์˜ ์ž๋™ ์ธ์ฝ”๋” ๋ชฉํ‘œ๋ฅผ ํ†ตํ•ด ํ† ํฌ๋‚˜์ด์ €๋ฅผ ์‚ฌ์ „ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ, ์‚ฌ์ „ ํ•™์Šต ๋ฐ์ดํ„ฐ์™€ ์‹ค์ œ ์ ์šฉ ๋Œ€์ƒ์ด ๋™์ผํ•œ ๋ฌผ๋ฆฌ ์‹œ์Šคํ…œ์ผ ๋•Œ ๊ฐ€์žฅ ํฐ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์ž…๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
ํ† ํฌ๋‚˜์ด์ € ์‚ฌ์ „ ํ•™์Šต์€ ๋ฌผ๋ฆฌํ•™ ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ํ•™์Šต ํšจ์œจ์„ฑ๊ณผ ์ •ํ™•๋„๋ฅผ ๋†’์ด๋Š” ๋ฐ ํšจ๊ณผ์ ์ธ ์ „๋žต์ž…๋‹ˆ๋‹ค.
โ€ข
์‚ฌ์ „ ํ•™์Šต ์‹œ ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ์˜ ๋ฌผ๋ฆฌ์  ์˜์—ญ์ด ์‹ค์ œ ์ ์šฉ ๋Œ€์ƒ๊ณผ ์ผ์น˜ํ• ์ˆ˜๋ก ์„ฑ๋Šฅ ํ–ฅ์ƒ ํญ์ด ์ปค์ง€๋ฏ€๋กœ, ์‚ฌ์ „ ํ•™์Šต ๋ฐ์ดํ„ฐ ์„ ํƒ์˜ ์ค‘์š”์„ฑ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ๋Š” ๋ฌผ๋ฆฌํ•™ ๊ธฐ์ดˆ ๋ชจ๋ธ์—์„œ ํ† ํฌ๋‚˜์ด์ € ์‚ฌ์ „ ํ•™์Šต์— ๋Œ€ํ•œ ์ตœ์ดˆ์˜ ์ฒด๊ณ„์ ์ธ ์กฐ์‚ฌ์ด๋ฉฐ, ์œ ์—ฐํ•œ ์‹œ๊ณต๊ฐ„ ์••์ถ• ์—ฐ์‚ฐ์„ ๋„์ž…ํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋‹ค์šด์ŠคํŠธ๋ฆผ ์ž‘์—…์— ๋Œ€ํ•œ ํšจ์œจ์ ์ธ ์ ์‘์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์•ž์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ฌผ๋ฆฌ ์‹œ์Šคํ…œ๊ณผ ๋ณต์žกํ•œ ๋‹ค์ค‘ ๋ฌผ๋ฆฌ ํ˜„์ƒ์— ๋Œ€ํ•œ ์‚ฌ์ „ ํ•™์Šต ์ „๋žต์„ ๋”์šฑ ํ™•์žฅํ•˜๊ณ , ์‚ฌ์ „ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์˜ ํฌ๊ธฐ์™€ ๋‹ค์–‘์„ฑ์ด ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์‹ฌ์ธต์ ์œผ๋กœ ๋ถ„์„ํ•  ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘