Sign In

Prototype Transformer: Towards Language Model Architectures Interpretable by Design

Created by
  • Haebom
Category
Empty

์ €์ž

Yordan Yordanov, Matteo Forasassi, Bayar Menzat, Ruizhi Wang, Chang Qi, Markus Kaltenberger, Amine M'Charrak, Tommaso Salvatori, Thomas Lukasiewicz

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์กด ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์˜ ๋ถˆํˆฌ๋ช…ํ•œ ์ถ”๋ก  ๊ณผ์ •์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด 'ํ”„๋กœํ† ํƒ€์ž… ํŠธ๋žœ์Šคํฌ๋จธ(ProtoT)'๋ผ๋Š” ์ƒˆ๋กœ์šด ์–ธ์–ด ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ProtoT๋Š” ์ž…๋ ฅ ์‹œํ€€์Šค์™€ ํ•™์Šต ๊ฐ€๋Šฅํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ฒกํ„ฐ์ธ 'ํ”„๋กœํ† ํƒ€์ž…' ๊ฐ„์˜ ์–‘๋ฐฉํ–ฅ ํ†ต์‹ ์„ ํ†ตํ•ด ์ด๋ฆ„ ๋ถ™์ผ ์ˆ˜ ์žˆ๋Š” ๊ฐœ๋…์„ ์ž๋™์œผ๋กœ ํฌ์ฐฉํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์ถ”๋ก  ๊ณผ์ •์„ ํ•ด์„ํ•˜๊ณ  ํ–‰๋™์„ ์ œ์–ดํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•œ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์ถ”๋ก : ProtoT๋Š” ํ”„๋กœํ† ํƒ€์ž…์„ ํ†ตํ•ด ํ•™์Šต ๊ณผ์ •์—์„œ ๋ช…ํ™•ํ•œ ๊ฐœ๋…์„ ํฌ์ฐฉํ•˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ชจ๋ธ์˜ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ํ•ด์„ํ•  ์ˆ˜ ์žˆ๋Š” "๋””์ž์ธ์— ์˜ํ•œ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ"์„ ์ œ๊ณตํ•œ๋‹ค.
โ€ข
ํšจ์œจ์ ์ธ ๊ณ„์‚ฐ ๋ฐ ํ™•์žฅ์„ฑ: ๊ธฐ์กด ํŠธ๋žœ์Šคํฌ๋จธ์˜ ์ด์ฐจ์  ๋ณต์žก์„ฑ๊ณผ ๋‹ฌ๋ฆฌ, ProtoT๋Š” ์‹œํ€€์Šค ๊ธธ์ด์— ๋Œ€ํ•ด ์„ ํ˜•์ ์œผ๋กœ ํ™•์žฅ๋˜๋ฉฐ ๋ชจ๋ธ ๋ฐ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ์— ์ž˜ ๋Œ€์‘ํ•˜์—ฌ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ๋†’์ธ๋‹ค.
โ€ข
ํ–‰๋™ ์ œ์–ด ๋ฐ ํŽธ์ง‘ ๊ฐ€๋Šฅ์„ฑ: ํ”„๋กœํ† ํƒ€์ž…์„ ํ†ตํ•ด ๋ชจ๋ธ์˜ ํŠน์ • ํ–‰๋™์„ ํƒ€๊ฒŸํŒ…ํ•˜์—ฌ ์ˆ˜์ •ํ•˜๊ฑฐ๋‚˜ ์ œ์–ดํ•  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ๋ ฅ์„ ์ œ๊ณตํ•˜์—ฌ, ํ™˜๊ฐ์ด๋‚˜ ๊ธฐ๋งŒ๊ณผ ๊ฐ™์€ ์œ„ํ—˜์„ ์ค„์ด๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๋‹ค.
โ€ข
์„ฑ๋Šฅ: ProtoT๋Š” ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ฐ GLUE์™€ ๊ฐ™์€ ๋‹ค์šด์ŠคํŠธ๋ฆผ ํƒœ์Šคํฌ์—์„œ ์ค€์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ๊ธฐ์กด ์ตœ์ฒจ๋‹จ ์•„ํ‚คํ…์ฒ˜์— ๊ทผ์ ‘ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค.
โ€ข
๊ฐ•๊ฑด์„ฑ: ์ž…๋ ฅ ๊ต๋ž€์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ์ด ๋›ฐ์–ด๋‚˜๋ฉฐ, ์ด๋Ÿฌํ•œ ๊ฐ•๊ฑด์„ฑ๊ณผ ๋ฏผ๊ฐ์„ฑ์ด ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ๋กœ๋ฅผ ํ•ด์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋ณด์—ฌ์ค€๋‹ค.
๐Ÿ‘