Sign In

RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners

Created by
  • Haebom
Category
Empty

์ €์ž

Jugal Gajjar, Kamalasankari Subramaniakuppusamy

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ์–ธ์–ด ๋ชจ๋ธ์ด ํ‘œ ๊ธฐ๋ฐ˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€ ์‹œ, ์–ด๋–ค ์…€์ด ์–ด๋–ค ์ถ”๋ก  ๋‹จ๊ณ„์— ์‚ฌ์šฉ๋˜์—ˆ๋Š”์ง€ ๊ฒ€์ฆํ•  ์ˆ˜ ์—†๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด RSAT ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. RSAT๋Š” ์†Œํ˜• ์–ธ์–ด ๋ชจ๋ธ(SLM)์ด ํ‘œ ๊ทผ๊ฑฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์…€ ์ˆ˜์ค€์˜ ์ธ์šฉ์„ ํฌํ•จํ•œ ๋‹จ๊ณ„๋ณ„ ์ถ”๋ก ์„ ์ƒ์„ฑํ•˜๋„๋ก ํ›ˆ๋ จ์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ถ”๋ก ์˜ ์ถฉ์‹ค๋„์™€ ์ธ์šฉ์˜ ํƒ€๋‹น์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์†Œํ˜• ์–ธ์–ด ๋ชจ๋ธ(SLM)๋„ ๊ตฌ์กฐํ™”๋œ ์ถœ๋ ฅ๊ณผ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด ๋†’์€ ์ˆ˜์ค€์˜ ํ‘œ ์ถ”๋ก  ์ถฉ์‹ค๋„๋ฅผ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
์ถ”๋ก  ๊ณผ์ •์— ์ธ์šฉ์„ ํ†ตํ•ฉํ•˜๋Š” ๊ฒƒ์ด ํ›„์ฒ˜๋ฆฌ ๋ฐฉ์‹๋ณด๋‹ค ํ›จ์”ฌ ํšจ๊ณผ์ ์ด๋ฉฐ, ์ธ์šฉ์˜ ํƒ€๋‹น์„ฑ๊ณผ ์ถ”๋ก ์˜ ์ถฉ์‹ค๋„๊ฐ€ ๋ฐ€์ ‘ํ•˜๊ฒŒ ์—ฐ๊ด€๋˜์–ด ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์•ˆ๋œ faithfulness reward๊ฐ€ ์ถ”๋ก  ์ถฉ์‹ค๋„๋ฅผ ๋†’์ด๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์•„์ง 1B ํŒŒ๋ผ๋ฏธํ„ฐ ์ดํ•˜์˜ ์ดˆ์†Œํ˜• ๋ชจ๋ธ์— ๋Œ€ํ•œ ๊ฒ€์ฆ์ด๋‚˜ ๋ณต์žกํ•œ ํ‘œ ๊ตฌ์กฐ์— ๋Œ€ํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ ํ–ฅ์ƒ ๋“ฑ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘