Sign In

VeRA: Verified Reasoning Data Augmentation at Scale

Created by
  • Haebom
Category
Empty

์ €์ž

Zerui Cheng, Jiashuo Liu, Chunjie Wu, Jianzhu Yao, Pramod Viswanath, Ge Zhang, Wenhao Huang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์กด AI ํ‰๊ฐ€ ๋ฐฉ์‹์˜ ๋ฐ˜๋ณต์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด VeRA(Verified Reasoning Data Augmentation)๋ผ๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. VeRA๋Š” ์ž์—ฐ์–ด ํ…œํ”Œ๋ฆฟ, ์œ ํšจํ•œ ์„ค์ •์„ ์ƒ˜ํ”Œ๋งํ•˜๋Š” ์ƒ์„ฑ๊ธฐ, ๊ทธ๋ฆฌ๊ณ  ๋ฌธ์ œ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฒ€์ฆํ•˜๊ณ  ์ •๋‹ต์„ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒ€์ฆ๊ธฐ๋กœ ๊ตฌ์„ฑ๋˜์–ด, ๋‹จ์ผ ๋ฌธ์ œ๋กœ๋ถ€ํ„ฐ ๋ฌดํ•œํžˆ ๋งŽ์€ ๊ฒ€์ฆ๋œ ๋ฌธ์ œ ๋ณ€ํ˜•์„ ์ž๋™ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ์‹์€ ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด๋„ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ ˆ์ด๋ธ”์„ ๊ฑฐ์˜ ์ œ๋กœ ๋น„์šฉ์œผ๋กœ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ์–ด, AI ํ‰๊ฐ€์˜ ๊ฒฌ๊ณ ์„ฑ๊ณผ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
ํ‰๊ฐ€ ๋ฐฉ์‹์˜ ํ˜์‹ : VeRA๋Š” ์ •์ ์ธ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ๋„˜์–ด, ํ•„์š”์— ๋”ฐ๋ผ ์‹ ์„ ํ•˜๊ณ  ๊ฒ€์ฆ๋œ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌดํ•œํžˆ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ๋™์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ AI ๋ชจ๋ธ์˜ ์ง„์ •ํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ธก์ •ํ•˜๋Š” ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ฐ์ดํ„ฐ ์˜ค์—ผ ๋ฐฉ์ง€ ๋ฐ ๋‚œ์ด๋„ ์กฐ์ ˆ: VeRA-E ๋ชจ๋“œ๋Š” ๋ฐ์ดํ„ฐ ์˜ค์—ผ ํŒจํ„ด์„ ํƒ์ง€ํ•˜๊ณ  ๋ชจ๋ธ์˜ ๊ธฐ์–ต ๋Šฅ๋ ฅ๊ณผ ์‹ค์ œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ฃผ๋ฉฐ, VeRA-H ๋ชจ๋“œ๋Š” ๋ณต์žก์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ฆ๊ฐ€์‹œ์ผœ ์‚ฌ๋žŒ์ด ์ง์ ‘ ์ƒ์„ฑํ•˜๊ธฐ ์–ด๋ ค์šด ๊ณ ๋‚œ๋„ ๋ฌธ์ œ๋ฅผ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ ˆ์ด๋ธ”๊ณผ ํ•จ๊ป˜ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
โ€ข
ํ™•์žฅ์„ฑ๊ณผ ๋ฒ”์šฉ์„ฑ: ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋„๋ฉ”์ธ์ด๋ผ๋ฉด VeRA๋ฅผ ํ†ตํ•ด ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ๋น„์šฉ ํšจ์œจ์ ์œผ๋กœ ๋ฌดํ•œํžˆ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์†Œ์Šค ์ฝ”๋“œ์™€ ๋ฐ์ดํ„ฐ์…‹์„ ๊ณต๊ฐœํ•˜์—ฌ ํ–ฅํ›„ ์—ฐ๊ตฌ์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘