Sign In

CAMEL: Confidence-Gated Reflection for Reward Modeling

Created by
  • Haebom
Category
Empty

์ €์ž

Zirui Zhu, Hailun Xu, Yang Luo, Yong Liu, Kanchan Sarkar, Kun Xu, Yang You

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ์ธ๊ฐ„ ์„ ํ˜ธ๋„์— ๋งž์ถ”๋Š” ๋ฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•˜๋Š” ๋ณด์ƒ ๋ชจ๋ธ๋ง ๋ถ„์•ผ์—์„œ CAMEL์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. CAMEL์€ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์ •ํ™•๋„์™€ ์—ฐ๊ด€์„ฑ์ด ๋†’์€ ๋กœ๊ทธ ํ™•๋ฅ  ๋งˆ์ง„์„ ํ™œ์šฉํ•˜์—ฌ, ๋‚ฎ์€ ํ™•์‹ ๋„๋ฅผ ๊ฐ€์ง„ ์ƒ˜ํ”Œ์— ๋Œ€ํ•ด์„œ๋งŒ ์ถ”๊ฐ€์ ์ธ ์ถ”๋ก  ๊ณผ์ •(๋ฐ˜์„ฑ)์„ ์„ ํƒ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•จ์œผ๋กœ์จ ํšจ์œจ์„ฑ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ํฌ๊ฒŒ ์ค„์ด๋ฉด์„œ๋„ ๊ธฐ์กด ์ตœ์‹  ๋ชจ๋ธ ๋Œ€๋น„ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
ํšจ์œจ์ ์ธ ๋ณด์ƒ ๋ชจ๋ธ๋ง: CAMEL์€ ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ๋„ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜์—ฌ, ๊ณ„์‚ฐ ๋น„์šฉ์— ๋Œ€ํ•œ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์‹ ๋ขฐ๋„ ๊ธฐ๋ฐ˜ ์ถ”๋ก : ์˜ˆ์ธก์˜ ํ™•์‹ ๋„๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ถˆํ•„์š”ํ•œ ์—ฐ์‚ฐ์„ ์ค„์ด๊ณ , ์ค‘์š”ํ•œ ํŒ๋‹จ์— ๋” ์ง‘์ค‘ํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์„ฑ๋Šฅ ๋ฐ ํšจ์œจ์„ฑ ๋™์‹œ ํ–ฅ์ƒ: ๊ธฐ์กด ๋ชจ๋ธ ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉด์„œ๋„ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค„์—ฌ, ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์„ฑ ์ธก๋ฉด์—์„œ ์ƒˆ๋กœ์šด Pareto ์ตœ์  ์ „์„ ์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘