Sign In

Mind the (DH) Gap! A Contrast in Risky Choices Between Reasoning and Conversational LLMs

Created by
  • Haebom
Category
Empty

์ €์ž

Luise Ge, Yongyan Zhang, Yevgeniy Vorobeychik

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ์˜์‚ฌ๊ฒฐ์ • ์ง€์› ๋ฐ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๋ถˆํ™•์‹ค์„ฑ ํ•˜์—์„œ์˜ ์˜์‚ฌ๊ฒฐ์ •์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ๋ช…์‹œ์ /๊ฒฝํ—˜ ๊ธฐ๋ฐ˜์˜ ์ „๋ง ํ‘œํ˜„๊ณผ ์„ค๋ช… ์œ ๋ฌด์— ๋”ฐ๋ฅธ LLM์˜ ์œ„ํ—˜ ์„ ํƒ์„ ๋น„๊ต ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ, LLM์€ ์ˆ˜ํ•™์  ์ถ”๋ก  ํ›ˆ๋ จ ์—ฌ๋ถ€์— ๋”ฐ๋ผ ์ถ”๋ก  ๋ชจ๋ธ(RM)๊ณผ ๋Œ€ํ™” ๋ชจ๋ธ(CM)๋กœ ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. RM์€ ํ•ฉ๋ฆฌ์ ์ธ ๊ฒฝํ–ฅ์„ ๋ณด์ด๋Š” ๋ฐ˜๋ฉด, CM์€ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ํ”„๋ ˆ์ด๋ฐ, ์ˆœ์„œ, ์„ค๋ช…์— ๋” ๋ฏผ๊ฐํ•˜๋ฉฐ ํฐ ์„ค๋ช…-๊ธฐ๋ก ๊ฒฉ์ฐจ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM์€ ์ˆ˜ํ•™์  ์ถ”๋ก  ํ›ˆ๋ จ ์—ฌ๋ถ€์— ๋”ฐ๋ผ ํ•ฉ๋ฆฌ์ ์ธ '์ถ”๋ก  ๋ชจ๋ธ(RM)'๊ณผ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ '๋Œ€ํ™” ๋ชจ๋ธ(CM)'๋กœ ๋‚˜๋‰˜๋ฉฐ, ๊ฐ๊ฐ ๋‹ค๋ฅธ ์˜์‚ฌ๊ฒฐ์ • ํŒจํ„ด์„ ๋ณด์ž…๋‹ˆ๋‹ค.
โ€ข
CM์€ ์ „๋ง์˜ ์ˆœ์„œ, ํ‘œํ˜„ ๋ฐฉ์‹(ํ”„๋ ˆ์ด๋ฐ), ์„ค๋ช…์˜ ์œ ๋ฌด์— ๋”์šฑ ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•˜์—ฌ ๋น„ํ•ฉ๋ฆฌ์ ์ธ ์„ ํƒ์„ ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ๋Š” LLM์˜ ์˜์‚ฌ๊ฒฐ์ • ๋ฐฉ์‹์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ, ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ์˜ ๋‹ค์–‘ํ•œ ๋ณต์žกํ•œ ๋ถˆํ™•์‹ค์„ฑ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ๊ฒ€์ฆ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘