๋ณธ ๋
ผ๋ฌธ์ ์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต(RLHF)์์ ๋ฐ์ํ๋ ์ธ์ง ํธํฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํฉ๋ฆฌ์ฑ(rationality) ํ๋ผ๋ฏธํฐ์ธ ๋ฒ ํ๋ฅผ ๋์ ์ผ๋ก ์กฐ์ ํ๋ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ์ฌ๋ก ํ์ฉํ์ฌ ์ธ์ง ํธํฅ์ ์กด์ฌ ๊ฐ๋ฅ์ฑ์ ํ๊ฐํ๊ณ , ํธํฅ๋๊ฑฐ๋ ์ ๋ขฐํ ์ ์๋ ํ๋จ์ ๋ฐ์ํ๋ ๋น๊ต๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์ค์น๋ฅผ ๋ฎ์ถค์ผ๋ก์จ, ํธํฅ๋ ์ ํธ๋๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ์
์์๋ ๋ ํฉ๋ฆฌ์ ์ธ ํ๋ฅ ๋ชจ๋ธ์ ํ์ตํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.