๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ์กด ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ํ๊ฐ ํ๋ ์์ํฌ์ ๋ค ๊ฐ์ง ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ ์ (๋ถํฌ, ์๊ฐ, ๋ฒ์, ํ๋ก์ธ์ค ๋ฌดํจ์ฑ)์ ์ง์ ํ๋ฉฐ, ํนํ ๊ฐํํ์ต ๊ธฐ๋ฐ ์ธ๊ฐ ํผ๋๋ฐฑ(RLHF)์์ ๋ฐ์ํ๋ ๋ณด์ ํดํน ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ์๋ GCE(Grounded Continuous Evaluation) ํ๋ ์์ํฌ์ ๊ตฌํ์ฒด์ธ ISOPro๋ ๊ฒฐ์ ๋ก ์ ๊ฒ์ฆ๊ธฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ณด์ ํดํน์ ์์ฒ์ ์ผ๋ก ๋ฐฉ์งํ๊ณ , LoRA ์ด๋ํฐ๋ฅผ CPU์์ ์
๋ฐ์ดํธํ์ฌ ํ๋์จ์ด ์๊ตฌ ์ฌํญ์ ๋ํญ ๋ฎ์ถฅ๋๋ค.