๋ณธ ๋
ผ๋ฌธ์ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํ ์๋ก์ด ๋ฐฉ์์ธ LOVER(Logic-Regularized Verifier)์ ์ ์ํฉ๋๋ค. LOVER๋ ๋ผ๋ฒจ๋ง๋ ๋ฐ์ดํฐ ๊ตฌ์ถ์ ๋๋ ๋น์ฉ๊ณผ ๋ค์์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋
ผ๋ฆฌ ๊ท์น์ผ๋ก ์ ๊ทํ๋ ์ง๋ ํ์ต ์๋(unsupervised) ๊ฒ์ฆ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ์ด๋ ์ธ ๊ฐ์ง ๋
ผ๋ฆฌ์ ์ผ๊ด์ฑ(๋ถ์ , ๊ทธ๋ฃน ๋ด, ๊ทธ๋ฃน ๊ฐ)์ ํตํด ๋ค์ค ์ถ๋ก ๊ฒฝ๋ก์์ ๊ฒ์ฆ๊ธฐ์ ๋์์ ์ ์ฝํ๋ฉฐ, ๊ธฐ์กด ์ง๋ ํ์ต ๊ฒ์ฆ๊ธฐ์ 95% ์์ค์ ๋ฌํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.