๋ณธ ์ฐ๊ตฌ๋ AI ์ฐ๊ตฌ์๊ณผ LLM ์์ด์ ํธ ๊ฐ์ ์ํธ์์ฉ์ด ์ด๋ก ๋ฌผ๋ฆฌํ ์ถ๋ก ๊ฒฐ๊ณผ์ ๋ฏธ์น๋ ์ํฅ์ SCALAR(Structured Critic--Actor Loop for AI Reasoning)๋ผ๋ ํ๋ ์์ํฌ๋ฅผ ํตํด ํ๊ตฌํฉ๋๋ค. SCALAR๋ ์๋ฃจ์
์ ์ ์ํ๋ Actor, ๋ฐ๋ณต์ ์ธ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ Critic, ๊ทธ๋ฆฌ๊ณ ์ต์ข
ํ๊ฐ๋ฅผ ๋ด๋นํ๋ Judge๋ก ๊ตฌ์ฑ๋์ด ์์์ฅ๋ก ๋ฐ ๋์ด๋ก ๋ฌธ์ ํด๊ฒฐ์ ์ ์ฉ๋์์ต๋๋ค. ๋ค์ํ Actor ํ๋ฅด์๋, Critic ํผ๋๋ฐฑ ์ ๋ต, Actor ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ ๋ฐ ์ค์ผ์ผ ๋ณํ๋ฅผ ํตํด ๋ค์ค ํด ๋ํ๊ฐ ๋จ์ผ ์๋๋ณด๋ค ๊ฐ์ ๋จ์ ํ์ธํ์ผ๋ฉฐ, ๊ฐ์ ๋ฉ์ปค๋์ฆ๊ณผ ํ๋กฌํํธ ์ ํ์ ๊ฐ์น๋ Actor-Critic ํ์ด๋ง์ ํฌ๊ฒ ์์กดํจ์ ๋ฐํ์ต๋๋ค.