๋ณธ ๋
ผ๋ฌธ์ ์ฌ์ธต ๊ฐํํ์ต(DRL)์ด ์๊ตฌํ๋ ๋ฐฉ๋ํ ํ์ต ๋ฐ์ดํฐ์ ์์ ๊ท๋ชจ์ ํ๋ จ ํ๊ฒฝ์ ๋ฒ์ด๋ ์ผ๋ฐํ ๋ฅ๋ ฅ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋ฐฐ๊ฒฝ ์ง์์ผ๋ก์์ ๊ธฐํธ์ (symbolic) ์ ๋ณด๋ฅผ ํตํฉํ๋ ์ ๊ฒฝ-๊ธฐํธ ๊ฐํํ์ต(neuro-symbolic DRL) ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ๊ฐ๋จํ ํ๊ฒฝ์์ ์ต๋๋ ๋ถ๋ถ ์ ์ฑ
์ ๋
ผ๋ฆฌ ๊ท์น์ผ๋ก ํํํ๊ณ , ์ด๋ฅผ ํตํด ํ์ ์ ํ๋ ๋ถํฌ๋ฅผ ํธํฅ์ํค๊ฑฐ๋ ๊ฐ์น ํจ์๋ฅผ ์กฐ์ ํจ์ผ๋ก์จ ํ์ต์ ๊ฐ์ํํฉ๋๋ค. ์ด๋ฅผ ํตํด ํนํ ํฌ์ ๋ณด์ ํ๊ฒฝ์ด๋ ์ฅ๊ธฐ ๊ณํ์ด ํ์ํ ๋ณต์กํ ๋ฌธ์ ์์ ์ํ ํจ์จ์ฑ, ์ผ๋ฐํ ๋ฅ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ํด์ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ํฅ์์ํต๋๋ค.