๋ณธ ์ฐ๊ตฌ๋ LLM์ด ์์ฑํ๋ ์ฝ๋์ ๋ณด์ ์ทจ์ฝ์ฑ์ด ํ๋กฌํํธ์ ํ์ง์ ์ํด ํฌ๊ฒ ์ํฅ์ ๋ฐ๋๋ค๋ ์ ์ ์ฃผ๋ชฉํฉ๋๋ค. ์ ์๋ค์ ๋ชฉํ ๋ช
ํ์ฑ, ์ ๋ณด ์์ ์ฑ, ๋
ผ๋ฆฌ์ ์ผ๊ด์ฑ์ ํ๊ฐํ๋ ํ๋กฌํํธ ํ์ง ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋กฌํํธ์ ๊ท๋ฒ์ฑ ์์ค์ ๋ฐ๋ฅธ CWE-BENCH-PYTHON ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ, ํ๋กฌํํธ ๊ท๋ฒ์ฑ์ด ๋ฎ์์๋ก LLM์ด ์์ฑํ๋ ์ฝ๋์ ๋ณด์ ์ํ์ด ์ฆ๊ฐํ๋ฉฐ, Chain-of-Thought์ Self-Correction๊ณผ ๊ฐ์ ๊ณ ๊ธ ํ๋กฌํํ
๊ธฐ๋ฒ์ด ์ด๋ฌํ ์ํ์ ํจ๊ณผ์ ์ผ๋ก ์ํํจ์ ์
์ฆํ์ต๋๋ค.