๊ธฐ์กด ์ฝ๋ ์์ฑ ๋ฒค์น๋งํฌ์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ์ค์ ์ถ๋ก ๋ฅ๋ ฅ๋ณด๋ค๋ ์๊ธฐ ๋ฅ๋ ฅ์ ์์กดํ๋ค๋ ๋ฌธ์ ์ ์ ์ ๊ธฐํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋ณธ ์ฐ๊ตฌ๋ ํ๋ จ ๋ฐ์ดํฐ ์ค์ผ ๊ฐ๋ฅ์ฑ์ด ๋ฎ๊ณ ์ค์ ํ๋ก๊ทธ๋๋ฐ๊ณผ ๋์ผํ ๊ณ์ฐ ์๋ฆฌ๋ฅผ ์๊ตฌํ์ง๋ง ๊ฒฝ์ ์ ๋นํฉ๋ฆฌ์ฑ์ผ๋ก ์ธํด ์ฌ์ ํ๋ จ์์์ ์ด์ (benchmark gaming)์ด ์ ์ 5๊ฐ์ง ๋ํด ํ๋ก๊ทธ๋๋ฐ ์ธ์ด(Brainfuck, Befunge-98, Whitespace, Unlambda, Shakespeare)๋ฅผ ํ์ฉํ EsoLang-Bench๋ผ๋ ์๋ก์ด ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํฉ๋๋ค.