๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ง์ ๊ณต๊ฐ ๋ฐ ์๊ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ QSTRBench๋ฅผ ์ ์ํ๋ค. QSTRBench๋ ๋ค์ํ ๊ณต๊ฐ ๋ฐ ์๊ฐ ์ถ๋ก ๊ณ์ฐ๋ฒ(์ ๋์, ์จ๋ฐ์ ๊ตฌ๊ฐ ๋์, ์ง์ญ ์ฐ๊ฒฐ ๊ณ์ฐ๋ฒ ๋ฑ)์ ๋ํด ํฉ์ฑ ์ถ๋ก , ์ญ๊ด๊ณ, ๊ฐ๋
์ ์ด์ ๋ฑ์ ๊ดํ ์ง๋ฌธ์ ํฌํจํ๋ค. ์คํ ๊ฒฐ๊ณผ, ๋ชจ๋ LLM์ด ๋ฌด์์ ์ถ์ธก๋ณด๋ค ๋์ ์ฑ๋ฅ์ ๋ณด์์ง๋ง, ์ด๋ ํ ๋ชจ๋ธ๋ ๋ชจ๋ ์ง๋ฌธ์ ์ผ๊ด๋๊ฒ ์ ๋ต์ ๋งํ์ง๋ ๋ชปํ์ผ๋ฉฐ, ๊ณ์ฐ๋ฒ์ ๋ฐ๋ผ ์ฑ๋ฅ ํธ์ฐจ๊ฐ ํฌ๊ฒ ๋ํ๋ฌ๋ค.