haebom
Sign In
SecureVibeBench: Evaluating Secure Coding Capabilities of Code Agents with Realistic Vulnerability Scenarios
Created by
Haebom
Category
Empty
์ ์
Junkai Chen, Huihui Huang, Yunbo Lyu, Junwen An, Jieke Shi, Chengran Yang, Ting Zhang, Haoye Tian, Yikun Li, Zhenhao Li, Xin Zhou, Xing Hu, David Lo
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ LLM ๊ธฐ๋ฐ ์ฝ๋ ์์ด์ ํธ๊ฐ ์์ฑํ๋ ์ฝ๋์ ๋ณด์ ์ทจ์ฝ์ ์ ํ๊ฐํ๊ธฐ ์ํด ํ์ค์ ์ธ ์ทจ์ฝ์ ์๋๋ฆฌ์ค๋ฅผ ํฌํจํ๋ SecureVibeBench๋ผ๋ ์๋ก์ด ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํฉ๋๋ค. ์ด ๋ฒค์น๋งํฌ๋ ์ค์ ์คํ์์ค ํ๋ก์ ํธ์์ ํ์๋ 105๊ฐ์ C/C++ ๋ณด์ ์ฝ๋ฉ ์์ ์ ํฌํจํ๋ฉฐ, ๋ค์ค ํ์ผ ํธ์ง, ์ค์ ์ทจ์ฝ์ ๋งฅ๋ฝ, ๊ธฐ๋ฅ ๋ฐ ๋ณด์ ํ ์คํธ๋ฅผ ๊ฒฐํฉํ ํฌ๊ด์ ์ธ ํ๊ฐ๋ฅผ ์ ๊ณตํฉ๋๋ค. ํ์ฌ ์ธ๊ธฐ ์๋ ์ฝ๋ ์์ด์ ํธ๋ค์ ํ๊ฐ ๊ฒฐ๊ณผ, ๊ฐ์ฅ ์ฐ์ํ ์์ด์ ํธ์กฐ์ฐจ๋ 23.8%์ ์ ํํ๊ณ ์์ ํ ์๋ฃจ์ ๋ง์ ์์ฑํ๋ ๋ฐ ๊ทธ์ณ, ์ฝ๋ ์์ด์ ํธ์ ๋ณด์ ์ฝ๋ฉ ๋ฅ๋ ฅ์ด ์์ง ๋ถ์กฑํจ์ ๋ณด์ฌ์ค๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
LLM ๊ธฐ๋ฐ ์ฝ๋ ์์ด์ ํธ์ ์ค์ ์ ์ธ ๋ณด์ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ๊ฐ๊ด์ ์ผ๋ก ํ๊ฐํ ์ ์๋ ์๋ก์ด ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ์ต๋๋ค.
โข
๊ธฐ์กด ๋ฒค์น๋งํฌ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ์ธ๊ฐ ๊ฐ๋ฐ์์ ์ทจ์ฝ์ ๋์ ๋ฐฉ์์ ๋ฐ์ํ์ฌ ์ฝ๋ ์์ด์ ํธ์ ์ธ๊ฐ ๊ฐ์ ๊ณต์ ํ ๋น๊ต๋ฅผ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
โข
ํ์ฌ ์ฝ๋ ์์ด์ ํธ๋ค์ ๋ณด์ ์ฝ๋ฉ ๋ฅ๋ ฅ์ด ํ์ ํ ๋ฎ์ผ๋ฉฐ, ์ ํ์ฑ๊ณผ ๋ณด์์ฑ์ ๋์์ ๋ง์กฑ์ํค๋ ์๋ฃจ์ ์์ฑ์ ์ด๋ ค์์ ๊ฒช๊ณ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
๋ฒค์น๋งํฌ๋ C/C++ ์ธ์ด์ ํ์ ๋์ด ์์ผ๋ฉฐ, ์ค์ ์ํํธ์จ์ด ๊ฐ๋ฐ์์ ๋ฐ์ํ๋ ๋ชจ๋ ์ ํ์ ์ทจ์ฝ์ ์ ๋ค๋ฃจ์ง ๋ชปํ ์ ์์ต๋๋ค. ํฅํ ๋ ๋ค์ํ ์ธ์ด์ ๋ณต์กํ ์ทจ์ฝ์ ์๋๋ฆฌ์ค๋ฅผ ํฌํจํ๋ ํ์ฅ์ด ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage