haebom
Sign In
Learning to Generate Secure Code via Token-Level Rewards
Created by
Haebom
Category
Empty
μ μ
Jiazheng Quan, Xiaodong Li, Bin Wang, Guo An, Like Liu, Degen Huang, Lin Liu, Chengbin Hou
π‘ κ°μ
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μ½λ μμ±μ κ°μ μ 보μ΄μ§λ§ 보μ μ·¨μ½μ μ μ·¨μ½ν λ¬Έμ λ₯Ό μκ³ μμ΅λλ€. κΈ°μ‘΄ μ κ·Ό λ°©μμ κ³ νμ§ λ³΄μ λ°μ΄ν° λΆμ‘±κ³Ό κ±°μΉ κ°ν νμ΅ λ³΄μ μ νΈλΌλ λ κ°μ§ νκ³λ₯Ό κ°μ§κ³ μμμ΅λλ€. λ³Έ λ Όλ¬Έμ LLMμ μ체 λ°μ±μ νμ©νμ¬ μ€μ μ·¨μ½μ μΌλ‘λΆν° λμ μ λ’°λμ 볡ꡬ μμ ꡬμΆνκ³ , λ€μν μμμ ν둬ννΈλ₯Ό μμ±νμ¬ PrimeVul+ λ°μ΄ν°μ μ ꡬμΆνλ Vul2Safe νλ μμν¬λ₯Ό μ μν©λλ€. λν, ν ν° μμ€ λ³΄μμ κ°ν νμ΅μ λμ ν SRCodeλ₯Ό ν΅ν΄ μ½λ 보μμ μν μλ‘μ΄ νλ ¨ νλ μμν¬λ₯Ό μ μνλ©°, μ΄λ₯Ό ν΅ν΄ λ―ΈμΈν 보μ ν¨ν΄μ μ§μμ μΌλ‘ νμ΅νκ³ κ°νν μ μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μ체 λ°μ±μ ν΅ν΄ κ³ νμ§μ μμ ν μ½λ 볡ꡬ μμ μλμΌλ‘ μμ±νμ¬ λ³΄μ λ°μ΄ν° λΆμ‘± λ¬Έμ λ₯Ό ν΄κ²°νμ΅λλ€.
β’
ν ν° μμ€ λ³΄μ μμ€ν μ λμ νμ¬ λ―ΈμΈν 보μ ν¨ν΄μ ν¨κ³Όμ μΌλ‘ νμ΅νκ³ , μ½λ 보μ μ΅μ νλ₯Ό μ λ°νκ² μνν μ μμ΅λλ€.
β’
μ μλ Vul2Safe νλ μμν¬μ SRCode νλ ¨ λ°©μμ λ€μν λ²€μΉλ§ν¬μμ μμ±λ μ½λμ 보μ μ·¨μ½μ μ ν¬κ² μ€μ΄κ³ μ λ°μ μΈ μ½λ νμ§μ ν₯μμν€λ κ²μΌλ‘ μ μ¦λμμ΅λλ€.
β’
λ³Έ μ°κ΅¬λ LLM κΈ°λ° μ½λ μμ±μ 보μμ±μ ν₯μμν€λ μλ‘μ΄ λ°©ν₯μ μ μνμ§λ§, μ€μ λ°°ν¬ μ λ°μν μ μλ 볡μ‘νκ³ μμΈ‘ λΆκ°λ₯ν μ·¨μ½μ μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage