haebom
Sign In
CTFExplorer: Evaluating LLM Offensive Agents Through Multi-Target Web CTF Benchmarking
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Nanda Rani, Kimberly Milner, Minghao Shao, Meet Udeshi, Haoran Xi, Venkata Sai Charan Putrevu, Saksham Aggarwal, Sandeep K. Shukla, Prashanth Krishnamurthy, Farshad Khorrami, Muhammad Shafique, Ramesh Karri
π‘ κ°μ
λ³Έ λ Όλ¬Έμ κΈ°μ‘΄ LLM κΈ°λ° λ³΄μ 곡격 μμ΄μ νΈ νκ° λ°©μμ΄ λ¨μΌ λͺ©νμ κ΅νλμ΄ μ€μ CTF νκ²½μ 볡μ‘μ±μ λ°μνμ§ λͺ»νλ€λ λ¬Έμ μ μ μ§μ ν©λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄, μ¬λ¬ μΉ κΈ°λ° μ·¨μ½ μλΉμ€λ₯Ό νλμ νκ²½μ λ°°μΉνμ¬ μμ΄μ νΈκ° μ€μ€λ‘ λͺ©νλ₯Ό νμ, μ°μ μμ κ²°μ , 곡격 μ²΄μΈ κ΅¬μ±μ μννλλ‘ νλ CTFExplorer λ²€μΉλ§ν¬λ₯Ό μ μν©λλ€. μ΄λ₯Ό ν΅ν΄ μμ΄μ νΈμ μ λ΅μ μΆλ‘ λ₯λ ₯μ νκ°ν μ μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄ νκ° λ°©μμ νκ³λ₯Ό 극볡νκ³ LLM 보μ μμ΄μ νΈμ μ€μ μ μΈ νμ, μ°μ μμ κ²°μ , 곡격 μ²΄μΈ κ΅¬μ± λ₯λ ₯μ μ’ ν©μ μΌλ‘ νκ°ν μ μλ μλ‘μ΄ λ²€μΉλ§ν¬λ₯Ό μ μν©λλ€.
β’
μμ΄μ νΈμ λ¨μν νλκ·Έ νλ μ¬λΆλ₯Ό λμ΄, λͺ©ν μ μ , μ€ν¨ κ°μ€ μ²λ¦¬, λ€λ¨κ³ 곡격 μ‘°μ , 보μ μ 보 μΆμΆ λ± νλμ μΈ‘λ©΄μ λν μμΈν νκ°λ₯Ό κ°λ₯νκ² ν©λλ€.
β’
μ μλ λ²€μΉλ§ν¬μ 볡μ‘μ±κ³Ό νμ€μ±μ λμ΄κΈ° μν ν₯ν μ°κ΅¬, λ€μν 곡격 μ ν λ° μλ리μ€μ λν μ μ©, μμ΄μ νΈ κ°μ νλ ₯ λ° κ²½μ λ©μ»€λμ¦ κ°ν λ±μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage