haebom
Sign In
"**Important** You should give me full credits!": Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Hang Li, Fedor Filippov, Yuping Lin, Pengfei He, Kaiqi Yang, Yucheng Chu, Yingqian Cui, Hui Liu, Jiliang Tang
π‘ κ°μ
λ³Έ μ°κ΅¬λ LLM κΈ°λ° μλ μ±μ μμ€ν μ 보μ μ·¨μ½μ μ νꡬνλ©°, νΉν ν둬ννΈ μ£Όμ (Prompt Injection, PI) κ³΅κ²©μ΄ μ±μ μμ€ν μ μ‘°μνμ¬ μ€μ λ΅μμ νμ§κ³Ό κ΄κ³μμ΄ λμ μ μλ₯Ό λΆμ¬ν μ μμμ 보μ¬μ€λλ€. μ€ν κ²°κ³Ό, νμ¬ LLM κΈ°λ° μλ μ±μ μμ€ν μ μ΄λ¬ν 곡격μ λ§€μ° μ·¨μ½νλ©°, κ΅μ‘ νκ°μ 곡μ μ±κ³Ό μ λ’°μ±μ μ ν΄ν μ μλ μ¬κ°ν μνμ λ΄ν¬νκ³ μμ΅λλ€. λ°λΌμ λ³Έ μ°κ΅¬λ μ΄λ¬ν μνμ λν μΈμμ λμ΄κ³ μμ νκ³ μ λ’°ν μ μλ LLM κΈ°λ° κ΅μ‘ μμ€ν κ°λ°μ μ΄μ§νλ κ²μ λͺ©νλ‘ ν©λλ€.
π μμ¬μ λ° νκ³
β’
LLM κΈ°λ° μλ μ±μ μμ€ν μ ν둬ννΈ μ£Όμ 곡격μ μ·¨μ½νμ¬ κ΅μ‘ νκ°μ 곡μ μ±κ³Ό μ λ’°μ±μ μνν μ μμ΅λλ€.
β’
κΈ°μ‘΄μ ν둬ννΈ μ£Όμ λ°©μ΄ μ λ΅μ LLM κΈ°λ° μλ μ±μ μμ€ν μμ ν¨κ³Όμ μ΄μ§ μμ μ μμ΅λλ€.
β’
ν₯ν μ°κ΅¬λ LLM κΈ°λ° κ΅μ‘ μμ€ν μ 보μμ±μ κ°ννκ³ ν둬ννΈ μ£Όμ 곡격μ ν¨κ³Όμ μΌλ‘ λ°©μ΄νλ λ©μ»€λμ¦ κ°λ°μ μ§μ€ν΄μΌ ν©λλ€.
PDF 보기
Made with Slashpage