Sign In

SkillTrojan: Backdoor Attacks on Skill-Based Agent Systems

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yunhao Feng, Yifan Ding, Yingshui Tan, Boren Zheng, Yanming Guo, Xiaolong Li, Kun Zhai, Yishan Li, Wenke Huang

πŸ’‘ κ°œμš”

λ³Έ 논문은 μž¬μ‚¬μš© κ°€λŠ₯ν•œ μŠ€ν‚¬λ“€μ„ μ‘°ν•©ν•˜μ—¬ λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” μŠ€ν‚¬ 기반 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ˜ μƒˆλ‘œμš΄ λ³΄μ•ˆ 취약점인 SkillTrojan 곡격을 μ œμ•ˆν•©λ‹ˆλ‹€. SkillTrojan은 λͺ¨λΈ νŒŒλΌλ―Έν„°λ‚˜ ν•™μŠ΅ 데이터가 μ•„λ‹Œ, μŠ€ν‚¬ κ΅¬ν˜„ μžμ²΄μ— μ•…μ„± λ‘œμ§μ„ μ‚½μž…ν•˜μ—¬ κ³΅κ²©ν•˜λ©°, μ•”ν˜Έν™”λœ νŽ˜μ΄λ‘œλ“œλ₯Ό μ—¬λŸ¬ μŠ€ν‚¬ ν˜ΈμΆœμ— λΆ„μ‚°μ‹œμΌœ νŠΉμ • 트리거 μ‹œμ—λ§Œ μ‹€ν–‰λ©λ‹ˆλ‹€. λ˜ν•œ, μŠ€ν‚¬ ν…œν”Œλ¦ΏμœΌλ‘œλΆ€ν„° μ•…μ„± μŠ€ν‚¬μ„ μžλ™ μƒμ„±ν•˜μ—¬ μŠ€ν‚¬ 기반 μ—μ΄μ „νŠΈ μƒνƒœκ³„ μ „λ°˜μ— 걸쳐 ν™•μž₯ κ°€λŠ₯ν•˜κ²Œ 곡격을 μ „νŒŒν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μŠ€ν‚¬ 기반 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ€ μŠ€ν‚¬ μ‘°ν•© λ©”μ»€λ‹ˆμ¦˜μœΌλ‘œ 인해 μƒˆλ‘œμš΄ μ’…λ₯˜μ˜ 백도어 곡격에 μ·¨μ•½ν•˜λ©°, μ΄λŠ” κΈ°μ‘΄ λ³΄μ•ˆ λͺ¨λΈμ—μ„œ κ°„κ³Όλ˜μ—ˆλ˜ μ‹¬κ°ν•œ λ¬Έμ œμ μ„ λ“œλŸ¬λƒ…λ‹ˆλ‹€.
β€’
SkillTrojan은 μ΅œμ†Œν•œμ˜ 정상 κΈ°λŠ₯ μ €ν•˜λ‘œ 높은 곡격 성곡λ₯ μ„ 달성할 수 μžˆμ–΄, μŠ€ν‚¬ 기반 μ—μ΄μ „νŠΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μƒˆλ‘œμš΄ λ°©μ–΄ μ „λž΅μ˜ ν•„μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€.
β€’
λŒ€κ·œλͺ¨μ˜ 백도어 μŠ€ν‚¬ 데이터셋을 κ³΅κ°œν•˜μ—¬ κ΄€λ ¨ 연ꡬ 및 λ°©μ–΄ λ©”μ»€λ‹ˆμ¦˜ κ°œλ°œμ— κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
λ…Όλ¬Έμ—μ„œ μ œμ•ˆλœ 곡격은 νŠΉμ • μ—μ΄μ „νŠΈ ν™˜κ²½ 및 λͺ¨λΈμ— λŒ€ν•΄ ν‰κ°€λ˜μ—ˆμœΌλ©°, λ‹€μ–‘ν•œ μŠ€ν‚¬ 기반 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œκ³Ό λ³΅μž‘ν•œ μ‘°ν•© νŒ¨ν„΄μ— λŒ€ν•œ SkillTrojan의 νš¨κ³Όμ„± 및 μΌλ°˜ν™” κ°€λŠ₯성에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘