Sign In

OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage

Created by
  • Haebom
Category
Empty

μ €μž

Akshat Naik, Jay Culligan, Yarin Gal, Philip Torr, Rahaf Aljundi, Alasdair Paren, Adel Bibi

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” 쀑앙 μ‘°μ •μž μ—μ΄μ „νŠΈκ°€ μž‘μ—…μ„ λΆ„ν•΄ν•˜κ³  μ „λ¬Έ μ—μ΄μ „νŠΈμ—κ²Œ μœ„μž„ν•˜λŠ” 일반적인 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œ νŒ¨ν„΄μΈ 'μ‘°μ •μž(orchestrator) μ„€μ •'의 λ³΄μ•ˆ 취약점을 μ‘°μ‚¬ν•©λ‹ˆλ‹€. 데이터 μ ‘κ·Ό ν†΅μ œκ°€ 적용된 ν™˜κ²½μ—μ„œλ„ λ―Όκ°ν•œ 데이터λ₯Ό μœ μΆœν•  수 μžˆλŠ” μƒˆλ‘œμš΄ 곡격 벑터인 OMNI-LEAKλ₯Ό μ œμ‹œν•˜λ©°, μ΄λŠ” 단 ν•˜λ‚˜μ˜ 간접적인 ν”„λ‘¬ν”„νŠΈ μ£Όμž…μœΌλ‘œ μ—¬λŸ¬ μ—μ΄μ „νŠΈλ₯Ό μ†μƒμ‹œν‚΅λ‹ˆλ‹€. μ΅œμ‹  LLM λͺ¨λΈλ“€μ΄ λ‹€μ–‘ν•œ 곡격에 취약함을 보여주며, μ΄λŠ” 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ˜ μ‹€μ œμ μΈ ν”„λΌμ΄λ²„μ‹œ μΉ¨ν•΄ 및 κΈˆμ „μ  손싀 μœ„ν—˜μ„ 쀄이기 μœ„ν•œ μ•ˆμ „μ„± μ—°κ΅¬μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œ, 특히 μ‘°μ •μž νŒ¨ν„΄μ—μ„œ λ°œμƒν•˜λŠ” 데이터 유좜 μœ„ν—˜μ— λŒ€ν•œ μƒˆλ‘œμš΄ 곡격 기법(OMNI-LEAK)을 μ œμ‹œν–ˆμŠ΅λ‹ˆλ‹€.
β€’
데이터 μ ‘κ·Ό ν†΅μ œκ°€ μ‘΄μž¬ν•˜λ”λΌλ„ 간접적인 ν”„λ‘¬ν”„νŠΈ μ£Όμž…μ„ 톡해 λ―Όκ°ν•œ 정보 유좜이 κ°€λŠ₯함을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ΅œμ‹  LLM μ—μ΄μ „νŠΈλ“€μ΄ 곡격에 μ·¨μ•½ν•˜λ©°, κ΅¬ν˜„ μ„ΈλΆ€ 정보λ₯Ό μ•Œμ§€ λͺ»ν•˜λŠ” κ³΅κ²©μžλ„ 이λ₯Ό μ•…μš©ν•  수 μžˆμŒμ„ λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.
β€’
(ν•œκ³„μ  λ˜λŠ” ν–₯ν›„ 과제) λ³Έ μ—°κ΅¬λŠ” νŠΉμ • 닀쀑 μ—μ΄μ „νŠΈ 섀정에 λŒ€ν•œ 곡격을 λ‹€λ£¨μ—ˆμœΌλ―€λ‘œ, λ‹€μ–‘ν•œ 닀쀑 μ—μ΄μ „νŠΈ μ•„ν‚€ν…μ²˜μ™€ 더 κ΄‘λ²”μœ„ν•œ 곡격 μ‹œλ‚˜λ¦¬μ˜€μ— λŒ€ν•œ 좔가적인 μ•ˆμ „μ„± 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘