Sign In

LeakDojo: Decoding the Leakage Threats of RAG Systems

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Maosen Zhang, Jianshuo Dong, Boting Lu, Wenyue Li, Xiaoping Zhang, Tianwei Zhang, Han Qiu

πŸ’‘ κ°œμš”

Retrieval-Augmented Generation (RAG) μ‹œμŠ€ν…œμ€ μ™ΈλΆ€ 지식을 ν™œμš©ν•  수 있게 ν•˜μ§€λ§Œ, λ™μ‹œμ— RAG λ°μ΄ν„°λ² μ΄μŠ€κ°€ 정보 λˆ„μΆœ 곡격에 μ·¨μ•½ν•΄μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. λ³Έ 논문은 RAG μ‹œμŠ€ν…œμ˜ 정보 λˆ„μΆœ μœ„ν—˜μ„ μ²΄κ³„μ μœΌλ‘œ ν‰κ°€ν•˜κΈ° μœ„ν•œ ꡬ성 κ°€λŠ₯ν•œ ν”„λ ˆμž„μ›Œν¬μΈ LeakDojoλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. LeakDojoλ₯Ό 톡해 14개의 LLM, 4개의 데이터셋, 그리고 λ‹€μ–‘ν•œ RAG μ‹œμŠ€ν…œμ— 걸쳐 6κ°€μ§€ κΈ°μ‘΄ 곡격을 λ²€μΉ˜λ§ˆν‚Ήν•œ κ²°κ³Ό, 쿼리 생성과 μ λŒ€μ  μ§€μ‹œκ°€ λˆ„μΆœμ— λ…λ¦½μ μœΌλ‘œ κΈ°μ—¬ν•˜λ©°, LLM의 μ§€μ‹œ 이행 λŠ₯λ ₯이 λ†’μ„μˆ˜λ‘ λˆ„μΆœ μœ„ν—˜μ΄ 컀지고, RAG의 좩싀도 ν–₯상이 였히렀 λˆ„μΆœ μœ„ν—˜μ„ μ¦κ°€μ‹œν‚¬ 수 μžˆμŒμ„ λ°ν˜”μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
RAG μ‹œμŠ€ν…œμ˜ 정보 λˆ„μΆœμ€ 쿼리 생성 및 μ λŒ€μ  μ§€μ‹œμ˜ μ‘°ν•©μœΌλ‘œ 인해 λ³΅ν•©μ μœΌλ‘œ λ°œμƒν•˜λ©°, μ΄λŸ¬ν•œ μš”μ†Œλ“€μ΄ κ°œλ³„μ μœΌλ‘œ λˆ„μΆœ μœ„ν—˜μ— 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€.
β€’
LLM의 μ§€μ‹œ 이행 λŠ₯λ ₯이 ν–₯μƒλ μˆ˜λ‘ RAG μ‹œμŠ€ν…œμ˜ 정보 λˆ„μΆœ μœ„ν—˜μ΄ μ¦κ°€ν•˜λŠ” κ²½ν–₯이 μžˆμŠ΅λ‹ˆλ‹€.
β€’
RAG μ‹œμŠ€ν…œμ˜ 좩싀도(faithfulness)λ₯Ό λ†’μ΄λ €λŠ” λ…Έλ ₯ μžμ²΄κ°€ 정보 λˆ„μΆœ μœ„ν—˜μ„ μ¦κ°€μ‹œν‚¬ 수 μžˆμœΌλ―€λ‘œ, 이에 λŒ€ν•œ κ· ν˜• 작힌 접근이 ν•„μš”ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ LeakDojo ν”„λ ˆμž„μ›Œν¬λ₯Ό ν™œμš©ν•˜μ—¬ λ‹€μ–‘ν•œ 곡격과 μ‹œμŠ€ν…œ 섀정에 λŒ€ν•œ λˆ„μΆœ μœ„ν—˜μ„ μ²΄κ³„μ μœΌλ‘œ ν‰κ°€ν•˜κ³  μ™„ν™” μ „λž΅μ„ κ°œλ°œν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” ν˜„μž¬κΉŒμ§€ μ œμ‹œλœ 6κ°€μ§€ 곡격과 14κ°€μ§€ LLM에 λŒ€ν•œ λ²€μΉ˜λ§ˆν‚Ή κ²°κ³Όλ₯Ό 기반으둜 ν•˜λ©°, ν–₯ν›„ 더 κ΄‘λ²”μœ„ν•œ LLM, 데이터셋, RAG ꡬ성 및 μƒˆλ‘œμš΄ 곡격 방식에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘