Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Private-RAG: Answering Multiple Queries with LLMs while Keeping Your Data Private

Created by
  • Haebom
Category
Empty

저자

Ruihan Wu, Erchi Wang, Zhiyuan Zhang, Yu-Xiang Wang

개요

본 논문은 검색 증강 생성(RAG) 시스템에서 개인 정보 보호 문제를 해결하기 위해, 현실적인 사용 환경인 다중 쿼리 설정에서 차등 프라이버시(DP)를 제공하는 두 가지 DP-RAG 알고리즘을 제안합니다. MURAG는 문서 검색 빈도에 따라 누적 프라이버시 손실을 계산하며, MURAG-ADA는 쿼리별 임계값을 프라이빗하게 공개하여 유틸리티를 개선합니다. 여러 LLM과 데이터 세트에 대한 실험을 통해 제안된 방법이 실용적인 DP 예산 내에서(ε≈10) 수백 개의 쿼리로 확장 가능하며 유의미한 유틸리티를 유지함을 보여줍니다.

시사점, 한계점

시사점:
다중 쿼리 환경에서 DP-RAG를 구현하여 실제 사용 환경에 적용 가능한 프라이버시 보호 방안 제시.
MURAG 알고리즘을 통해 문서 검색 빈도 기반의 프라이버시 손실 계산으로 효율성 향상.
MURAG-ADA 알고리즘을 통해 쿼리별 임계값 공개로 유틸리티 개선.
실험을 통해 제안된 방법의 확장성과 유용성을 입증.
한계점:
DP 예산(ε)의 설정에 따른 성능 변화에 대한 추가적인 분석 필요.
다른 DP-RAG 방법과의 비교 연구가 부족할 수 있음.
구현 복잡성 및 계산 비용에 대한 추가적인 고려 필요.
특정 데이터셋 및 LLM에 국한된 실험 결과일 수 있음.
👍