Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action

Created by
  • Haebom
Category
Empty

저자

Yijia Shao, Tianshi Li, Weiyan Shi, Yanchen Liu, Diyi Yang

개요

본 논문은 언어 모델(LM)이 개인화된 의사소통 시나리오에서 사용됨에 따라, LM이 문맥적 프라이버시 규범에 따라 행동하도록 하는 것이 중요해짐을 강조한다. 기존의 프라이버시 위험 평가 방법의 한계를 지적하며, 문맥적이고 다양한 프라이버시 관련 사례와 현실적인 적용 시나리오를 포착하는 평가 방식의 부재를 문제점으로 제기한다. 이를 해결하기 위해, 프라이버시 민감 정보를 활용하여 다양한 시나리오를 생성하고, LM 에이전트의 행동에서 프라이버시 유출을 다층적으로 평가하는 새로운 프라이버시 평가 프레임워크인 PrivacyLens를 제안한다. PrivacyLens는 프라이버시 문헌과 크라우드소싱을 통해 수집된 프라이버시 규범과 시드 데이터를 기반으로 구축되었으며, GPT-4와 Llama-3-70B와 같은 최첨단 LM이 프라이버시 강화 지침에도 불구하고 25.68%~38.69%의 경우 민감 정보를 유출함을 보여준다. 또한, 각 시드를 여러 시나리오로 확장하여 LM의 프라이버시 위험을 다각적으로 분석하는 PrivacyLens의 동적 특성을 입증한다. 데이터셋과 코드는 GitHub에서 공개한다.

시사점, 한계점

시사점:
LM의 프라이버시 위험 평가를 위한 새로운 프레임워크인 PrivacyLens 제시.
최첨단 LM의 실제 동작에서의 프라이버시 위반 사례 제시 (GPT-4, Llama-3-70B).
프라이버시 평가를 위한 새로운 접근 방식을 통해 LM의 프라이버시 위험에 대한 이해 증진.
PrivacyLens 데이터셋과 코드 공개를 통한 연구 재현성 및 확장성 확보.
한계점:
PrivacyLens의 프라이버시 규범과 시드 데이터의 포괄성 및 일반화 가능성에 대한 추가 연구 필요.
다양한 LM 아키텍처와 적용 분야에 대한 PrivacyLens의 일반화 가능성 검증 필요.
크라우드소싱에 의존하는 데이터 수집 방식의 잠재적 편향성 고려 필요.
👍