Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Can Large Language Models Really Recognize Your Name?

Created by
  • Haebom

저자

Dzung Pham, Peter Kairouz, Niloofar Mireshghallah, Eugene Bagdasarian, Chau Minh Pham, Amir Houmansadr

개요

본 논문은 대규모 언어 모델(LLM)을 이용한 개인정보보호 솔루션의 한계를 지적한다. 현재 LLM 기반 개인정보보호 솔루션은 LLM이 개인 식별 정보(PII), 특히 이름과 같은 명명된 개체를 신뢰할 수 있게 탐지한다는 가정하에 개발되고 있지만, 본 논문에서는 모호한 문맥으로 인해 LLM이 이름을 오인식하거나 잘못 처리하는 체계적인 실패 사례를 보여준다. 이를 위해, 모호한 이름을 포함하는 벤치마크 데이터셋 AMBENCH를 제안하며, 실험을 통해 LLM이 모호한 이름을 탐지하는 정확도가 일반적인 이름보다 20~40% 낮고, 무해한 프롬프트 주입이 있을 경우 모호한 이름이 개인정보보호를 위한 요약에서 무시될 확률이 4배나 높다는 것을 밝힌다. 결론적으로 LLM에만 의존하는 개인정보보호의 위험성을 강조하고, LLM의 개인정보보호 실패 모드에 대한 체계적인 조사 필요성을 제기한다.

시사점, 한계점

시사점:
LLM 기반 개인정보보호 솔루션의 신뢰성에 대한 의문 제기 및 한계 규명
모호한 문맥에서의 LLM의 개인정보 탐지 실패 사례 제시
AMBENCH 데이터셋을 통한 LLM의 개인정보보호 성능 평가 기준 제시
LLM의 개인정보보호 실패 모드에 대한 추가 연구 필요성 강조
한계점:
AMBENCH 데이터셋의 범용성 및 일반화 가능성에 대한 추가 검증 필요
다양한 유형의 PII 및 더욱 복잡한 문맥에 대한 연구 확장 필요
LLM의 개인정보보호 실패 모드에 대한 보다 포괄적인 분석 필요
제안된 해결책이나 대안 제시 부족
👍