Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ExpProof : Operationalizing Explanations for Confidential Models with ZKPs

Created by
  • Haebom

저자

Chhavi Yadav, Evan Monroe Laufer, Dan Boneh, Kamalika Chaudhuri

개요

본 논문은 기계학습 모델에 대한 신뢰도를 높이기 위해 사용되는 설명 가능성(explainability) 방법들이, 상반된 이해관계를 가진 당사자들이 개입하는 적대적 환경에서는 조작될 가능성이 높아 제대로 작동하지 않는다는 문제점을 지적한다. 이에 본 연구는 암호화 기술인 영지식 증명(Zero-Knowledge Proofs, ZKPs)을 활용하여 적대적 환경에서도 작동 가능한 설명 가능성 방법을 제시한다. 특히, 널리 사용되는 설명 가능성 알고리즘인 LIME을 ZKP에 적용 가능하도록 변형하고, 신경망과 랜덤 포레스트 모델에 대한 성능을 평가한다. 소스 코드는 공개적으로 제공된다.

시사점, 한계점

시사점: 적대적 환경에서도 신뢰할 수 있는 기계학습 모델 설명을 제공하는 새로운 방법을 제시한다. 영지식 증명을 활용하여 설명의 신뢰성을 높이고 조작 가능성을 낮출 수 있다. LIME 알고리즘을 ZKP와 결합한 실제적인 구현 및 성능 평가를 제공한다.
한계점: 제안된 방법의 성능은 특정 모델(신경망, 랜덤 포레스트)과 설명 가능성 알고리즘(LIME)에 국한된다. 다른 모델이나 알고리즘으로의 확장성에 대한 추가 연구가 필요하다. 영지식 증명의 계산 비용이 높을 수 있으며, 실제 적용에 있어 효율성을 개선할 필요가 있다.
👍