Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ExpProof : Operationalizing Explanations for Confidential Models with ZKPs

Created by
  • Haebom

저자

Chhavi Yadav, Evan Monroe Laufer, Dan Boneh, Kamalika Chaudhuri

개요

본 논문은 기계 학습 모델에 대한 신뢰도 향상을 위해 사용되는 설명 가능성(explainability) 방법들이 상반된 이해관계를 가진 당사자들이 존재하는 적대적 환경에서는 조작될 가능성이 높아 제대로 기능하지 못한다는 문제를 다룹니다. 이를 해결하기 위해, 암호화 기술인 Zero-Knowledge Proofs (ZKPs)를 활용하여 인기 있는 설명 가능성 알고리즘인 LIME을 ZKP에 적합한 버전으로 변형하고, 신경망과 랜덤 포레스트 모델에서 성능을 평가합니다. GitHub에 공개된 코드를 통해 재현성을 확보합니다.

시사점, 한계점

시사점: 적대적 환경에서도 설명 가능성을 유지하기 위한 새로운 접근 방식 제시, ZKPs를 활용한 설명 가능성 방법의 실용성 검증, LIME 알고리즘의 ZKP 적용 가능성 확인.
한계점: 현재는 LIME 알고리즘에만 적용되었으며, 다른 설명 가능성 알고리즘으로의 확장 필요, ZKPs의 계산 비용 및 복잡성 문제, 실제 적용 환경에서의 성능 및 효율성에 대한 추가적인 연구 필요.
👍