Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Efficient Knowledge Graph Unlearning with Zeroth-order Information

Created by
  • Haebom

저자

Yang Xiao, Ruimeng Ye, Bohan Liu, Xiaolong Ma, Bo Hui

개요

본 논문은 Right to be Forgotten과 같은 규제로 인해 모델에서 학습 데이터 및 그 영향을 제거하는 것에 대한 요구가 증가함에 따라, 전체 재학습의 비용 문제를 해결하기 위해 효율적인 지식 그래프(KG) 언러닝 알고리즘을 제시합니다. 지식 그래프의 독특한 구조와 엔티티 간의 의미 관계로 인해 KG 언러닝이 비자명적인 문제임을 지적하며, 제거된 구성 요소의 영향을 추정하여 언러닝하는 것은 대규모 지식 그래프에 적용될 때 상당한 계산 오버헤드를 초래합니다. 따라서, KG 언러닝을 위한 영향 함수를 정의하고, 매개변수 업데이트를 위한 1차 및 2차 도함수의 비용이 많이 드는 계산 없이 모델의 민감도를 근사화하는 방법을 제안합니다. 구체적으로, 테일러 전개를 사용하여 데이터 제거로 인한 매개변수 변화를 추정하고, 1차 기울기와 2차 도함수가 계산 부하를 지배한다는 점을 고려하여 피셔 행렬과 0차 최적화를 사용하여 계산 그래프를 구성하지 않고 역-헤시안 벡터 곱을 근사합니다. 실험 결과, 제안된 방법이 언러닝 효율성과 언러닝 품질 측면에서 기존 최첨단 그래프 언러닝 기준보다 상당히 우수함을 보여줍니다. 코드는 https://github.com/NKUShaw/ZOWFKGIF 에서 공개됩니다.

시사점, 한계점

시사점:
대규모 지식 그래프에서 효율적인 언러닝 알고리즘을 제시하여 Right to be Forgotten과 같은 규제 준수에 기여합니다.
피셔 행렬과 0차 최적화를 이용하여 계산 비용을 효과적으로 줄이는 새로운 방법을 제시합니다.
제안된 방법이 기존 방법보다 언러닝 효율성과 품질이 우수함을 실험적으로 증명합니다.
한계점:
제안된 방법의 성능은 테일러 전개의 근사 정확도에 의존하며, 특정 조건에서는 근사 오차가 커질 수 있습니다.
실험은 특정 지식 그래프 데이터셋에 국한되어 있으며, 다른 유형의 지식 그래프나 데이터셋에 대한 일반화 성능은 추가적인 연구가 필요합니다.
0차 최적화를 사용함으로써 발생할 수 있는 최적화 과정의 비효율성에 대한 분석이 부족합니다.
👍