Disentangling Neural Disjunctive Normal Form Models
Created by
Haebom
저자
Kexin Gu Baugh, Vincent Perreault, Matthew Baugh, Luke Dickens, Katsumi Inoue, Alessandra Russo
개요
신경 DNF(Disjunctive Normal Form) 기반 모델은 강력하고 해석 가능한 신경 기호 학습 방식으로, 사전 지식 없이도 분류 및 강화 학습에서 유망한 결과를 보여주었습니다. 그러나 학습 후 기호 변환 과정의 임계값 설정으로 성능이 저하됩니다. 본 논문은 변환 중 성능 저하의 원인 중 일부가 네트워크 가중치 형태로 표현된 학습된 지식의 분리 실패 때문임을 보여줍니다. 이 문제를 해결하기 위해 새로운 분리 방법을 제안합니다. 중첩 규칙을 인코딩하는 노드를 더 작은 독립 노드로 분리하여 모델의 성능을 더 잘 보존할 수 있습니다. 이진, 다중 클래스 및 다중 레이블 분류 작업(술어 발명이 필요한 작업 포함)에 대한 실험을 통해 제안된 분리 방법이 신경 DNF 기반 모델에 대해 간결하고 해석 가능한 논리적 표현을 제공하며, 변환 전 모델의 성능에 더 가까운 성능을 제공함을 보여줍니다. 코드는 https://github.com/kittykg/disentangling-ndnf-classification 에서 확인할 수 있습니다.