Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Corporate Fraud Detection in Rich-yet-Noisy Financial Graph

Created by
  • Haebom

저자

Shiqi Wang, Zhibo Zhang, Libing Fang, Cam-Tu Nguyen, Wenzhong Li

개요

본 논문은 기업의 부정 행위 탐지, 특히 재무제표 조작이나 불법 내부자 거래와 같은 불법 행위를 자동으로 인식하는 것을 목표로 한다. 기존의 학습 기반 방법들은 기업 네트워크 내의 풍부한 상호 작용을 효과적으로 통합하지 못하는 한계를 가지고 있다. 이를 해결하기 위해, 연구진은 18년간의 중국 기업 재무 기록을 수집하여 부정 행위 레이블이 있는 세 개의 그래프 데이터셋을 구성하였다. 분석 결과, 두 가지 중요한 문제점이 발견되었는데, 첫째는 정보 과부하로, 기업 노드보다 (잡음이 많은) 비기업 노드가 지배적이어서 그래프 합성곱 네트워크(GCN)의 메시지 전달 과정을 방해한다는 점이다. 둘째는 숨겨진 부정 행위로, 수집된 데이터에는 상당한 비율의 탐지되지 않은 위반 행위가 존재할 가능성이 있다는 점이다. 이러한 숨겨진 부정 행위는 훈련 데이터셋에 잡음 레이블을 도입하여 부정 행위 탐지 결과를 저해한다. 이러한 과제를 해결하기 위해, 지식 그래프 임베딩을 활용하여 정보 과부하를 완화하고 풍부한 표현을 효과적으로 학습하는 지식 강화 GCN과 강력한 2단계 학습 (${\rm KeGCN}{R}$)이라는 새로운 그래프 기반 방법을 제안한다. 제안된 모델은 숨겨진 부정 행위에 대한 강력성을 높이기 위해 2단계 학습 방법을 채택한다. 광범위한 실험 결과는 상호 작용의 중요성을 확인할 뿐만 아니라, 부정 행위 탐지 효과와 강력성 측면에서 여러 강력한 기준 모델보다 ${\rm KeGCN}{R}$의 우수성을 보여준다.

시사점, 한계점

시사점:
기업 네트워크 내 상호 작용의 중요성을 강조하고, 이를 효과적으로 통합하는 방법을 제시하였다.
숨겨진 부정 행위 문제를 고려한 강건한 2단계 학습 방법을 제안하여 부정 행위 탐지 성능을 향상시켰다.
지식 그래프 임베딩을 활용하여 정보 과부하 문제를 해결하고 효과적인 표현 학습을 가능하게 하였다.
제안된 ${\rm KeGCN}_{R}$ 모델이 기존 방법들보다 우수한 성능을 보임을 실험적으로 증명하였다.
한계점:
사용된 데이터셋이 중국 기업의 재무 기록에 국한되어 있어, 다른 국가나 산업 분야로의 일반화 가능성에 대한 검토가 필요하다.
숨겨진 부정 행위의 정확한 비율을 정량적으로 측정하기 어려우며, 이로 인해 모델의 강건성 평가에 제한이 있을 수 있다.
${\rm KeGCN}_{R}$ 모델의 복잡성으로 인해 계산 비용이 증가할 수 있다.
👍