본 논문은 기존 GNN 기반 심층 그래프 클러스터링 알고리즘에서 나타나는 표현 붕괴 문제를 해결하기 위해, 그래프 컷 관점에서 접근하는 새로운 프레임워크인 DCGC(Deep Cut-informed Graph embedding and Clustering)를 제안합니다. DCGC는 GNN을 사용하지 않고, (i) 컷 기반 그래프 임베딩 및 (ii) 최적 수송 이론 기반 자기 지도 학습 클러스터링 두 모듈로 구성됩니다. 임베딩 모듈은 그래프 구조와 속성 간의 결합된 정규화 컷을 최소화하여 컷 기반 그래프 임베딩 목표를 달성하며, 클러스터링 모듈은 최적 수송 이론을 활용하여 클러스터 할당을 얻고, 기존 방식의 '사전 학습된 클러스터 중심과의 근접성'에 대한 의존도를 줄입니다. 실험 결과, 제안된 DCGC가 기존 방법들보다 우수한 성능을 보임을 보여줍니다. 표현 붕괴 문제는 GNN의 귀납적 편향(인접 노드에 대한 유사한 표현 생성 경향)과 기존 클러스터링 손실 함수(모든 샘플을 사전 학습된 클러스터 중심에 가깝게 만들려는 경향)로 인해 발생한다는 점을 지적합니다.
시사점, 한계점
•
시사점:
◦
GNN 기반 심층 그래프 클러스터링 알고리즘의 표현 붕괴 문제에 대한 새로운 해결책 제시.
◦
GNN에 의존하지 않고 그래프 컷 관점에서 효과적인 그래프 클러스터링 프레임워크(DCGC) 제안.
◦
최적 수송 이론을 활용하여 클러스터 할당의 정확성 향상.
◦
간단하지만 효과적인 방법으로 기존 방법보다 우수한 성능 달성.
•
한계점:
◦
제안된 방법의 확장성 및 다양한 그래프 구조에 대한 일반화 성능에 대한 추가적인 연구 필요.