Sign In

A Binary Classification Social Network Dataset for Graph Machine Learning

Created by
  • Haebom
Category
Empty

저자

Adnan Ali, Jinglong Li, Huanhuan Chen, AlMotasem Bellah Al Ajlouni

개요

본 논문은 그래프 기계 학습을 위한 이진 분류 소셜 네트워크 데이터셋(BiSND)을 제시합니다. 기존의 벤치마크 데이터셋들은 클래스 수가 315개인 인용, 공동 발생, 전자상거래 네트워크 등으로 이진 분류 작업에 적합하지 않다는 문제점을 해결하고자 합니다. BiSND는 표 형태와 그래프 형태로 제공되어 다양한 기계 학습 알고리즘에 적용 가능하며, 의사결정 트리, K-최근접 이웃, 랜덤 포레스트, XGBoost와 같은 전통적인 머신러닝 알고리즘과 다층 퍼셉트론(MLP), 그래프 합성곱 네트워크(GCN), 그리고 BGRL, GRACE, DAENS와 같은 최첨단 그래프 대조 학습 방법을 포함한 다양한 분류기를 사용하여 실험을 수행합니다. 실험 결과, BiSND는 F1-score 67.6670.15를 달성하여 이진 분류 작업에 적합함을 보였으며 향후 개선 가능성을 시사합니다.

시사점, 한계점

시사점:
그래프 기계 학습을 위한 새로운 이진 분류 소셜 네트워크 데이터셋(BiSND) 제공
BiSND의 표 형태와 그래프 형태 데이터 제공으로 다양한 기계 학습 알고리즘 적용 가능성 확인
다양한 분류기를 활용한 실험을 통해 BiSND의 이진 분류 성능 검증 (F1-score 67.66~70.15 달성)
향후 그래프 기계 학습 연구에 활용 가능한 새로운 벤치마크 데이터셋 제시
한계점:
F1-score가 70%를 넘지 못하여 성능 향상의 여지가 있음
데이터셋의 규모나 다양성에 대한 자세한 설명 부족
사용된 분류기 외 다른 알고리즘에 대한 성능 평가 부족
데이터셋의 실제 소셜 네트워크 특성에 대한 상세한 설명 부족
👍