Sign In

HeTGB: A Comprehensive Benchmark for Heterophilic Text-Attributed Graphs

Created by
  • Haebom
Category
Empty

저자

Shujie Li, Yuxia Wu, Chuan Shi, Yuan Fang

개요

본 논문은 이질성(heterophily)을 보이는 텍스트 속성 그래프(TAGs)에 대한 연구가 부족함을 지적하며, 다양한 도메인의 실제 데이터로 구성된 새로운 벤치마크인 HeTGB를 제시합니다. HeTGB는 노드에 풍부한 텍스트 설명이 포함된 다섯 개의 실제 이질성 그래프 데이터셋으로 구성되며, GNN, 사전 훈련된 언어 모델(PLM), 그리고 공동 훈련 방법론의 노드 분류 성능을 체계적으로 평가할 수 있도록 합니다. 실험을 통해 이질성 그래프에서 텍스트 속성의 유용성을 보여주고, 기존 모델의 한계와 이질성 TAGs가 제기하는 과제를 분석하며, 그래프 구조와 텍스트 속성 간의 상호 작용에 대한 통찰력을 제공합니다. HeTGB는 공개적으로 배포되어 추가 연구를 촉진합니다.

시사점, 한계점

시사점:
이질성 텍스트 속성 그래프(TAGs)에 대한 새로운 벤치마크 HeTGB를 제공하여, 관련 연구를 활성화합니다.
이질성 그래프에서 텍스트 속성의 유용성을 실험적으로 입증합니다.
기존 GNN, PLM, 공동 훈련 방법론의 한계점을 분석하고, 향후 연구 방향을 제시합니다.
그래프 구조와 텍스트 속성 간의 상호 작용에 대한 통찰력을 제공합니다.
한계점:
HeTGB는 다섯 개의 데이터셋으로 구성되어 있으며, 더욱 다양하고 광범위한 데이터셋을 포함하는 것이 필요할 수 있습니다.
현재까지 제시된 방법론의 성능 향상을 위한 추가적인 연구가 필요합니다.
다양한 종류의 이질성 및 그 정도를 더욱 세분화하여 분석할 필요가 있습니다.
👍