Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models

Created by
  • Haebom

저자

Siwei Zhang, Yun Xiong, Yateng Tang, Xi Chen, Zian Jia, Zehao Gu, Jiarong Xu, Jiawei Zhang

개요

본 논문은 시간적 그래프 신경망(TGNNs)을 시간적 텍스트 속성 그래프(TTAGs) 모델링에 적용하는 새로운 프레임워크인 CROSS를 제시합니다. 기존 TGNNs는 텍스트 정보를 정적으로 처리하고 구조 정보에 치우친 인코딩 메커니즘을 사용하는 한계가 있습니다. CROSS는 TTAG 모델링 과정을 시간적 의미 추출 및 의미-구조 정보 통합 두 단계로 나누어, 대규모 언어 모델(LLMs)을 활용하여 텍스트의 시간적 의미를 동적으로 추출하고 의미와 구조 정보를 통합하여 표현합니다. 특히, 시간적 의미 추출기(Temporal Semantics Extractor)를 통해 노드의 진화하는 텍스트 이웃 정보에 대한 시간적 의미를 파악하고, 의미-구조 공동 인코더(Semantic-structural Co-encoder)를 통해 의미 및 구조 정보를 공동으로 고려하여 상호 강화하는 표현을 생성합니다. 실험 결과, CROSS는 네 개의 공개 데이터셋과 하나의 산업용 데이터셋에서 최첨단 성능을 달성했습니다.

시사점, 한계점

시사점:
기존 TGNNs의 한계를 극복하고 시간적 텍스트 속성 그래프(TTAGs) 모델링에 효과적인 새로운 프레임워크 CROSS 제시
대규모 언어 모델(LLMs)을 활용하여 텍스트의 시간적 의미를 동적으로 추출하는 새로운 방법 제시
의미와 구조 정보의 상호 강화를 통해 더욱 정확한 표현 생성
시간적 링크 예측 및 노드 분류 작업에서 기존 최고 성능을 상당히 능가하는 결과 달성 (평균 24.7%의 MRR 증가 및 3.7%의 AUC 증가)
한계점:
제안된 프레임워크의 계산 복잡도 및 확장성에 대한 추가적인 분석 필요
다양한 유형의 TTAGs에 대한 일반화 성능 평가 필요
사용된 LLM의 특성이 결과에 미치는 영향에 대한 자세한 분석 필요
산업용 데이터셋의 특징과 일반화 가능성에 대한 논의 필요
👍