본 논문은 시간적 텍스트 속성 그래프(TTAG) 모델링을 위한 새로운 프레임워크인 CROSS를 제시합니다. 기존의 시간적 그래프 신경망(TGNN)은 텍스트 정보를 정적으로 포함하고 구조 정보에 치우친 인코딩 메커니즘에 의존하여 텍스트 의미의 시간적 진화와 의미와 구조 간의 상호 작용을 간과하는 한계를 가지고 있습니다. CROSS는 TTAG 모델링 과정을 시간적 의미 추출과 의미-구조 정보 통합 두 단계로 분해하여 이러한 문제를 해결합니다. 대규모 언어 모델(LLM)을 활용하여 노드의 텍스트 이웃의 시간적 진화하는 맥락을 이해하고, 시간적 의미 추출기를 통해 동적인 의미를 추출합니다. 이후 의미-구조 공동 인코더를 통해 의미와 구조 정보를 통합하고 상호 강화하는 표현을 생성합니다. 실험 결과, CROSS는 네 개의 공개 데이터셋과 하나의 산업용 데이터셋에서 최첨단 성능을 달성하였습니다.
시사점, 한계점
•
시사점:
◦
시간적 텍스트 속성 그래프(TTAG) 모델링을 위한 효과적인 프레임워크인 CROSS 제시.
◦
대규모 언어 모델(LLM)을 활용하여 텍스트의 시간적 의미를 동적으로 추출하는 새로운 방법 제시.
◦
의미와 구조 정보의 상호 강화를 통한 향상된 표현 학습.
◦
다양한 데이터셋에서 기존 방법 대비 성능 향상을 실험적으로 검증. 특히, 시간적 링크 예측 및 노드 분류 작업에서 상당한 성능 향상을 보임.