본 논문은 텍스트 속성이 있는 하이퍼그래프(TAHGs)에서의 자기 지도 학습을 위한 새로운 프레임워크인 HiTeC를 제안합니다. 기존의 대조 학습 기반 방법들이 TAHGs의 텍스트 정보를 효과적으로 활용하지 못하고, 무작위 데이터 증강으로 인한 노이즈, 장거리 의존성 포착의 어려움 등의 한계를 지닌다는 점을 지적합니다. HiTeC는 구조 인식 대조 목적 함수를 사용한 텍스트 인코더 사전 학습 단계와, 프롬프트 향상 텍스트 증강 및 의미 인식 하이퍼엣지 삭제 등의 의미 인식 증강 전략을 활용하는 두 번째 단계로 구성됩니다. 또한, s-walk 기반 하위 그래프 수준 대조를 통해 장거리 의존성을 더 잘 포착하는 다중 스케일 대조 손실 함수를 제안합니다. 이러한 두 단계 설계를 통해 텍스트 인코더 사전 학습과 하이퍼그래프 대조 학습을 분리하여 확장성을 높이고 표현 품질을 유지합니다. 광범위한 실험을 통해 HiTeC의 효과를 확인했습니다.