Bài báo này đề xuất HiTeC, một khuôn khổ mới cho việc học tự giám sát trên siêu đồ thị được quy thuộc văn bản (TAHG). Chúng tôi nêu bật những hạn chế của các phương pháp học tương phản hiện có, vốn không sử dụng hiệu quả thông tin văn bản trong TAHG, bị nhiễu do tăng cường dữ liệu ngẫu nhiên và gặp khó khăn trong việc nắm bắt các phụ thuộc tầm xa. HiTeC bao gồm giai đoạn tiền huấn luyện bộ mã hóa văn bản sử dụng hàm mục tiêu tương phản nhận biết cấu trúc, tiếp theo là giai đoạn thứ hai sử dụng các chiến lược tăng cường nhận biết ngữ nghĩa như tăng cường văn bản được tăng cường bằng dấu nhắc và xóa siêu cạnh nhận biết ngữ nghĩa. Hơn nữa, chúng tôi đề xuất một hàm mất mát tương phản đa thang đo, có thể nắm bắt tốt hơn các phụ thuộc tầm xa thông qua độ tương phản cấp đồ thị con dựa trên phép đi bộ s. Thiết kế hai giai đoạn này tách biệt việc tiền huấn luyện bộ mã hóa văn bản khỏi việc học tương phản siêu đồ thị, do đó cải thiện khả năng mở rộng và duy trì chất lượng biểu diễn. Chúng tôi chứng minh hiệu quả của HiTeC thông qua các thử nghiệm mở rộng.