Bài báo này đề xuất THEME, một khuôn khổ mới để xây dựng các biểu diễn ngữ nghĩa của các chủ đề đầu tư từ dữ liệu văn bản, nhằm giải quyết những thách thức của đầu tư theo chủ đề, bao gồm việc cấu trúc danh mục đầu tư dựa trên các xu hướng cấu trúc. Chúng tôi nhấn mạnh sự thiếu sót của các mô hình nhúng mô hình ngôn ngữ quy mô lớn (LLM) hiện có trong việc nắm bắt các đặc điểm tinh tế của tài sản tài chính. Chúng tôi trình bày THEME, một khuôn khổ tinh chỉnh các nhúng thông qua học tương phản phân cấp. THEME sắp xếp các mối quan hệ phân cấp giữa các chủ đề và cổ phiếu cấu thành, đồng thời cải thiện các nhúng bằng cách kết hợp lợi nhuận cổ phiếu, tạo ra các biểu diễn hiệu quả để truy xuất các tài sản được sắp xếp theo chủ đề với tiềm năng lợi nhuận cao. Kết quả thực nghiệm chứng minh rằng THEME vượt trội hơn các LLM hàng đầu về khả năng truy xuất tài sản theo chủ đề và cũng vượt trội hơn các danh mục đầu tư được xây dựng. Kết hợp các mối quan hệ theo chủ đề văn bản với động lực thị trường của lợi nhuận, chúng tôi tạo ra các nhúng cổ phiếu được thiết kế riêng cho nhiều ứng dụng đầu tư thực tế.