Este artículo propone THEME, un novedoso marco para construir representaciones semánticas de temas de inversión a partir de datos textuales, con el fin de abordar los desafíos de la inversión temática, que implica la estructuración de carteras basadas en tendencias estructurales. Destacamos la insuficiencia de los modelos de incrustación de modelos de lenguaje a gran escala (LLM) existentes para captar las características específicas de los activos financieros. Presentamos THEME, un marco que perfecciona las incrustaciones mediante aprendizaje contrastivo jerárquico. THEME alinea las relaciones jerárquicas entre temas y acciones constituyentes, y mejora las incrustaciones incorporando la rentabilidad de las acciones, generando representaciones eficaces para recuperar activos alineados temáticamente con un alto potencial de rentabilidad. Los resultados empíricos demuestran que THEME supera a los principales LLM en la recuperación de activos temáticos y también a las carteras construidas. Combinando las relaciones temáticas textuales con la dinámica de rentabilidad del mercado, generamos incrustaciones de acciones diseñadas específicamente para diversas aplicaciones de inversión en el mundo real.