Este artículo propone HiD-VAE, un nuevo marco para el aprendizaje de representaciones de ítems jerárquicamente disjuntas, con el fin de abordar los problemas de planitud semántica y entrelazamiento representacional causados por la tokenización no supervisada en los sistemas de recomendación generativa existentes. HiD-VAE alinea etiquetas de ítems multinivel y códigos discretos mediante un proceso de cuantificación jerárquica supervisada para generar identificadores más uniformes y disjuntos, e introduce pérdida de unicidad para penalizar directamente la redundancia del espacio latente, abordando así el problema del entrelazamiento representacional. Este enfoque logra una mayor precisión y diversidad en las recomendaciones, y demostramos su rendimiento superior al de los métodos más avanzados mediante experimentos en tres puntos de referencia disponibles públicamente.