Este artículo aborda el problema de la agrupación de entidades autónomas. Dado que los métodos de agrupación existentes no tienen en cuenta la autonomía de las entidades, proponemos un marco de agrupación que la tiene en cuenta y que combina el Aprendizaje por Refuerzo (AR) y el Recocido Determinista (AD). Este marco utiliza la Red de Estimación de Distancia Adaptativa (ADEN), un modelo de atención basado en transformadores, para aprender las dependencias entre entidades. La metodología propuesta logra resultados que reflejan fielmente la dinámica de datos del mundo real sin modelar explícitamente la autonomía, superando significativamente a los métodos existentes que la ignoran.