Cet article aborde le problème de la récupération de données dans l'apprentissage par imitation en quelques coups. Les méthodes existantes utilisent une heuristique de distance à une seule caractéristique pour récupérer les données, en supposant que la meilleure démonstration est celle qui se rapproche le plus de la démonstration cible dans l'espace visuel, sémantique ou d'action. Cependant, cette approche ne capture qu'une partie des informations pertinentes et peut introduire des démonstrations néfastes, comme la récupération de données de tâches sans rapport en raison de la similitude des scènes ou la sélection d'actions similaires dans des tâches ayant des cibles différentes. Dans cet article, nous présentons une méthode appelée COLLAGE (Collective Data Aggregation) pour l'apprentissage par imitation en quelques coups. Cette méthode utilise un mécanisme adaptatif de fusion tardive pour guider la sélection de démonstrations pertinentes en fonction d'une combinaison de plusieurs indices spécifiques à la tâche. COLLAGE utilise une seule caractéristique (par exemple, l'apparence, la forme ou la similarité linguistique) pour pondérer des sous-ensembles présélectionnés de l'ensemble de données, en attribuant des pondérations en fonction de la capacité d'une politique entraînée sur chaque sous-ensemble à prédire la tâche dans la démonstration cible. Ces pondérations sont ensuite utilisées lors de l'apprentissage des politiques pour réaliser un échantillonnage d'importance, en échantillonnant les données de manière plus ou moins dense ou plus éparse en fonction de la pertinence estimée. COLLAGE est général et indépendant des caractéristiques, ce qui lui permet de combiner n'importe quel nombre de sous-ensembles sélectionnés par n'importe quelle heuristique de recherche et d'identifier ceux qui offrent le plus d'avantages pour la tâche cible. Lors d'expériences approfondies, COLLAGE surpasse les méthodes de recherche et d'apprentissage multitâche de pointe de 5,1 % sur dix tâches de simulation et de 16,6 % sur six tâches de recherche réelles sur le jeu de données DROID à grande échelle.