Cet article propose un nouveau cadre d'apprentissage continu dans des scénarios impliquant plusieurs modalités (images, vidéo, audio, profondeur et texte). Pour surmonter les limites des méthodes d'apprentissage continu monomodales existantes, nous utilisons une approche qui entraîne des modèles alignant différentes modalités sur du texte. Pour résoudre le problème de l'oubli des connaissances existantes dû aux différences entre les modalités, nous présentons un cadre qui intègre les connaissances au sein des modalités et les informations intermodales pertinentes. Ce cadre autorégule les changements dans les représentations apprises pour intégrer progressivement les nouvelles connaissances et intègre sélectivement les connaissances acquises précédemment à partir des modalités en fonction de leurs interrelations, atténuant ainsi les interférences entre les modalités. De plus, nous introduisons une stratégie de réalignement des intégrations de modalités afin de corriger les biais d'alignement entre les modalités. Nous évaluons la méthode proposée sur un large éventail de scénarios d'apprentissage continu sur plusieurs ensembles de données utilisant différentes modalités, et démontrons expérimentalement qu'elle surpasse les méthodes existantes, que l'identité de la modalité soit spécifiée ou non.