この論文は、継続学習(CL)環境で事前訓練されたビジョン言語モデルの適応性を向上させるChordPromptフレームワークを提案します。既存のプロンプト学習方法の制限であるクラス増分学習の集中と単一のモーダルプロンプトの使用を克服するために、ChordPromptは、視覚的およびテキスト的なプロンプト間の相互作用を利用するクロスモーダルプロンプトと、複数のドメインにわたる継続的な適応のためのドメイン適応型テキストプロンプトを導入します。マルチドメイン増分学習ベンチマークの実験の結果、ChordPromptはゼロショットの一般化とサブタスクのパフォーマンスで最先端の方法を上回ることを示しました。