本文提出了一种名为“扩散课程”(DisCL)的新型数据增强方法,利用文本图像引导的扩散模型,以解决由于数据质量低下或不足而导致的深度神经网络训练挑战。为了克服仅使用基于文本的诱导方法无法控制合成图像与原始图像之间接近度的局限性,DisCL 通过图像诱导生成介于合成图像和真实图像之间的各种中间图像。DisCL 在每个训练步骤中调整图像诱导水平,以专注于具有挑战性的样本,并评估合成图像诱导的有效水平,以改进从具有挑战性的数据中学习的能力。这在长尾分类和低质量数据学习任务中取得了显著提升。在 iWildCam 数据集上,该方法分别将 OOD 和 ID 宏准确率提高了 2.7% 和 2.1%。在 ImageNet-LT 数据集上,该方法将尾部类别准确率从 4.4% 提升至 23.64%,并将整体类别准确率提升至 4.02%。