本文提出了一种可扩展的替代方案,用于大规模非结构化离散空间中的贝叶斯优化。具体而言,我们提出了一种基于汤普森采样的方法,以解决由于梯度缺失导致的最大化增益函数的计算成本问题。汤普森采样直接参数化候选者获得最大奖励的概率,并利用嵌入在基于提示的大规模语言模型中的先验知识,逐步调整后验概率。我们提出的方法,即基于微调的汤普森采样 (ToSFiT),推导出了一种新的变分汤普森采样的遗憾边界,并从理论上证明了它能够提供标准汤普森采样的强保证。ToSFiT 在三个不同的任务上进行了实验验证:改进常见问题解答、搜索热稳定蛋白质和设计量子电路,证明了通过在线微调显著提高了采样效率。