工业推荐系统的预排序阶段面临着效率与效果之间的根本冲突。虽然像目标注意力 (TA) 这样的强大模型擅长在排序阶段捕捉复杂的特征交互,但它们高昂的计算成本使其不适用于依赖于简单向量积模型的预排序。这种差异会给整个系统带来性能瓶颈。为了弥补这一差距,本文提出了一个全新的预排序框架 TARQ。受生成模型的启发,TARQ 的核心创新在于通过残差量化将一个近似 TA 的架构应用于预排序。这使得我们首次将 TA 的建模性能应用于对延迟至关重要的预排序阶段,从而在准确率和效率之间建立了一种全新的最佳平衡点。大量的线下实验和在淘宝上的大规模线上 A/B 测试证明了 TARQ 在排序性能方面的显著提升。目前,我们的模型已全面部署到生产环境中,服务于数千万日活跃用户,并带来了显著的业务改进。