在本文中,我们介绍了面向任务的时间定位 (ToTG),这是一个新颖的问题,旨在识别长视频中包含执行特定任务所需信息的时间间隔。为此,我们提出了 ToTG Bench,这是一个用于评估 ToTG 性能的综合基准。此外,为了应对长视频处理的挑战,我们提出了基于增量推理的全新框架 TimeScope。TimeScope 首先识别可能包含关键时刻的粗时间间隔,并通过细粒度的时刻分割来细化这些时间间隔。最后,我们构建了高质量的数据集 ToTG Pile,以增强 TimeScope 的增量时间定位能力。实验结果表明,TimeScope 的性能始终优于现有的时间定位方法和多级学习模型 (MLLM)。