Sign In
🤹

激活提示:通过多种示例提升性能

与传统的 CoT 方法相比,Active-Prompt 有几个重要的区别。传统的 CoT 方法依赖于固定的、人工注释的示例,而 Active-Prompt 则针对不同的任务动态应用特定的示例提示。 Active-Prompt 方法遵循以下步骤:
1.
不确定性估计:使用大规模语言模型(LLM),将特定任务的问题重复多次以生成多个可能的答案,然后使用不确定性度量计算每个问题的不确定性。使用的不确定性指标包括不一致答案的数量、熵和方差。
2.
选择:根据计算的不确定性选择最不确定的问题进行注释。
3.
注释:人工注释者提供推理过程和所选问题的答案以创建新的示例。
4.
推理:使用新注释的示例对每个问题进行推理,并选择最一致的答案。
Active Prompting with Chain-of-Thought for Large Language Models.pdf914.57KB
此过程通过测量不确定性来动态选择和注释信息最丰富的问题​​,从而最大限度地提高 LLM 的性能,而传统的 CoT 方法基于一组依赖于人工注释的固定示例。这种方法特别适合复杂的推理任务,并已被证明可以提高模型在各种任务中的适应性和准确性。
"영희가 장거리 하이킹을 위해 백팩을 싸고 있는데, 그녀는 무엇을 가져가야 할까요?"
语言模型生成多个推理路径并回答这个问题。例如,您可以创建远足用品列表或针对特定情况推荐装备。在生成的多个答案中,通过人工注释和推理过程来选择和细化不确定性较高的答案。
"철수가 10층짜리 호텔에서 방을 예약했습니다. 각 층에는 동일한 방이 10개씩 있는데, 모든 방을 사용할 수 있을까요?"
语言模型会生成该问题的多个答案,并选择最不确定的一个。例如,模型可能会回答:“最后一层无法使用,因此总共有 90 个房间可用。”
Active-Prompt方法的核心是在语言模型生成的众多答案中找到最不确定的答案,并通过人工注释对其进行强化,以获得更准确可靠的结果
🐒
⬆️
ⓒ 2023。Haebom,保留所有权利。
经版权所有者许可,可以将其用于商业目的,但需注明来源。
👍