Sign In
0️⃣

零样本提示:理解并运用LLM功能

零样本(Zero-Shot)提示是指大规模语言模型,比如 GPT-3 这样的人工智能,即便没有提前看到任何特定示例或演示,也能完成特定任务的能力。这一功能使得人工智能通过学习多种数据,能够灵活地胜任各种任务。
零样本提示示例?
比如,我们以对特定文本进行情感分类这个任务为例。如果用户在没有任何说明的情况下输入“这本指南值得一看。”,语言模型会将其归类为“中立”。
在这个过程中,即使人工智能没有事先接收有关情感分类的具体示例,也能正确分析句子的情感。这正体现了零样本提示的核心功能。也就是说,不依赖任何预先资料,仅利用语言模型现有能力来解决问题,就叫做零样本。
零样本学习的发展
2022年,Jason Wei 在《FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERS》一文中提出的指令调优,让这个功能得到了进一步提升。
FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERS.pdf1.55MB

指令调优是通过对数据集进行微调,提高人工智能对指令的理解与执行能力。实际上,这正是 ChatGPT 的“自定义指令”功能所采用的方式。它能让用户无需每次都下达特别命令或给出引导,模型也能以零样本方式给出用户期望的回答。
此外,通过人类反馈进行的强化学习(RLHF)同样发挥着重要作用,这样人工智能模型才能更好地契合人类的偏好与指引,从而进一步提升。

转为一次性提示

零样本提示虽然很强大,但在复杂或细腻的任务中也有一定局限。这时,最好在提示中加入示例或演示,这被称为“一次性提示(One-shot Prompt)”。通过一次性提示,人工智能可以给出更加准确和详细的结果。
虽然表达起来可能拗口,其实就是说下指令时要一次说清楚,比如建议提供示例或标准。以我们前面说过的情感分类器为例,就可以这样实现。
작업: 문장의 감정 분류 예시 입력: "오늘은 정말 행복한 날이에요." 예시 출력: 긍정 기준: 긍정 - 만족, 기쁨, 흥미, 행복, 감사 등의 긍정적인 반응이 포함 부정 - 불만, 실망, 슬픔, 분노, 두려움 등의 감정이 드러나는 경우가 여기에 해당 중립 - 대개 정보를 전달하거나 질문하는 등 개인적인 감정이나 태도가 드러나지 않는 경우 해당 새로운 입력: "이번 프로젝트는 좀 걱정되네요." 출력: ?
只要正确地一次性输入提示,即使不是 GPT-3、GPT-4 这样的高阶模型,哪怕是能力有限的模型也能得到有意义的结果。以这种方式理解并活用人工智能的零样本提示功能,也为各行各业的应用打开了无限可能。
🔨
🙌
ⓒ 2023。Haebom,版权所有。
经版权所有者许可,可以将其用于商业目的,但需注明来源。