Sign In
🧮

论证

使用语言模型的推理任务是目前人工智能领域重要且具有挑战性的领域之一。推理任务涉及分析信息并从中得出逻辑结论。这是一项更复杂的任务,超出了简单的信息检索或文本生成的范围。
Prompt : 57*32의 답은 무엇입니까?
🤖
57 和 32 相乘的结果是 1824。
我现在可以轻松解决这样简单的问题。让我们提出一个稍微困难的问题。
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.
🤖
让我们将给定数字中的奇数相加:
奇数:343、1、423、3、433、21、51
加起来:343 + 1 + 423 + 3 + 433 + 21 + 51 = 1675
因此,如果将给定数字中的奇数相加,就会得到 1675。
这是正确的吗?不。错误的。 “1275”是正确答案。为什么会出现这种情况?
语言模型,特别是大型语言模型(LLM),能够处理各种类型的数据并从复杂的上下文中提取含义。然而,这些模型在执行推理任务时仍然存在局限性。
基于文本的学习:语言模型主要使用句子、段落、对话等文本数据进行训练。这些数据主要反映语言的含义、上下文和语法,重点是语言含义而不是数值计算或精确的数学处理。
统计推断:语言模型使用统计方法来预测最可能的单词或句子。这个过程在识别和模仿语言模式方面很有效,但在执行复杂的数学计算或逻辑推理方面受到限制。
数据多样性和局限性:如果您的训练数据没有包含足够的数字运算或数学问题解决示例,您的模型可能难以处理这些类型的问题。
以语言为中心的设计:语言模型的设计主要是为了关注语言理解和生成,数学能力不是这些模型的主要目的或功能。
当然,对于研究人工智能的人来说,也不是就这样不管了。在GPT-4等中,这个问题是通过使用专门用于现有推理/计算的库进行编码来解决的。实际上在 GPT-4 上运行它可以解决问题,如下所示:
# 정의된 숫자들의 리스트 numbers = [242, 343, 232, 12, 1, 423, 3, 2, 433, 42, 21, 51, 26] # 홀수인 숫자들만 필터링 odd_numbers = [num for num in numbers if num % 2 != 0] # 홀수인 숫자들의 합계 계산 sum_of_odd_numbers = sum(odd_numbers) sum_of_odd_numbers --- output: 1275
需要更先进的即时工程技术来克服这些限制。即时工程是一种为模型提供更清晰、更具体的指令的技术,使其能够更准确地得出所需的信息或答案。例如,它涉及清楚地呈现复杂问题解决或决策所需的各种变量和条件,以便模型能够理解它们。在上面的例子中,可以这样使用。
变更前
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.
改变后
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음 홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.
💡
我们先区分一下奇数和偶数,然后将奇数按顺序相加:
奇数:343、1、423、3、433、21、51
奇数加法:343 + 1 + 423 + 3 + 433 + 21 + 51 = 1275
因此,如果将给定数字中的所有奇数相加,就会得到 1275。
我们只是改变了提示,但我们可以看到我们得出了正确的答案。当教某人某件事时,让他们按顺序一步一步地做可以让他们更快地理解,并且提高他们的工作质量。
使用语言模型进行推理仍然是一个发展中的领域,要有效地进行推理,您需要具有发出指令的能力。这些方法充分利用了模型的推理能力,可以帮助解决复杂的问题。
👩‍💻
🔨
ⓒ 2023。Haebom,保留所有权利。
经版权所有者许可,可以将其用于商业目的,但需注明来源。
👍