Share
Sign In
🧊

Self-Consistency on Prompt

自己一貫性は、人工知能言語モデルの推論能力を向上させる新しい技術です。既存の連鎖思考(Chain of Thought、CoT)方式を改善し、さまざまな推論経路を作成し、その中で最も一貫した答えを選択します。この方法は、複雑な算術的推論や常識的な論理問題に有効です。
この技術は、Xuezhi Wangが2023年に発表した「Self-Consistency Improves Chain of Thought Reasoning in Language Models」研究で提案されました。
SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS.pdf823.42KB

自己一貫性の仕組み

さまざまな推論パスを作成する:複数の短いCoTプロンプトを使用してさまざまな推論パスを生成します。
一貫した回答の選択:生成されたパスの中で最も一貫性のある回答を識別して選択します。
結果の集計:複数の推論パスを統合して最終回答を導きます

従来のCoT方式との違い

CoT方式は、直接的な答えの代わりに推論プロセスを段階的に説明するようにモデルを導きます。一方、自己一貫性は、これらのCoT方式に基づいて複数の推論経路を生成し、その中で最も一貫性のある結果を選択する方法に拡張されました。

実際の活用法

今回も数学問題があるとチップしましょう。問題は次のとおりです。
❓
「ヨンヒは60kmの自転車旅行中に2回停車しました。最初の停車は20km後に行われ、2番目の停車は旅行の終わりの15km前に行われました。
通常、プロンプトに入力すると、このように表示されます。
🤖
ヨンヒは合計60kmを旅行しました。最初の停車後、60 - 20 = 40kmを旅行しました。したがって、答えは40キロです。
やはり間違ってしまいました。とにかく簡単な減算問題なのにLLMの友達には容易ではなかったようです。これを自己一貫性モデルで解くようにしましょう。
🤖
推論ルート1:「ヨンヒは合計60kmを旅行しました。最初の停車は20km後、2番目の停車は15km前でした。答えは25kmです。」
推論ルート2:「60kmの旅行の最初の停車は20km、2番目の停車は60 - 15 = 45kmです。最初と2番目の停車の間の距離は45 - 20 = 25kmです。答えは25kmです。」
2つの推論の両方が正解を語っています。これを使ったのが自己一貫性技法です。これをより簡単に例に挙げると、次のようになります。
Q: ヨンヒは60kmの自転車旅行の間に最初の停車を20km後にしました。最初の停車後、彼女が旅した通りはいくらですか?
A: ヨンヒは最初の停車を20km後にしました。したがって、最初の停車後の残りの距離は60 - 20 = 40kmです。
Q:ヨンヒの2番目の停車は、旅の終わりの15km前に行われました。全旅行距離から2番目の停車までの距離はいくらですか?
A:旅行の終わりの15km前に2番目の停車地がありました。したがって、全旅行距離から2番目の停車地までの距離は60 - 15 = 45kmです。
Q:最初と停車の間の距離はいくらですか?
A:最初の停車後の残りの距離は40km、2番目の停車までの距離は45マイルです。したがって、2つの停車間の距離は45 - 20 = 25kmです。
どんな違いなのか分かりますか?
「ヨンヒは60kmの自転車旅行中に2回停車しました。最初の停車は20km後に行われ、2番目の停車は旅行の終わりの15km前に行われました。
という文章を分節して別々に回答をしながら問題を解くようにしたのです。これにより、GPT-3、LLaMA2、Claudeなどで解決できなかった問題が解決されることが確認でき、今後の思考木技法と併用すると、CoTの欠点があったモデル規模によるギャップをある程度克服できるようになります。
⛓️
🌳
ⓒ 2023. Haebom, all rights reserved.
ソースを表示し、著作権者の許可の下で営利目的で使用することができます。
👍