Chain-of-Thought (CoT)

前述のZero-shotを定義したJason Weiが2022年に発表したChain-of-Thoughtという手法があります。名前からも分かるように、これは連鎖プロンプトと関連しています。多少の違いは、中間推論のステップを意図的に挟むことで、より良い結果を引き出す点です。これは、細かな思考過程が必要な複雑な作業で特に効果を発揮します。

ChainofThought Prompting Elicits Reasoning in Large Language Models.pdf870.87KB

CoT Promptingの利点

•

多段階問題の分解：CoTによって、モデルは多段階の問題を中間段階に分解でき、より多くの推論ステップが求められる課題に追加の計算を割り当てることができます。

•

モデルの挙動の解釈可能性：CoTは、モデルが特定の答えにたどり着く過程の解釈の窓を与え、推論の過程で誤りが生じた箇所のデバッグも可能にします。

•

多様なタスクへの適用性：CoT推論は、数学問題、常識的推論、象徴的な操作といったタスクに活用でき、原則として人間が言語を通じて解決できるすべてのタスクに適用可能です。

•

大規模な言語モデルでの容易な誘導：十分に大きな既存の言語モデルにCoTシーケンスの例を加えるだけで、簡単にCoT推論が引き出せます。

例を挙げましょうか？先ほどの論証パートでお見せした例です。

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음
홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.

与えられた数字を奇数と偶数で分け、奇数の数字を順に足してみましょう：

奇数：343、1、423、3、433、21、51
奇数の合計：343 + 1 + 423 + 3 + 433 + 21 + 51 = 1275

したがって、与えられた数字の中から奇数をすべて足すと1275になります。

ここで「奇数と偶数で分け、奇数の数字をすべて足しましょう。これを順番に進めてください。」という部分が、一連の作業を段階的に分割して指示したものです。以前この方法が注目され始めた頃、「段階的に」や「順を追って」とstep-by-stepで求めることで、より良い結果が得られると言われていました。

もちろん、CoTの手法にも分かりやすい限界があります。簡単に言えば、十分な知識量を持つ大きなモデルでのみ効果を発揮するということです。つまり、sLMのようなパラメータ数が少ないモデルでは、CoTはほとんど性能を出せません。この場合はFew-shotまたはOne-shotの方が良い結果を示します。

CoTの限界

•

モデル規模への依存：CoT Promptingは、主に大規模モデル（約70Bパラメータ）でのみ顕著な性能向上が見られます。小規模なモデルでは、CoTは効果がなかったり、標準的なプロンプトよりも成績が悪いこともあります。

•

制約：CoTは人間の推論者の思考プロセスを模倣していますが、これがニューラルネットワークが実際に「推論」しているかどうかは依然不明です。また、例を手作業でCoTに拡張するコストは低い一方で、微調整のためのアノテーションコストが大きくなる可能性もあります。CoTは必ずしも正しい推論経路を保証せず、実運用で大規模モデルを使うコストが高い点にも注意が必要です。

それでもなお、CoT Promptingは言語モデルを活用した様々なタスクで推論力を高める効果的な方法です。そもそも、私たちユーザーに提供されているモデルは今やほぼ100B規模が多いため、このやり方は有効に機能しています。

出典を明示し、著作権者の許可の下で営利目的でも使用できます。

Made with Slashpage