本論文は,推論時間の間に人間のフィードバックを通して大規模言語モデルを整列させる新しいアルゴリズムであるSimple Energy Adaptation(SEA)を提案した。従来の離散空間探索方式の限界を克服するために、SEAは、連続潜在空間における勾配ベースのサンプリングを通じて、基本方針の応答を最適な応答に直接調整する。 SEAはエネルギー関数に基づいて繰り返し最適化手順を実行し、シンプルで効果的なアライメントを可能にします。実験の結果、SEAはAdvBenchで最大77.51%、MATHで16.36%の相対的なパフォーマンス向上を示し、従来の方法を上回りました。