Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

From Individual Learning to Market Equilibrium: Correcting Structural and Parametric Biases in RL Simulations of Economic Models

Created by
  • Haebom

作者

Ruxin Chen, Zeqiang Zhang

概要

強化学習(RL)を経済モデリングに適用すると、平衡理論の仮定と学習エージェントの出現行動との間に根本的な衝突が発生することがわかりました。標準のRLエージェントは環境を操作する傾向があります。本論文は,凹型生産性を持つナビゲーションマッチングモデルにおいて,標準RLエージェントが非平衡,単一バイヤー方針を学習することを示した。また、経済的割引とRLの時間的費用処理方式の不一致によるパラメータ偏りを確認しました。 2つの問題を解決するために、代表的なエージェントを固定マクロ経済環境に含め、コストの機会コストを反映するようにコスト関数を調整する補正された平均フィールド強化学習フレームワークを提案します。この反復アルゴリズムは、エージェントの方針が競合的平衡に一致する自己一貫した固定点に収束する。

Takeaways、Limitations

標準RLエージェントは経済モデルで環境を操作する傾向があり、平衡理論と衝突する。
経済的割引とRLの時間的費用処理方式の不一致によるパラメータ偏りを確認しました。
校正された平均フィールド強化学習フレームワークを提案し、これらの問題を解決し、競合的平衡に収束するモデルを提案しました。
提案された方法論は、計算社会科学の分野で経済システム内の学習エージェントをモデル化するための実用的で理論的に健全なアプローチを提供します。
Limitationsでは、モデルの特定の仮定(凹面生産性、ナビゲーションマッチングモデルなど)が他の経済モデルに適用されるときの一般化の可能性に関するさらなる研究が必要になる場合があります。
アルゴリズムの収束性と計算の複雑さのさらなる分析が必要な場合がある。
👍