Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Learning to Decide with Just Enough: Information-Theoretic Context Summarization for CMDPs

Created by
  • Haebom

作者

Peidong Liu, Junjiang Lin, Shaowen Wang, Yao Xu, Haiqing Li, Xuhao Xie, Siyi Wu, Hao Li

概要

Contextual Markov Decision Processes(CMDP)環境では、大規模言語モデル(LLM)を活用して、高次元/非定型コンテキストを低次元の意味論的要約に圧縮する情報理論的要約アプローチを提案します。この方法は、意思決定に重要な手がかりを維持しながら、冗長性を減らし、状態を強化します。近似コンテキストの十分性の概念に基づいて、CMDPの最初の後悔境界と遅延エントロピーのトレードオフ特性評価を提供します。さまざまなベンチマークで既存の方法を上回り、補償、成功率、サンプル効率を向上させ、遅延時間とメモリ使用量を削減します。

Takeaways、Limitations

Takeaways:
LLMベースの要約により、コンテキストが豊富でリソースが制限された環境で効率的な意思決定を行うためのスケーラブルで解釈可能なソリューションを提供します。
CMDPの後悔境界と遅延-エントロピートレードオフの特徴付けを初めて提供します。
さまざまな環境でパフォーマンスの向上を実証しました。
Limitations:
論文に記載されているLimitationsは直接提示されていません。 (提供された情報に限定)
👍