Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Learning neuro-symbolic convergent term rewriting systems

Created by
  • Haebom

作者

Flavio Petruzzellis, Alberto Testolin, Alessandro Sperduti

概要

本論文は、シンボリックアルゴリズムを実行するように学習するニューラルネットワークシステムを構築するという人工知能の分野における困難な問題、特に強力な一般化と分布外のパフォーマンスを目指すときの問題を扱います。この目的のために、書き換えアルゴリズム自体に触発された神経記号アーキテクチャを使用して収束する抗書き換えシステムを学習するための一般的なフレームワークを提示します。神経書き換えシステム(NRS)と高速神経書き換えシステム(FastNRS)の2つのモジュラー実装を提供し、アルゴリズムに触発された設計とコアアーキテクチャ要素のおかげで、両方のモデルを分布外インスタンスとして一般化できます。 FastNRSは、メモリ効率、学習速度、および推論時間の面で大幅な改善を提供します。数学式の簡略化を含む4つのタスクについて2つのアーキテクチャを評価し、単一モデルが複数の種類の問題を同時に解決するように学習するマルチドメイン学習シナリオで、その多様性をさらに示します。提案されたシステムは、ニューラルデータルータ(アルゴリズムの問題を解決するように特別に設計された最近のトランスデューサバリアント)とGPT-4o(最も強力な汎用大規模言語モデルの1つ)の2つの強力な神経基準モデルよりもはるかに優れたパフォーマンスを示しています。また、推論ベンチマークで優れたパフォーマンスを発揮するOpenAIの最新のo1-previewモデルと同等またはそれ以上のパフォーマンスを示しています。

Takeaways、Limitations

Takeaways:
アルゴリズムに触発された神経記号アーキテクチャを介して収束する抗書き換えシステムを学習するための新しいフレームワークを提示します。
分布外一般化性能を示すNRSとFastNRSの2つのモデル提示FastNRSは、メモリ効率、学習速度、推論時間の向上。
数学式の簡略化とマルチドメイン学習における既存の最先端モデル(Neural Data Router、GPT-4o、OpenAI o1-preview)を凌駕する性能。
Limitations:
提示されたフレームワークの一般性と適用性に関するさらなる研究の必要性。
様々なタイプの記号アルゴリズムに対する適用性評価が必要
特定の種類の問題に対する過適合性と解決策に関するさらなる研究が必要
👍