Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

VeriSafe Agent: Safeguarding Mobile GUI Agent via Logic-based Action Verification

Created by
  • Haebom

作者

Jungjae Lee, Dongjae Lee, Chihun Choi, Youngmin Im, Jaeyoung Wi, Kihong Heo, Sangeun Oh, Sunjae Lee, Insik Shin

概要

本論文は、大規模基礎モデル(LFM)ベースのモバイルGUIエージェントの信頼性の問題を解決するために、正式な検証システムであるVeriSafe Agent(VSA)を提案します。 VSAは、自然言語ユーザ命令を形式的に検証可能な仕様に変換する自動書式化技術によって、エージェントの行動がユーザの意図と正確に一致することをリアルタイムで検証する。 GPT-4oを使用して実装され、18個のモバイルアプリで300個のユーザー命令を対象に評価した結果、従来の方法より30.00%-16.33%向上した94.33%-98.33%の精度を達成し、GUIエージェントの作業完了率を90%-130%向上させた。これは、LFMベースの行動と形式的なソフトウェア検証の間のギャップを解消する最初の試みです。

Takeaways、Limitations

Takeaways:
LFMベースのモバイルGUIエージェントの信頼性と安全性を大幅に向上させることができる新しい形式的な検証システムを提示します。
自動書式化技術により、自然言語命令を正式な仕様に効果的に変換できることを示しています。
実際のモバイルアプリでの実験結果を通じてVSAの優れた性能を検証。
LFMベースシステムの安全性を確保するための新しいパラダイム提示
Limitations:
現在GPT-4oに依存しており、他のLFMモデルに対する一般化可能性はさらなる研究が必要。
18のアプリと300のユーザーコマンドは、あらゆる種類のモバイルタスクを網羅するのに限られています。
自動書式化プロセスの正確性と完全性の追加検証が必要です。
複雑な状況や曖昧な自然言語命令の処理性能に関するさらなる研究が必要です。
👍