दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

वेरीसेफ एजेंट: तर्क-आधारित क्रिया सत्यापन के माध्यम से मोबाइल GUI एजेंट की सुरक्षा

Created by
  • Haebom

लेखक

जंगजे ली, डोंगजे ली, चिहुन चोई, यंगमिन इम, जेयॉन्ग वाई, किहोंग हेओ, संगेउन ओह, सुनजे ली, इंसिक शिन

रूपरेखा

बड़े आधार मॉडल (LFM) पर आधारित मोबाइल GUI एजेंटों की विश्वसनीयता संबंधी समस्याओं के समाधान हेतु, यह शोधपत्र एक औपचारिक सत्यापन प्रणाली, वेरीसेफ एजेंट (VSA) का प्रस्ताव करता है। VSA स्वचालित रूप से प्राकृतिक भाषा उपयोगकर्ता आदेशों को औपचारिक रूप से सत्यापन योग्य विनिर्देशों में औपचारिक रूप देता है, जिससे वास्तविक समय में यह सत्यापित करना संभव हो जाता है कि एजेंट व्यवहार उपयोगकर्ता के इरादे को सटीक रूप से दर्शाते हैं। GPT-4o का उपयोग करके कार्यान्वित, VSA ने 18 मोबाइल ऐप्स के 300 उपयोगकर्ता आदेशों पर 94.33%-98.33% की सटीकता प्राप्त की, जो मौजूदा विधियों की तुलना में 30.00%-16.33% का सुधार है, और GUI एजेंटों के लिए कार्य पूर्णता दर में 90%-130% का सुधार है। यह LFM-आधारित व्यवहार और औपचारिक सॉफ़्टवेयर सत्यापन के बीच की खाई को पाटने का पहला प्रयास है।

Takeaways, Limitations

Takeaways:
हम एक नवीन औपचारिक सत्यापन प्रणाली प्रस्तुत करते हैं जो LFM-आधारित मोबाइल GUI एजेंटों की विश्वसनीयता और सुरक्षा में महत्वपूर्ण सुधार कर सकती है।
हम यह प्रदर्शित करते हैं कि स्वचालित औपचारिकीकरण तकनीकें प्राकृतिक भाषा आदेशों को प्रभावी रूप से औपचारिक विनिर्देशों में परिवर्तित कर सकती हैं।
वीएसए के बेहतर प्रदर्शन को वास्तविक मोबाइल ऐप्स में प्रयोगात्मक परिणामों के माध्यम से सत्यापित किया गया है।
एलएफएम-आधारित प्रणालियों की सुरक्षा सुनिश्चित करने के लिए एक नया प्रतिमान प्रस्तुत करना।
Limitations:
वर्तमान में GPT-4o पर निर्भर होने के कारण, अन्य LFM मॉडलों के लिए सामान्यीकरण हेतु और अधिक शोध की आवश्यकता है।
18 ऐप्स और 300 उपयोगकर्ता कमांड के साथ, यह सभी प्रकार के मोबाइल कार्यों को कवर करने के लिए पर्याप्त नहीं हो सकता है।
स्वचालित स्वरूपण प्रक्रिया की सटीकता और पूर्णता का आगे सत्यापन आवश्यक है।
जटिल परिस्थितियों या अस्पष्ट प्राकृतिक भाषा आदेशों के लिए प्रसंस्करण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
👍