बड़े आधार मॉडल (LFM) पर आधारित मोबाइल GUI एजेंटों की विश्वसनीयता संबंधी समस्याओं के समाधान हेतु, यह शोधपत्र एक औपचारिक सत्यापन प्रणाली, वेरीसेफ एजेंट (VSA) का प्रस्ताव करता है। VSA स्वचालित रूप से प्राकृतिक भाषा उपयोगकर्ता आदेशों को औपचारिक रूप से सत्यापन योग्य विनिर्देशों में औपचारिक रूप देता है, जिससे वास्तविक समय में यह सत्यापित करना संभव हो जाता है कि एजेंट व्यवहार उपयोगकर्ता के इरादे को सटीक रूप से दर्शाते हैं। GPT-4o का उपयोग करके कार्यान्वित, VSA ने 18 मोबाइल ऐप्स के 300 उपयोगकर्ता आदेशों पर 94.33%-98.33% की सटीकता प्राप्त की, जो मौजूदा विधियों की तुलना में 30.00%-16.33% का सुधार है, और GUI एजेंटों के लिए कार्य पूर्णता दर में 90%-130% का सुधार है। यह LFM-आधारित व्यवहार और औपचारिक सॉफ़्टवेयर सत्यापन के बीच की खाई को पाटने का पहला प्रयास है।