दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ऑनलाइन भ्रामक पैटर्न का स्वचालित रूप से पता लगाना

Created by
  • Haebom

लेखक

अस्मित नायक, शर्ली झांग, यश वानी, ऋषभ खंडेलवाल, कासेम फवाज़

रूपरेखा

यह शोधपत्र ऑटोबॉट फ्रेमवर्क प्रस्तुत करता है, जो डिजिटल इंटरफेस में भ्रामक पैटर्न की स्वचालित रूप से पहचान करता है और उन्हें कम करता है। ऑटोबॉट HTML कोड की आवश्यकता के बिना भ्रामक पैटर्न की सटीक पहचान और स्थानीयकरण के लिए वेबसाइट स्क्रीनशॉट का विश्लेषण करता है। विशिष्ट विज़न मॉडल और बड़े पैमाने के भाषा मॉडल (LLM) का उपयोग करने वाली एक दो-चरणीय पाइपलाइन, भ्रामक पैटर्न की पहचान करने के लिए वेबसाइट की दृश्य और पाठ्य विशेषताओं का विश्लेषण करती है। इसके अलावा, ऑटोबॉट का उपयोग "शिक्षक" LLM से ज्ञान निकालकर छोटे भाषा मॉडल को प्रशिक्षित करने के लिए किया जाता है, जिससे एक सिंथेटिक डेटासेट तैयार होता है। ऑटोबॉट को तीन उप-अनुप्रयोगों के रूप में कार्यान्वित किया जाता है: उपयोगकर्ताओं के लिए एक ब्राउज़र एक्सटेंशन, डेवलपर्स के लिए एक लाइटहाउस ऑडिट टूल, और शोधकर्ताओं और नियामकों के लिए एक मापन टूल, जो विभिन्न वेब हितधारकों का समर्थन करता है। मूल्यांकन परिणाम इसकी प्रभावशीलता को प्रदर्शित करते हैं, भ्रामक पैटर्न पहचान के लिए 0.93 का F1 स्कोर प्राप्त करते हैं।

Takeaways, Limitations

Takeaways:
एक नया फ्रेमवर्क (ऑटोबॉट) प्रस्तुत किया जा रहा है जो वेबसाइटों पर भ्रामक पैटर्न को प्रभावी ढंग से पहचान सकता है और उन्हें कम कर सकता है।
HTML कोड पर निर्भर हुए बिना, केवल स्क्रीनशॉट का उपयोग करके विश्लेषण संभव है।
उपयोगकर्ताओं, डेवलपर्स, शोधकर्ताओं और नियामकों सहित विभिन्न हितधारकों के लिए अनुप्रयोग उपलब्ध कराना।
उच्च सटीकता प्राप्त की (F1-स्कोर 0.93).
एलएलएम का उपयोग करके सिंथेटिक डेटासेट बनाने की एक विधि प्रस्तुत की गई है।
Limitations:
केवल विशिष्ट प्रकार के भ्रामक पैटर्न के लिए प्रदर्शन मूल्यांकन परिणाम प्रस्तुत किए गए हैं; विभिन्न प्रकार के भ्रामक पैटर्न के लिए सामान्यीकरण प्रदर्शन का सत्यापन आवश्यक है।
स्क्रीनशॉट-आधारित विश्लेषण में गतिशील वेब तत्व परिवर्तनों पर प्रतिक्रिया देने में सीमाएं हो सकती हैं।
एलएलएम के प्रदर्शन पर निर्भरता के कारण पूर्वाग्रह और त्रुटि की संभावना।
दीर्घकालिक धोखे के पैटर्न में परिवर्तन के प्रति अनुकूलनशीलता का अपर्याप्त मूल्यांकन।
👍