यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र चीनी भाषा में हानिकारक सामग्री का पता लगाने के लिए एक व्यापक, विशेषज्ञ-सम्मिलित मानक प्रस्तुत करता है। मौजूदा हानिकारक सामग्री पहचान संसाधनों के अंग्रेज़ी पर केंद्रित होने और चीनी भाषा के डेटासेट के सीमित दायरे की चुनौतियों का समाधान करने के लिए, हमने एक मानक विकसित किया है जिसमें वास्तविक दुनिया के डेटा की छह प्रतिनिधि श्रेणियाँ शामिल हैं। एनोटेशन प्रक्रिया के माध्यम से, हम एलएलएम में चीनी भाषा की हानिकारक सामग्री का पता लगाने में सहायता के लिए एक विशेषज्ञ ज्ञान नियम आधार स्थापित करते हैं। इसके बाद, हम एक ज्ञान संवर्धन आधारभूत मॉडल प्रस्तावित करते हैं जो मानव-एनोटेटेड ज्ञान नियमों को एलएलएम के अंतर्निहित ज्ञान के साथ एकीकृत करता है, जिससे एक छोटा मॉडल अत्याधुनिक एलएलएम के बराबर प्रदर्शन प्राप्त कर सकता है। कोड और डेटा https://github.com/zjunlp/ChineseHarm-bench पर उपलब्ध हैं ।