यह पेपर GLU अटेंशन का प्रस्ताव करता है, जो एक नया अटेंशन मैकेनिज्म है जो मौजूदा अटेंशन मैकेनिज्म के प्रदर्शन को बेहतर बनाने के लिए GLU (गेटेड लीनियर यूनिट्स) का उपयोग करता है। GLU अटेंशन मॉडल के प्रदर्शन और अभिसरण गति को बेहतर बनाने के लिए अटेंशन वैल्यू में गैर-रैखिकता लाता है, और अतिरिक्त मापदंडों के बिना इसकी कम्प्यूटेशनल लागत न्यूनतम होती है। यह टेक्स्ट और विज़न मोडैलिटी में प्रभावी साबित हुआ है, और फ्लैश अटेंशन, RoPE और GQA जैसी अन्य तकनीकों के साथ एकीकृत करना भी आसान है। इसे GitHub पर ओपन सोर्स के रूप में जारी किया गया है।