इस पत्र में, हम मानव गतिविधि पहचान (HAR) की समस्याओं को हल करने के लिए बहु-ध्यान इंटरैक्शन तंत्र पर केंद्रित एक व्यापक अनुकूलन विधि का प्रस्ताव करते हैं, जैसे कि लेबल किए गए नमूनों की कमी, उच्च-आयामी सुविधा निष्कर्षण की कठिनाई और हल्के उपकरणों पर खराब प्रदर्शन। सबसे पहले, हम एक अप्रशिक्षित सीखने-आधारित प्रसार मॉडल का उपयोग करके डेटा वृद्धि करते हैं, और बहु-पैमाने की विशेषताओं को निकालने के लिए एक बहु-शाखा स्थानिक-समय इंटरैक्शन नेटवर्क डिज़ाइन करते हैं। यह लौकिक और स्थानिक ध्यान तंत्रों को एकीकृत करता है, और शाखाओं के बीच एक फीचर फ़्यूज़न इकाई के माध्यम से फ़ीचर प्रतिनिधित्व क्षमता को बढ़ाता है। अंत में, हम गतिशील रूप से हानि भार को समायोजित करते हैं और एक अनुकूली बहु-हानि फ़ंक्शन फ़्यूज़न रणनीति के माध्यम से मॉडल को अनुकूलित करते हैं। प्रस्तावित विधि तीन सार्वजनिक डेटासेट पर मौजूदा विधियों से बेहतर प्रदर्शन करती है: WISDM, PAMAP2, और OPPORTUNITY, और इसकी दक्षता और व्यवहार्यता को एम्बेडेड उपकरणों पर व्यावहारिक तैनाती के माध्यम से सत्यापित किया जाता है।