इस शोधपत्र में, हम एक स्पैटियोटेम्पोरल जेनरेटिव एडवर्सरीयल नेटवर्क (STGAN)-आधारित मॉडल प्रस्तुत करते हैं जो 2020 में स्वीडन के गोथेनबर्ग में 42 ट्रैफ़िक कैमरों से डेटा का उपयोग करके ट्रैफ़िक विसंगतियों का सटीक रूप से पता लगाता है। STGAN ग्राफ़ न्यूरल नेटवर्क और लॉन्ग शॉर्ट-टर्म मेमोरी नेटवर्क को मिलाकर ट्रैफ़िक डेटा की जटिल स्थानिक और लौकिक निर्भरता को कैप्चर करता है। मिनटों की इकाइयों में वास्तविक समय के ट्रैफ़िक वॉल्यूम डेटा को वाहन घनत्व का प्रतिनिधित्व करने वाले प्रवाह संकेतकों में परिवर्तित किया जाता है, जिनका उपयोग मॉडल में इनपुट के रूप में किया जाता है। मॉडल को अप्रैल से नवंबर 2020 तक के डेटा के साथ प्रशिक्षित किया गया है और 14 से 23 नवंबर तक के डेटा के साथ मान्य किया गया है। परिणामस्वरूप, हम प्रदर्शित करते हैं कि मॉडल उच्च सटीकता और कम गलत सकारात्मक दर के साथ ट्रैफ़िक विसंगतियों (जैसे कैमरा सिग्नल आउटेज, विज़ुअल आर्टिफ़ैक्ट और चरम मौसम की स्थिति) का प्रभावी ढंग से पता लगाता है।