本論文は、インターネット上のスパム文字の指数関数的な増加に伴い、情報漏洩や社会的不安定などのリスクを軽減するための強力な検出メカニズムが必要であることを強調しています。この目的のために、スパム送信者の敵対的な戦略とラベル付きデータの不足という2つの主な課題を解決する新しいスパム文字検出フレームワークであるGCC-Spamを提案します。 GCC-Spamは、文字類似性ネットワーク、対照学習、GAN(Generative Adversarial Network)を統合して、文字難読化攻撃に対する耐性を高め、限られたデータ状況でも高い精度を達成します。実際のデータセットを使用した実験の結果、GCC-Spamは従来の方法よりも高い検出率を達成し、特に少量のラベル付きデータでも優れた性能を示すことを確認しました。