Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Innamark : une méthode de masquage d'informations par remplacement des espaces

Created by
  • Haebom

Auteur

Malte Hellmeier, Hendrik Norkowski, Ernst-Christoph Schrewe, Haydar Qarawlus, Falk Howar

Contour

Cet article présente Innamark, une nouvelle méthode permettant de masquer des informations dans un texte. Cette méthode répond à la difficulté croissante de distinguer le texte généré par des modèles linguistiques à grande échelle (MLH) du texte rédigé par l'homme. Contrairement aux méthodes existantes basées sur le langage ou le format, qui altèrent le sens du texte ou sont inapplicables au texte non formaté, Innamark permet de masquer toute séquence codée en octets dans un texte suffisamment long tout en préservant le sens du texte en remplaçant les espaces existants par des espaces Unicode visuellement similaires. L'algorithme propose une bibliothèque multiplateforme, des outils en ligne de commande et une interface web implémentée en Kotlin, permettant aux utilisateurs de configurer la compression, le chiffrement, le hachage et la correction d'erreurs en spécifiant la structure d'un message secret. Les résultats expérimentaux obtenus à partir d'un ensemble de données de 1 000 000 d'articles Wikipédia démontrent la robustesse d'Innamark et le caractère indétectable de son filigrane, lui-même indétectable par l'homme. Nous abordons également les limites de la capacité d'intégration et de la robustesse de l'algorithme, ainsi que les futures orientations de recherche.

Takeaways, Limitations

Takeaways:
Une nouvelle méthode de masquage d’informations (Innamark) qui surmonte les limites des méthodes existantes est présentée.
Mettre en œuvre une technique permettant de masquer des informations dans un texte sans en modifier le sens.
Accessibilité améliorée avec des bibliothèques multiplateformes, des outils de ligne de commande et une interface Web.
Flexibilité grâce aux capacités de compression, de cryptage, de hachage et de correction d'erreurs.
Les performances sont prouvées par une validation expérimentale utilisant une large gamme d’ensembles de données.
Limitations:
Limitations de la capacité d'intégration
Limites de la robustesse des algorithmes
Il existe des domaines d’amélioration grâce à des recherches futures (voir le document pour plus de détails).
👍