Cet article présente un nouveau cadre permettant de consolider les invites de jailbreak antagonistes multi-tours en requêtes mono-tour, réduisant ainsi considérablement l'effort manuel requis pour les tests antagonistes des modèles de langage à grande échelle (LLM). Les jailbreaks humains multi-tours ont montré des taux de réussite d'attaque élevés, mais nécessitent des ressources humaines et un temps considérables. La méthode multi-tours-mono-tour (M2S) proposée (Hyphenize, Numberize, Pythonize) reformate systématiquement les conversations multi-tours en invites structurées mono-tour. Malgré l'élimination des interactions répétitives, ces invites maintiennent et améliorent souvent l'efficacité antagoniste. Lors d'évaluations approfondies sur l'ensemble de données Multi-turn Human Jailbreak (MHJ), la méthode M2S atteint des taux de réussite d'attaque allant de 70,6 % à 95,9 % sur plusieurs LLM de pointe. Il est remarquable de constater que les invites mono-tour surpassent l'attaque multi-tours initiale jusqu'à 17,5 points de pourcentage et réduisent l'utilisation moyenne des jetons de plus de moitié. Une analyse plus approfondie révèle que l'intégration de requêtes malveillantes dans des structures telles que des énumérations ou des codes exploite les « angles morts contextuels » pour contourner les protections de base et les filtres d'entrée/sortie externes. Le framework M2S transforme les conversations à plusieurs tours en invites concises à un seul tour, offrant ainsi un outil évolutif pour les tests contradictoires à grande échelle et révélant une faiblesse critique des défenses LLM modernes.