Cet article présente « Policy Maps », une approche novatrice pour concevoir efficacement des politiques dans le vaste espace comportemental des modèles de langage à grande échelle (MLL). Inspirée de la cartographie physique, cette méthode facilite une exploration efficace grâce à des choix de conception délibérés concernant les aspects à capturer et ceux à abstraire, plutôt que de tenter d'englober tous les comportements. L'outil interactif « Policy Projector » permet aux utilisateurs d'explorer le paysage des paires entrée-sortie des MLL, de définir des zones définies par l'utilisateur (par exemple, « violence ») et d'explorer ces zones à l'aide de règles de politique conditionnelles applicables aux sorties des MLL (par exemple, si la sortie contient « violence » et « détails graphiques », réécrire sans « détails graphiques »). Il prend en charge les capacités de classification et de pilotage des MLL, ainsi que les visualisations cartographiques reflétant le travail des praticiens de l'IA. Des évaluations menées auprès de 12 experts en sécurité de l'IA démontrent son efficacité dans la rédaction de politiques pour les comportements problématiques des modèles, tels que les hypothèses de genre erronées et la gestion des menaces immédiates pour la sécurité physique.