Bài báo này trình bày "Bản đồ Chính sách", một phương pháp mới để thiết kế chính sách hiệu quả trên không gian hành vi rộng lớn của các mô hình ngôn ngữ quy mô lớn (LLM). Lấy cảm hứng từ bản đồ vật lý, phương pháp này tạo điều kiện cho việc khám phá hiệu quả thông qua các lựa chọn thiết kế có chủ đích về việc nên nắm bắt khía cạnh nào và nên trừu tượng hóa khía cạnh nào, thay vì cố gắng bao hàm tất cả các hành vi. "Máy chiếu Chính sách", một công cụ tương tác, cho phép người dùng khám phá bối cảnh của các cặp đầu vào-đầu ra LLM, xác định các vùng do người dùng xác định (ví dụ: "bạo lực") và khám phá các vùng này bằng các quy tắc chính sách có điều kiện có thể áp dụng cho đầu ra LLM (ví dụ: nếu đầu ra chứa "bạo lực" và "chi tiết đồ họa", hãy viết lại mà không có "chi tiết đồ họa"). Phương pháp này hỗ trợ khả năng phân loại và định hướng LLM, cũng như trực quan hóa bản đồ phản ánh công việc của các chuyên gia AI. Các đánh giá với 12 chuyên gia về an toàn AI đã chứng minh tính hiệu quả của phương pháp này trong việc xây dựng chính sách cho các hành vi mô hình có vấn đề, chẳng hạn như giả định giới tính không chính xác và xử lý các mối đe dọa an toàn thể chất tức thời.