Bài báo này khám phá ảnh hưởng của tính cách và bối cảnh lên hành vi của các mô hình ngôn ngữ quy mô lớn (LLM), được sử dụng như các tác nhân ra quyết định giống con người trong khoa học xã hội và các lĩnh vực ứng dụng. Cụ thể, chúng tôi đề xuất và xác thực một phương pháp để kiểm tra, định lượng và sửa đổi các biểu diễn nội tại của LLM bằng cách sử dụng Trò chơi Độc tài, một thí nghiệm hành vi kinh điển kiểm tra sự công bằng và hành vi ủng hộ xã hội. Chúng tôi chứng minh rằng việc trích xuất "các vectơ thay đổi biến" (ví dụ: từ "nam" sang "nữ") từ trạng thái nội tại của LLM và thao tác các vectơ này trong quá trình suy luận có thể thay đổi đáng kể cách các biến liên quan đến các quyết định của mô hình. Cách tiếp cận này cung cấp một phương pháp có nguyên tắc để nghiên cứu và điều chỉnh cách các khái niệm xã hội có thể được mã hóa và thiết kế trong các mô hình dựa trên Transformer, và trình bày Takeaways cho việc căn chỉnh, loại bỏ sai lệch và thiết kế các tác nhân AI cho mô phỏng xã hội trong các ứng dụng học thuật và thương mại. Điều này có thể góp phần nâng cao lý thuyết và phép đo xã hội học.