Bài báo này phân tích một cách có hệ thống các đặc điểm tính cách trong các mô hình ngôn ngữ quy mô lớn (LLM), đánh giá động lực biểu hiện đặc điểm qua các giai đoạn đào tạo, tính hợp lệ dự đoán của các đặc điểm tự báo cáo và tác động của các biện pháp can thiệp như truyền cá tính. Phát hiện của chúng tôi chứng minh rằng điều chỉnh hướng dẫn (ví dụ: RLHF) ổn định biểu hiện đặc điểm và củng cố các mối tương quan đặc điểm tương tự như dữ liệu của con người, nhưng các đặc điểm tự báo cáo không dự đoán hành vi một cách đáng tin cậy và các mối tương quan quan sát được thường không phù hợp với các mô hình của con người. Truyền cá tính định hướng thành công các báo cáo tự theo hướng mong muốn, nhưng có ít hoặc không nhất quán tác động đến hành vi thực tế. Do đó, bằng cách phân biệt giữa biểu hiện đặc điểm bề ngoài và tính nhất quán của hành vi, chúng tôi thách thức các giả định về tính cách trong LLM và nhấn mạnh nhu cầu đánh giá sâu hơn về sự phù hợp và khả năng diễn giải.