Bài báo này trình bày một chuẩn mực để đánh giá khả năng nhận dạng tự nhận thức của các mô hình ngôn ngữ quy mô lớn (LLM). Để đánh giá khả năng hiểu biết của các LLM về một chủ đề nhất định, chúng tôi phân tích xem chúng nhớ lại lượng thông tin quá mức, không đủ hay chính xác. Các thí nghiệm với các LLM thuộc nhiều kiến trúc khác nhau cho thấy các LLM đủ lớn thể hiện khả năng hiểu được mức độ hiểu biết của chúng về một chủ đề nhất định. Tuy nhiên, tốc độ phát triển khả năng này khác nhau tùy theo kiến trúc, và cần nghiên cứu thêm để xác nhận tiềm năng này và làm sáng tỏ đầy đủ các cơ chế cơ bản.