Bài báo này nghiên cứu khả năng của Private GPT (GPT) trong việc tự động tạo mã kiểm thử thực thi từ các yêu cầu. Cụ thể, chúng tôi trình bày một phương pháp cho phép chủ sở hữu sản phẩm hoặc trí tuệ kinh doanh (BI) trực tiếp tạo ra các tiêu chí có thể kiểm thử bằng LLM, sử dụng các tiêu chí chấp nhận được chuẩn hóa như một phần của các sử thi hoặc câu chuyện thường được sử dụng trong các quy trình phát triển hiện đại. Chúng tôi đánh giá chất lượng của các bài kiểm thử được tạo ra bằng hai phương pháp: LLM tạo mã trực tiếp từ các yêu cầu và một bước trung gian sử dụng cú pháp Gherkin. Kết quả cho thấy quy trình hai bước mang lại kết quả tốt hơn về khả năng đọc hiểu của người dùng và các phương pháp lập trình tốt nhất (số dòng mã và việc sử dụng các thư viện bổ sung thường được sử dụng trong kiểm thử). Chúng tôi đánh giá cụ thể hiệu quả của các lời nhắc trong hai tình huống: chương trình "Hello World" và mô hình phân loại số, chứng minh rằng các lời nhắc có cấu trúc dẫn đến đầu ra kiểm thử chất lượng cao hơn.