Bài báo này đề xuất một khuôn khổ tạo dữ liệu mới, thúc đẩy tư duy khám phá để giải quyết vấn đề định kiến giới trong các mô hình ngôn ngữ quy mô lớn (LLM). Phương pháp này tạo ra các cặp kịch bản mơ hồ về mặt đạo đức có cấu trúc giống hệt nhau, với nhân vật chính là nam và nữ, so sánh các phán đoán đạo đức của họ và hướng dẫn mô hình đưa ra các phán đoán cân bằng, trung lập về giới khi phát sinh sự khác biệt. Các cặp câu chuyện-phán đoán này được sử dụng để tinh chỉnh hoặc tối ưu hóa mô hình bằng Tối ưu hóa Ưu tiên Trực tiếp (DPO). Kết quả thử nghiệm chứng minh rằng phương pháp được đề xuất làm giảm đáng kể định kiến giới trong khi vẫn duy trì hoặc cải thiện hiệu suất chung của mô hình. Mã nguồn và dữ liệu được tạo ra được công khai.