Bài báo này trình bày một phương pháp mới để giảm thiểu sai lệch trong các mô hình ngôn ngữ quy mô lớn (LLM), áp dụng các vectơ lái để điều chỉnh kích hoạt mô hình trong quá trình lan truyền về phía trước. Các nhà nghiên cứu đã tính toán tám vectơ lái, mỗi vectơ tương ứng với các trục sai lệch xã hội khác nhau như tuổi, giới tính và chủng tộc, trên một tập con huấn luyện của tập dữ liệu BBQ và so sánh hiệu quả của chúng với ba phương pháp giảm thiểu sai lệch bổ sung trên bốn tập dữ liệu. Trên tập dữ liệu BBQ, các vectơ lái riêng lẻ được tối ưu hóa đạt được mức cải thiện trung bình là 12,8% trên BBQ, 8,3% trên CLEAR-Bias và 1% trên StereoSet, vượt trội hơn so với phương pháp nhắc nhở và Self-Debias trong mọi trường hợp và vượt trội hơn so với tinh chỉnh trong 12 trong số 17 lần đánh giá. Hơn nữa, các vectơ lái có tác động ít nhất đến điểm MMLU trong số bốn phương pháp giảm thiểu sai lệch đã được thử nghiệm. Nghiên cứu này trình bày cuộc điều tra có hệ thống đầu tiên về các vectơ lái để giảm thiểu sai lệch, cho thấy rằng các vectơ lái là một chiến lược mạnh mẽ và hiệu quả về mặt tính toán, đồng thời cung cấp những hàm ý rộng rãi để cải thiện tính an toàn của AI.