Mô hình nút thắt cổ chai khái niệm (CBM) được đề xuất để tăng độ tin cậy của các hệ thống AI bằng cách hạn chế các quyết định của chúng đối với một tập hợp các khái niệm mà con người có thể hiểu được. Tuy nhiên, CBM thường giả định rằng các tập dữ liệu chứa các nhãn khái niệm chính xác, một thực tế thường bị vi phạm, dẫn đến suy giảm hiệu suất đáng kể (lên đến 25% trong một số trường hợp). Trong bài báo này, chúng tôi đề xuất một hàm mất mát mới, mục tiêu Tối ưu hóa sở thích khái niệm (CPO), có hiệu quả giảm thiểu tác động tiêu cực của việc gắn nhãn sai khái niệm. Chúng tôi phân tích các đặc điểm chính của mục tiêu CPO và chứng minh rằng nó trực tiếp tối ưu hóa phân phối sau của các khái niệm. So với Entropy chéo nhị phân (BCE), chúng tôi chứng minh rằng CPO vốn ít nhạy cảm hơn với nhiễu khái niệm. Về mặt thực nghiệm, chúng tôi chứng minh rằng CPO luôn vượt trội hơn BCE trên ba tập dữ liệu thực tế, cả khi có và không có nhiễu nhãn bổ sung. Mã có sẵn trên GitHub.