Bài báo này đề xuất SemiOVS, một khuôn khổ phân đoạn ngữ nghĩa dựa trên học bán giám sát, tận dụng dữ liệu có nhãn hạn chế và dữ liệu không có nhãn ngoài phân phối (OOD) dồi dào. Mặc dù các nghiên cứu trước đây đã cho thấy kết quả khả quan khi sử dụng phân đoạn hạn chế các tập dữ liệu chuẩn, tiềm năng tận dụng các hình ảnh không có nhãn quy mô lớn vẫn chưa được khám phá. SemiOVS sử dụng mô hình Phân đoạn Từ vựng Mở (OVS) để tạo nhãn giả có độ chính xác cao cho các hình ảnh OOD. Kết quả thử nghiệm trên các tập dữ liệu Pascal VOC và Context chứng minh rằng việc tận dụng thêm các hình ảnh không có nhãn trong môi trường có nhãn hạn chế giúp cải thiện hiệu suất, đặc biệt là khi tận dụng các hình ảnh OOD thông qua mô hình OVS. SemiOVS đạt được hiệu suất tiên tiến, vượt trội hơn các phương pháp hiện có là PrevMatch và SemiVL lần lượt là +3,5 mIoU và +3,0 mIoU.