Trong bài báo này, chúng tôi khám phá cách tận dụng các mô hình sinh để giải quyết tình trạng thiếu dữ liệu chú thích trong quá trình đào tạo các mô hình phân đoạn hình ảnh y tế cho các phương thức hình ảnh y tế hiếm gặp nhưng quan trọng về mặt lâm sàng. Tập trung cụ thể vào MRI, vốn thiếu chú thích, chúng tôi trình bày ba đóng góp chính. Đầu tiên, chúng tôi giới thiệu MRGen-DB, một bộ dữ liệu văn bản hình ảnh X quang quy mô lớn với siêu dữ liệu phong phú bao gồm nhãn phương thức, thuộc tính, vùng và thông tin cơ quan, cùng một tập hợp con các chú thích mặt nạ từng pixel. Thứ hai, chúng tôi trình bày MRGen, một công cụ dữ liệu dựa trên khuếch tán dựa trên các lời nhắc văn bản và mặt nạ phân đoạn. MRGen tạo ra hình ảnh chân thực cho nhiều phương thức MRI không có chú thích mặt nạ, tạo điều kiện thuận lợi cho việc đào tạo phân đoạn ở những vùng thiếu nguồn. Thứ ba, chúng tôi chứng minh thông qua các thử nghiệm mở rộng trên nhiều phương thức rằng MRGen cải thiện đáng kể hiệu suất phân đoạn cho các phương thức không có chú thích bằng cách cung cấp dữ liệu tổng hợp chất lượng cao. Công trình này giải quyết một lỗ hổng quan trọng trong phân tích hình ảnh y tế bằng cách mở rộng khả năng phân đoạn sang các tình huống khó có được chú thích thủ công. Mã, mô hình và dữ liệu sẽ được công bố rộng rãi.