Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SMART-Editor: Một khuôn khổ đa tác nhân cho việc chỉnh sửa thiết kế giống con người với tính toàn vẹn về cấu trúc

Created by
  • Haebom

Tác giả

Ishani Mondal, Meera Bharadwaj, Ayush Roy, Aparna Garimella, Jordan Lee Boyd-Graber

Phác thảo

SMART-Editor là một khuôn khổ cho bố cục xây dựng và chỉnh sửa nội dung trong cả miền có cấu trúc (áp phích, trang web) và không có cấu trúc (hình ảnh tự nhiên). Không giống như các mô hình hiện có thực hiện chỉnh sửa cục bộ, SMART-Editor duy trì tính nhất quán toàn cục thông qua hai chiến lược: Reward-Refine, một phương pháp tinh chỉnh được hướng dẫn theo phần thưởng tại thời điểm suy luận và RewardDPO, một phương pháp tối ưu hóa sở thích tại thời điểm đào tạo sử dụng các cặp bố cục được căn chỉnh theo phần thưởng. Để đánh giá hiệu suất của mô hình, chúng tôi giới thiệu SMARTEdit-Bench, một chuẩn mực bao gồm các kịch bản chỉnh sửa đa miền, theo tầng. SMART-Editor vượt trội hơn các mô hình cơ sở mạnh như InstructPix2Pix và HIVE, với RewardDPO đạt được mức tăng hiệu suất lên tới 15% trong các thiết lập có cấu trúc và Reward-Refine thể hiện lợi thế của nó trên hình ảnh tự nhiên. Các đánh giá tự động và của con người xác nhận giá trị của các lược đồ dựa trên phần thưởng trong việc tạo ra các chỉnh sửa nhất quán về mặt ngữ nghĩa và căn chỉnh trực quan.

Takeaways, Limitations

_____T100336____:
Nó cung cấp một khuôn khổ hiệu quả cho việc bố trí mang tính xây dựng và chỉnh sửa nội dung ở cả khu vực có cấu trúc và không có cấu trúc.
Nó duy trì tính nhất quán toàn cầu và tạo ra kết quả chỉnh sửa chất lượng cao thông qua hai chiến lược: Reward-Refine và RewardDPO.
Chúng tôi cung cấp chuẩn mực mới, SMARTEdit-Bench, bao gồm các kịch bản chỉnh sửa đa miền, theo tầng.
Nó vượt trội hơn các mô hình hiện có và đặc biệt là RewardDPO cho thấy sự cải thiện hiệu suất đáng kể trong các thiết lập có cấu trúc.
Chúng tôi chứng minh bằng thực nghiệm tầm quan trọng của việc lập kế hoạch dựa trên phần thưởng.
Limitations:
Có thể cần nghiên cứu thêm về quy mô và tính đa dạng của SMARTEdit-Bench.
Hiệu suất có thể bị giới hạn đối với một số loại chỉnh sửa hoặc miền nhất định.
Có thể cần phân tích thêm để xác định sự tương tác và tối ưu hóa của Reward-Refine và RewardDPO.
Cần nghiên cứu thêm về hiệu suất tổng quát và tính mạnh mẽ của các loại chỉnh sửa khác nhau.
👍