[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ĐáNh giá ảo giác cấp độ ba hợp nhất cho các mô hình ngôn ngữ thị giác lớn

Created by
  • Haebom

Tác giả

Junjie Wu, Tsz Ting Chung, Kai Chen, Dit-Yan Yeung

Phác thảo

Bài báo này đề cập đến vấn đề ảo giác trong các mô hình ngôn ngữ thị giác quy mô lớn (LVLM), đặc biệt là vấn đề ảo giác quan hệ. Không giống như các nghiên cứu trước đây chủ yếu tập trung vào ảo giác của bản thân các đối tượng, bài báo này trình bày một khuôn khổ thống nhất xem xét đồng thời cả đối tượng và quan hệ. Vì mục đích này, chúng tôi đề xuất một chuẩn mực mới, Tri-HE, để đánh giá ảo giác bằng cách sử dụng bộ ba (đối tượng, quan hệ, đối tượng). Kết quả thực nghiệm trên Tri-HE cho thấy ảo giác quan hệ là một vấn đề nghiêm trọng hơn ảo giác đối tượng, và chúng tôi trình bày một phương pháp đơn giản, không cần đào tạo, để giảm thiểu vấn đề này. Bộ dữ liệu và mã nguồn được công khai.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một chuẩn mực mới, Tri-HE, để đánh giá một cách có hệ thống các vấn đề về ảo giác quan hệ cũng như ảo giác đối tượng.
Thực nghiệm đã chứng minh rằng ảo giác quan hệ là vấn đề nghiêm trọng hơn ảo giác đối tượng.
Đề Xuất một phương pháp hiệu quả, không cần đào tạo để giảm bớt các vấn đề ảo giác trong mối quan hệ.
Đề Xuất các hướng nghiên cứu quan trọng để nâng cao độ tin cậy của LVLM.
Limitations:
Tiềm năng cải thiện hiệu suất của phương pháp không cần đào tạo được đề xuất có thể bị hạn chế.
Tiêu chuẩn Tri-HE có thể không bao quát toàn diện mọi loại ảo giác quan hệ.
Các mối quan hệ thị giác phức tạp và đa dạng hơn có thể cần phải đánh giá thêm về ảo giác.
👍